Sunteți pe pagina 1din 75

Estatstica Indutiva para os cursos de

Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

ESTATSTICA INDUTIVA
MDULO 1 - REVISO
I. DISTRIBUIO NORMAL OU DE GAUSS
a mais importante distribuio de probabilidades, sendo aplicada em inmeros fenmenos e
utilizada para o desenvolvimento terico da Estatstica. tambm conhecida como distribuio de
Gauss, Laplace, Laplace-Gauss ou curva em sino (por lembrar o formato de um sino).
Os primeiros estudos ligados distribuio Normal foram feitos por De Moivre e, cem anos depois,
por Laplace, que consolidou as descobertas feitas at ento. Embora Gauss tenha nascido 23 anos
depois da morte de De Moivre, a distribuio e a curva normais acabaram recebendo o seu nome.
Seja X uma varivel aleatria contnua. X ter distribuio normal se:
1

x 2
1 .

. e 2 ,

< x < +
. 2
onde: = mdia de distribuio, = desvio-padro, = 3,1416, e = 2,7182
O grfico da distribuio normal a curva:
f(x) =

f(x)

50%

50%

Mo Md

Se uma varivel tem distribuio normal:


68,27% de seus valores cairo no intervalo de um desvio padro, ou seja, 1 < z < 1 ;
95,45% de seus valores cairo no intervalo de dois desvios padres, ou seja, 2 < z < 2 ;
99,73% de seus valores cairo no intervalo de trs desvios padres, ou seja, 3 < z < 3.

3 2 1

68,27%
95,45%
99,73%

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Principais caractersticas dessa funo:


a) a varivel aleatria pode assumir qualquer valor real;
b) o grfico da distribuio normal uma curva em forma de sino, simtrica em torno da
mdia , que tambm a moda e a mediana, como mostra a figura acima;
c) a rea total sob a curva vale 1 (100%), porque essa rea corresponde probabilidade de a
varivel aleatria assumir qualquer valor real;
d) como a curva simtrica em torno da mdia, os valores maiores do que a mdia e os valores
menores do que a mdia ocorrem com igual probabilidade;
e) decrescente assintoticamente a zero nos extremos;
f) a configurao da curva dada por dois parmetros: a mdia e a varincia 2. Mudando a
mdia, muda a posio da distribuio; Mudando a varincia, muda a disperso da distribuio;
g) e + so pontos de inflexo.
A determinao da probabilidade de se obter um valor em um dado intervalo poderia ser feita pela
integral definida nesse intervalo, no entanto, o uso de tabelas facilita esse clculo. Usaremos a tabela
1 de Faixa central, em anexop.3, que utiliza valores padronizados de uma varivel z, em funo de x,
x
obtida pela transformao linear zo =
. Essa varivel chamada normal reduzida ou normal

padronizada tambm normalmente distribuda com (z) = 0 e (z) = 1. A varivel z representa a


distncia algbrica entre o ponto x desejado e a mdia , medida em desvios padres. Assim, obtido
um valor zo correspondente a um valor xo considerado, teremos:
P( x xo) = P(0 Z zo)
A tabela de faixa central d a rea sob a curva normal padro entre z = 0 e qualquer valor positivo
de zo mas, sendo a curva simtrica em relao mdia, em torno de z = 0, os valores fornecidos so
vlidos tambm para valores negativos de zo. O sinal da varivel Z serve apenas para indicar se o
valor est acima ou abaixo da mdia.
Portanto, P(0 Z zo) = P(zo Z 0)

zo

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Tabela 1. reas de uma distribuio normal padro.


Cada casa na tabela d a proporo sob a curva
inteira entre z = 0 e um valor positivo de z. As
reas para os valores de z negativos so obtidas
por simetria.
P(0 Z zo)

zo

zo

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.0
0.1
0.2
0.3
0.4

0.0000
0.0398
0.0793
0.1179
0.1554

0.0040
0.0438
0.0832
0.1217
0.1591

0.0080
0.0478
0.0871
0.1255
0.1628

0.0120
0.0517
0.0910
0.1293
0.1664

0.0160
0.0557
0.0948
0.1331
0.1700

0.0199
0.0596
0.0987
0.1368
0.1736

0.0239
0.0636
0.1026
0.1406
0.1772

0.0279
0.0675
0.1064
0.1443
0.1808

0.0319
0.0714
0.1103
0.1480
0.1844

0.0359
0.0753
0.1141
0.1517
0.1879

0.5
0.6
0.7
0.8
0.9

0.1915
0.2257
0.2580
0.2881
0.3159

0.1950
0.2291
0.2612
0.2910
0.3186

0.1985
0.2324
0.2642
0.2939
0.3212

0.2019
0.2357
0.2673
0.2967
0.3238

0.2054
0.2389
0.2704
0.2995
0.3264

0.2088
0.2422
0.2734
0.3023
0.3289

0.2123
0.2454
0.2764
0.3051
0.3315

0.2157
0.2486
0.2794
0.3078
0.3340

0.2190
0.2518
0.2823
0.3106
0.3365

0.2224
0.2549
0.2852
0.3133
0.3389

1.0
1.1
1.2
1.3
1.4

0.3413
0.3643
0.3849
0.4032
0.4192

0.3438
0.3665
0.3869
0.4049
0.4207

0.3461
0.3686
0.3888
0.4066
0.4222

0.3485
0.3708
0.3907
0.4082
0.4236

0.3508
0.3729
0.3925
0.4099
0.4251

0.3531
0.3749
0.3944
0.4115
0.4265

0.3554
0.3770
0.3962
0.4131
0.4279

0.3577
0.3790
0.3980
0.4147
0.4292

0.3599
0.3810
0.3997
0.4162
0.4306

0.3621
0.3830
0.4015
0.4177
0.4319

1.5
1.6
1.7
1.8
1.9

0.4332
0.4452
0.4554
0.4641
0.4713

0.4345
0.4463
0.4564
0.4649
0.4719

0.4357
0.4474
0.4573
0.4656
0.4726

0.4370
0.4484
0.4582
0.4664
0.4732

0.4382
0.4495
0.4591
0.4671
0.4738

0.4394
0.4505
0.4599
0.4678
0.4744

0.4406
0.4515
0.4608
0.4686
0.4750

0.4418
0.4525
0.4616
0.4693
0.4756

0.4429
0.4535
0.4625
0.4699
0.4761

0.4441
0.4545
0.4633
0.4706
0.4767

2.0
2.1
2.2
2.3
2.4

0.4772
0.4821
0.4861
0.4893
0.4918

0.4778
0.4826
0.4864
0.4896
0.4920

0.4783
0.4830
0.4868
0.4898
0.4922

0.4788
0.4834
0.4871
0.4901
0.4925

0.4793
0.4838
0.4875
0.4904
0.4927

0.4798
0.4842
0.4878
0.4906
0.4929

0.4803
0.4846
0.4881
0.4909
0.4931

0.4880
0.4850
0.4884
0.4911
0.4932

0.4812
0.4854
0.4887
0.4913
0.4934

0.4817
0.4857
0.4890
0.4916
0.4936

2.5
2.6
2.7
2.8
2.9

0.4938
0.4953
0.4965
0.4974
0.4981

0.4940
0.4955
0.4966
0.4975
0.4982

04941
0.4956
0.4967
0.4976
0.4982

0.4943
0.4957
0.4968
0.4977
0.4983

0.4945
0.4959
0.4969
0.4977
0.4984

0.4946
0.4960
0.4970
0.4978
0.4984

0.4948
0.4961
0.4971
0.4979
0.4985

0.4949
0.4962
0.4972
0.4979
0.4985

0.4951
0.4963
0.4973
0.4980
0.4986

0.4952
0.4964
0.4974
0.4981
0.4986

3.0
3.1
3.2
3.3
3.4

0.4986
0.4990
0.4993
0.4995
0.4997

0.4987
0.4991
0.4993
0.4995
0.4997

0.4987
0.4991
0.4994
0.4995
0.4997

0.4988
0.4991
0.4994
0.4996
0.4997

0.4988
0.4992
0.4994
0.4996
0.4997

0.4989
0.4992
0.4994
0.4996
0.4997

0.4989
0.4992
0.4994
0.4996
0.4997

0.4989
0.4992
0.4995
0.4996
0.4997

0.4990
0.4993
0.4995
0.4996
0.4998

0.4990
0.4993
0.4995
0.4997
0.4998

3.5
3.6
3.7
3.8
3.9

0.4998
0.4998
0.4999
0.4999
0.5000

0.4998
0.4998
0.4999
0.4999
0.5000

0.4998
0.4999
0.4999
0.4999
0.5000

0.4998
0.4999
0.4999
0.4999
0.5000

0.4998
0.4999
0.4999
0.4999
0.5000

0.4998
0.4999
0.4999
0.4999
0.5000

0.4998
0.4999
0.4999
0.4999
0.5000

0.4998
0.4999
0.4999
0.5000
0.5000

0.4998
0.4999
0.4999
0.5000
0.5000

0.4998
0.4999
0.4999
0.5000
0.5000

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Para consultar a tabela, preciso decompor o Zo em duas parcelas:


Parte inteira + 1 casa decimal e 0,0 + 2 casa decimal
1 PARCELA

2 PARCELA

1 parcela = 1,3 (vertical margem esquerda)


Se Zo = 1,39
2 parcela = 0,09 (horizontal margem superior)
Zo

0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

1,3

0,4177

No cruzamento das duas parcelas encontra-se a probabilidade correspondente rea da


curva entre zero e zo calculado (tambm chamado crtico).
A probabilidade que a tabela fornece (0,4177)
corresponde rea hachurada.
0 1,39

Exemplo 1:
O tempo necessrio para executar uma tarefa uma varivel normal de mdia 60 minutos e
desvio padro 5 minutos. Qual a proporo de vezes que o tempo necessrio ser:
a) maior que 70 minutos?
b) menor que 65 minutos?
50%
c) exatamente 40 minutos?
d) maior que 53 e menor que 62 minutos?
Soluo:
Temos: = 60 e = 5
x 60
x
Pela transformao linear z =
=
60
70
X

5
70 60
0,4772
a) x = 70
zo =
= 2,00
5
Da tabela obtemos: 0,4772
Z

P(X > 70) = 0,5 0,4772 = 0,0228 = 2,28%

Z=2,00

50%

50%

65 60
= 1,00
5
Da tabela obtemos: 0,3413

b) x = 65

zo =

P(X < 65) = 0,5 + 0,3413 = 0,8413 = 84,13%

60

65

X
0,3413

50%

Z
0 Z=1,00

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

c) Como em qualquer tipo de varivel aleatria contnua, a probabilidade da varivel tomar


exatamente um determinado valor zero, conclumos que:
P(X = 40) = 0
53 60
= 1,40
5
Da tabela obtemos: 0,4192
62 60
x = 62
zo =
= 0,40
5
Da tabela obtemos: 0,1554

d) x = 53

z=

53 60 62
0,4192

X
0,1554

Z
Z=1,40 0 Z=0,40

P(53<X<62) = 0,4192 + 0,1554 = 0,5746 = 57,46%

Exemplo 2:
As alturas dos alunos de determinada escola so normalmente distribudas com mdia
1,60 m desvio-padro 0,30 m. Encontre a probabilidade de um aluno medir:
a) Entre 1,50 e 1,80 m?
b) Mais de 1,75 m?
c) Menos de 1,48 m?
d) Qual deve ser a medida mnima para escolhermos 10% dos mais altos?

Temos: = 1,60 e = 0,30

z=

x
x 1,60
=

0,30

1,50 1,60
z1 = 0,33
0,30
1,80 1,60
x2 = 1,80
z2=
z2 = 0,67
0,30
P(1,50 < x < 1,80) = P(0,33 < Z < 0,67)

a) x1 = 1,50

z1 =

Tab. : 0,1293
Tab.: 0,2486

OBS.: Por simetria, obtemos da tabela z = 0,33 = 0,33


0,1293

1,50 1,60 1,80

0,33

0,2486

0,67

Portanto: P(0,33 < Z < 0,67) = 0,1293 + 0,2486 = 0,3779 = 37,79%


Logo: P(1,50 < x < 1,80) = 37,79%
1,75 1,60
0,30
P(x > 1,75) = P(z > 0,5)

b) x = 1,75

z1 =

z1 = 0,5

Tab. : 0,1915

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

50%

0,5
0,1915

1,60 1,75

0,5

P(x > 1,75) = P(z > 0,5) = 0,5000 0,1915 = 0,3085 = 30,85%
1,48 1,60
0,30
P(x < 1,48) = P(z < 0,4)

c) x = 1,48

z1 =

z1 = 0,4

50%

Tab. : 0,1554

0,5
0,1554

1,48 1,60

0,4 0

P(x < 1,48) = P(z < 0,4) = 0,5000 0,1554 = 0,3446 = 34,46%
d) A operao inversa aos itens (a), (b) e (c), ou seja, dada a probabilidade, determine a
medida.
Na tabela com
P(z) = 0,4000,
encontramos
Z0 = 1,28

0,4 = 40%
0,1 = 10%

z=

Zo

1,60 X

1,28 =

x 1,60
0,30

x = 1,98 m

MDULO 2
ESTATSTICA INDUTIVA: INTRODUO E AMOSTRAGEM
INTRODUO: a parte da Estatstica que, baseando-se em resultados obtidos da anlise
de uma amostra da populao, procura concluir, sugerir ou estimar as leis de comportamento da
populao da qual a amostra foi retirada.
Os objetivos principais da Estatstica Indutiva so: tirar concluses sobre populaes atravs
de amostras extradas dessa populao, induzindo ou caracterizando uma populao atravs de
amostra e ainda dizer qual a probabilidade de erro, j que o processo de induo no exato.
Tambm atravs da Estatstica Indutiva podemos aceitar ou rejeitar hipteses que podem surgir sobre
6

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

as caractersticas da populao, a partir tambm da anlise da amostra representativa dessa


populao.
Como observao: quanto maior for a amostra, mais precisas e confiveis devero ser as
indues realizadas na populao.

AMOSTRAGEM
Voc no precisa beber todo o vinho
para saber que gosto ele tem!.

1. Introduo

A teoria da amostragem um estudo das relaes existentes entre uma populao e as


amostras dela extradas.
Portanto fundamental que a amostra seja representativa da populao, isto , deve possuir
as mesmas caractersticas bsicas da populao no que diz respeito s variveis pesquisadas para
que possamos fazer inferncias (concluses ou indues) acerca da populao.
Em geral, um estudo de inferncias, feito a respeito de uma populao, mediante a utilizao
de amostras dela extradas, juntamente com as indicaes da preciso dessas inferncias, obtidas
por meio da teoria da probabilidade denominada inferncia estatstica.
Dependendo do tipo de varivel a ser estudada, podemos encontrar maior e menor dificuldade
para realizar a amostragem. As maiores dificuldades so obtidas nas pesquisas scio-econmicas ou
de opinio, onde preciso deixar muito bem caracterizado a populao e o processo de amostragem
da mesma. Se a pesquisa elaborada por questionrios, deve-se ter o cuidado de no apresentar
perguntas inibidoras ou dbias.
2. Tipos de Amostragem
2.1) Amostragem Probabilstica

Uma amostragem ser probabilstica se todos os elementos da populao tiverem


probabilidade conhecida, e diferente de zero, de pertencer amostra. Desta forma, a amostragem
probabilstica implica em um sorteio sobre todos os elementos da populao com regras bem
determinadas, cuja realizao s ser possvel se a populao for finita e totalmente acessvel.
Principais tcnicas de amostragem probabilsticas:
1) Amostragem aleatria simples ou casual ou ao acaso ou elementar ou randmica.

Este tipo de amostragem equivalente a um sorteio lotrico. A amostragem Aleatria


Simples constituda de elementos retirados ao acaso da populao, tendo cada um, igual
probabilidade de pertencer amostra e todas as possveis amostras tm tambm igual probabilidade
de ocorrer. Por isso que a esse tipo de amostragem tende a produzir amostras representativas.
Exemplo: Supondo que um clube tenha 650 scios e deseja-se fazer uma amostra casual
simples de 2% dos scios desse clube, ou seja, 13 scios. Para isso, faremos os seguintes passos:

I. Numeramos os scios de 001 a 650;

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

II. Escrevemos os nmeros de 001 a 650, em pedaos iguais de um mesmo papel e


colocamos os mesmos dentro de uma caixa (uma urna). Agite sempre a caixa para misturar bem os
pedaos de papel e retire, um a um 13 nmeros que formaro a amostra.
Uma segunda opo para o sorteio seria:
Coloque em uma urna, bolas numeradas de zero a nove, inclusive, misture bem e retire
uma. Anote o nmero dessa bola que ser o primeiro dgito do nmero do scio que ser amostrado.
Volte a bola retirada urna, misture bem e retire outra. O nmero dessa segunda bola ser o segundo
dgito do nmero do scio que ser amostrado. O procedimento dever ser repetido at completar os
trs dgitos da numerao utilizada. Como a populao constituda por 650 scios, devem ser
desprezados os nmeros maiores que 650, bem como os nmeros que j foram sorteados e o
nmero 000. O sorteio dever ser repetido at se conseguir a amostra de 13 scios.
O processo de seleo exige que se atribuam nmeros consecutivos aos itens listados
escolhendo-se depois, aleatoriamente, os nmeros dos itens que comporo a amostra.
Conceitualmente, podemos usar cartas de baralho, dados, fichas numeradas ou bolas numeradas
para gerar nmeros aleatrios correspondentes aos nmeros de nossa listagem.
Na prtica, tais dispositivos so empregados raramente, por vrias razes. Uma delas que
cada dispositivo deixa algo a desejar; os mtodos no so perfeitamente aleatrios. As cartas, por
exemplo, podem aderir umas s outras, impedindo um embaralhamento perfeito. As arestas de um
dado podem estar desgastadas. E sempre h o risco de que as bolas de uma urna no terem sido
convenientemente misturadas. Em vista disso, e porque a amostragem aleatria vital para a
inferncia estatstica, existem tabelas especialmente elaboradas, chamadas tabelas de nmeros
aleatrios, construdas de modo que os dez algarismos (0 a 9) so distribudos ao acaso nas linhas e
colunas atravs de sorteio equiprovvel.
Na tabela de nmeros aleatrios os dez algarismos 0, 1, 2, ..., 7, 8 , 9, podem ser lidos
isoladamente ou em grupos; podem ser lidos em qualquer ordem, como por exemplo linhas ou
colunas, num sentido ou no outro, diagonalmente, etc. e podem ser considerados aleatrios. A opo
de leitura, porm, deve ser feito antes de iniciado o processo. Para usar uma tabela de nmeros
aleatrios devemos:
1) Fazer uma lista dos nmeros da populao;
2) Enumerar consecutivamente os itens da lista, a comear do zero;
3) Ler os nmeros na tabela de nmeros aleatrios de modo que o nmero de algarismos em
cada um seja igual ao nmero de algarismos do ltimo nmero da sua listagem;
4) Desprezar quaisquer nmeros que no correspondam a nmeros da lista ou que sejam
repeties de nmeros lidos anteriormente. Continue o processo at ter o nmero desejado
de observaes;
5) Usar os nmeros assim escolhidos para identificar os itens da lista a serem includos na
amostra.
NOTA: O inconveniente desse processo a exigncia da enumerao de todos os elementos
da populao e sua identificao posterior, quando escolhidos para compor a amostra.

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

EXEMPLO DE UMA TABELA DE NMEROS ALEATRIOS (retirada de: STEVENSON, William J.


Estatstica aplicada administrao, So Paulo: Harbra, 1981)
3690
0813
6477
0772
5692

2492
6790
5289
2160
9870

7171
6858
4092
8236
3583

7720
1489
4223
0812
8997

6509
2669
6454
4195
1533

7549
3743
7632
5589
6566

2330
1901
7577
0830
8830

5733
4971
2816
8261
7271

4730
8280
9202
9232
3809

2080
1039
7227
8506
5086

3828
3382
0104
6348
0303

7880
7600
4141
4612
7423

0586
1077
1521
8252
3298

8482
4455
9104
1062
3979

7811
8806
5563
1757
2831

6807
1822
1392
0964
2257

3309
1669
8238
2983
1508

2729
7501
4882
2244
7642

0092
0935
2605
7277
5484

1629
5565
3973
9889
3900

0377
2315
8204
0390
3485

3590
8030
4143
5579
0741

2209
7651
2677
4620
9069

4839
5189
0034
5650
5920

6332
0075
8601
0210
4326

1490
9353
3340
2082
7704

3092
1921
8383
4664
6525

6905
8387
4094
4951
9047

7127
5323
1957
3781
0199

5933
3753
0163
5101
5068

1137
1859
9717
1815
7447

7583
6043
4118
7068
1664

6450
0294
4276
6379
9278

5658
5110
9465
7252
1708

7678
6340
8820
1086
3625

3444
9137
4127
8919
2864

7274
9192
0554
8231
3995

9512
4011
1690
5627
9677

0074
0255
6333
1815
7765

6677
5458
1931
7171
3194

8676
6942
9433
8036
3222

0222
8043
2661
1832
4191

3335
6201
8690
2031
2734

1976
1587
2313
6298
4469

1645
0972
6999
6073
8617

2402
5295
5177
7315
5775

6250
7385
1191
3365
7517

9362
5474
2106
7203
8974

7373
2123
3351
1231
3961

4757
7035
5057
0546
2183

1716
9983
0967
6612
5295

1942
5192
4538
1038
3096

0417
1840
1246
1425
8536

5921
6176
3374
2709
9442

5500
3251
4675
3543
3521

2276
8902
1435
6130
8772

6307
8843
2192
4247
6612

2346
2112
0874
4859
0721

1285
8567
2897
2660
3899

7000
8131
0262
7852
2999

5306
8116
5092
9096
1263

0414
5270
5541
0578
7017

3383
5994
4014
0097
8057

5573
7478
3339
5505
6381

9396
7569
2854
8474
2086

3464
7551
9691
3167
5457

1706
3380
9562
8552
7703

9204
2152
3252
5409
2758

3389
5411
9848
1556
2963

5678
2647
6030
4247
8167

2589
7242
8472
4652
6712

0288
2800
2266
2953
9820
9

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

O uso da tabela pode ser entendido atravs do seguinte exemplo: De uma populao
constituda por 650 elementos queremos retirar uma amostra aleatria de 50. O primeiro passo
enumerar a populao de 001 a 650. A partir de um dgito escolhido ao acaso na tabela de nmeros
aleatrios vamos tomando os nmeros, sempre com 3 algarismos (pois a populao constituda por
650 elementos), at completarmos os 50 elementos necessrios para a amostra desejada.
Suponhamos que os algarismos da tabela a partir do dgito escolhido sejam: 369024927171772065...,
(percorrer a primeira linha da tabela da esquerda para a direita), os elementos sorteados para a
amostra sero os de ordem 369, 024, 171, 065, etc. Os grupos 927 e 772 no foram considerados
pois no constam da populao. Ento, so desprezados os nmeros ou grupos que so maiores do
que 650 e eventuais repeties, exceto se a amostragem seja com reposio.
2) Amostragem Sistemtica

Quando os elementos da populao j se acham ordenados, no h necessidade de construir


um sistema de referncia. Por este processo, as amostras so retiradas periodicamente a partir de
determinado elemento ou ponto de partida (por exemplo: de hora em hora). So exemplos os
pronturios mdicos de um Hospital, as linhas de produo, etc. Deve ser adotado com cuidado, pois
pode conduzir a amostras enviesadas que no detectam eventos peridicos e cclicos. Apesar de
seus inconvenientes, um mtodo bastante usado em pesquisas de opinio pblica, onde
transeuntes so entrevistados de hora em hora ou aps certa contagem.
A seleo dos elementos que constituiro a amostra pode ser feita por um sistema imposto
pelo pesquisador.
Exemplo: Suponhamos uma populao ordenada constituda por 650 elementos, da qual
desejamos retirar uma amostra sistemtica de 50 elementos.
Podemos dividir o tamanho da populao (N = 650) pelo tamanho da amostra (n = 50). O
nmero obtido vai servir de base para efetuamos a amostragem.
650
= 13
50
O primeiro elemento da populao a fazer parte da amostra dever ser escolhido ao acaso
entre os 13 primeiros. A partir do elemento escolhido a cada 13 retira-se outro. Assim, se o primeiro
escolhido fosse o 10, o seguinte seria o 23, o outro seria o 36 e assim por diante.
A amostragem sistemtica bastante usada pela sua simples execuo. Em linhas de
produo sua utilizao muito grande. Existe apenas um risco na sua utilizao que , por exemplo,
a possibilidade de existir um defeito cclico numa linha de produo e esse ciclo coincidir com o ciclo
adotado na amostragem.
3) Amostragem por meio de conglomerados

Consiste em subdividir a populao que vai ser estudada em pequenos grupos (chamados de
conglomerados) fisicamente prximos, independentemente de eles serem homogneos ou no.
Nesses grupos, so agregados os elementos com estreito contato fsico (como casas, quarteires,
bairros, cidades, etc.).
Ao invs de numerarmos os elementos da populao para fazermos uma amostragem
aleatria, numeramos os conglomerados e sorteamos alguns deles para constiturem a amostra. Na
realidade apenas uma maneira de simplificar o trabalho.
A principal razo desse tipo de ajuntamento que muitos elementos podem ser estudados por
poucos pesquisadores.
10

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

4) Amostragem estratificada

Muitas vezes a populao se divide em grupos (ou sub-populaes) chamados estratos


baseados em caractersticas associadas a cada elemento. Dentro de cada estrato os elementos so
razoavelmente homogneos mas diferentes de um estrato para outro. o caso dos agrupamentos por
sexo, raa, religio, escolaridade, etc. Ao fazermos a amostragem, se no levarmos em conta a
existncia dos estratos, poder ocorrer que um ou mais fiquem sem representao na amostra,
principalmente se esta for pequena. Portanto, a amostragem estratificada consiste em determinar
quantos elementos da amostra sero retirados de cada estrato. So mais considerados dois tipos de
amostragem estratificada: a uniforme e a proporcional. Na amostragem estratificada uniforme retira-se
igual nmero de elementos de cada estrato e na amostragem estratificada proporcional, o nmero de
elementos retirados de cada estrato proporcional ao tamanho do estrato.
A vantagem desse mtodo com relao ao mtodo da amostra aleatria simples (sem
estratificao) o de obter estimativas com maior preciso, com mesmo tamanho amostral.
Exemplo: Seja obter uma amostra estratifica proporcional de 10% para a pesquisa da estatura
de 100 alunos de uma escola onde 58 so meninos e 42 so meninas.
Temos dois estratos: sexo masculino e sexo feminino.
I) Primeiro vamos determinar o tamanho da amostra em cada estrato:

Sexo
Masculino
Feminina
Total

Populao
58
42
100

10%
0,10 . 58 = 5,8
0,10 . 42 = 4,2
0,10 . 100 = 10

Amostra
6
4
10

II) Numeramos os alunos de 001 a 100, sendo que de 001 a 058 correspondem meninos e de
059 a 100 meninas.
II) Obtemos uma amostra aleatria ou sistemtica de cada sexo e reunimos as informaes
numa s amostra, denominada amostra estratificada.
5) Amostragem mltipla

A amostra constituda pela retirada dos elementos da populao em etapas sucessivas,


sendo que a realizao ou no de uma etapa depende do resultado da etapa anterior.
A principal vantagem da amostragem mltipla a diminuio do nmero de elementos
inspecionados.
2.2) Amostragem No Probabilstica

Quando nem todos os elementos da populao tiverem uma probabilidade diferente de zero de
pertencerem amostra, dizemos que a amostragem no-probabilstica.
Este processo de amostragem subjetivo e seu regimento depende do conhecimento que o
pesquisador possui a respeito da estrutura da populao. empregada, muitas vezes, por
simplicidade ou pela impossibilidade de se obter amostragens probabilsticas.
Para a Estatstica Indutiva interessa a amostragem probabilstica, pois assim, o acaso ser o
nico responsvel por eventuais diferenas entre a populao e a amostra. No entanto, muitas vezes
11

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

no poderemos conseguir amostras probabilsticas e nesses casos o bom senso nos indicar como
proceder para que os resultados possam ser considerados e trabalhados.
Principais casos de amostragem no probabilstica:
1) Amostragem por Julgamento (ou inacessibilidade a toda a populao)

A amostra obtida na parte da populao que conhecida (ou acessvel). Ento se faz uma
distino entre populao amostrada e populao objeto.
Populao amostrada a parte da populao que acessvel e da qual retirada a amostra;
Populao objeto aquela sobre a qual pretendemos realizar o trabalho estatstico (de toda a
populao).
Se as caractersticas das variveis de interesse so as mesmas na populao amostrada e na
populao objeto, a amostragem ser equivalente a uma amostragem probabilstica. Isso muito
comum quando conclumos sobre a qualidade de um produto pelas unidades que j foram produzidas
e estendemos essa concluso para as unidades que ainda sero produzidas. Se as condies de
produo permanecerem as mesmas a concluso ser vlida.
Se o tamanho da amostra bem pequeno, a amostragem aleatria poder ser norepresentativa, ao passo que uma pessoa familiarizada com a populao pode especificar quais os
itens mais representativos da populao.
Exemplo: Uma rede de pizzarias pode querer experimentar uma nova tcnica de servio,
empregando bandejas com aquecimento. Problemas de custo podem fazer com que a experincia se
limite a duas lojas, as quais podem diferir consideravelmente em termos de tamanho, localizao,
clientela e lucratividade. Ao invs de uma seleo aleatria das duas lojas a serem usadas como
teste, ser melhor confiar no conhecimento da administrao para fazer tal escolha.
2) Amostragem a esmo ou sem norma

o caso em que o pesquisador procura ser aleatrio, sem, no entanto, utilizar um sorteio
aleatrio rigoroso.
Exemplo: Se tivermos numa caixa 15.000 parafusos e desejamos retirar uma amostra contendo
150 parafusos do mesmo modelo e tamanho, certamente no faramos uma amostragem aleatria
simples, pois seria extremamente trabalhosa, mas faramos retiradas a esmo.

Os resultados de uma amostragem a esmo so os mesmos de uma amostragem probabilstica


se a populao homognea e se no existe a possibilidade de o pesquisador (ou amostrador) ser
influenciado (mesmo que inconscientemente) por alguma caracterstica dos elementos da populao.
No seria o caso da amostra dos parafusos, acima, se estes tivessem modelos e tamanhos
diferentes, e isto afetasse a caracterstica observada nos parafusos.
3) Populao formada por material contnuo

Quando a populao for lquida ou gasosa o procedimento no probabilstico homogeneizar a


mistura e retirar uma amostra a esmo. Se a populao for constituda por material slido o processo
no probabilstico o da enquartao. O processo da enquartao consiste em dividir a populao
em diversas partes e sortear algumas para constiturem a amostra.
12

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

4) Amostragem Intencional

De acordo com determinado critrio, escolhido intencionalmente um grupo de elementos que


iro compor a amostra por ach-los representativos da populao. O investigador se dirige
intencionalmente a grupos de elementos dos quais deseja saber a opinio.
Exemplo: Numa pesquisa sobre preferncia por determinado cosmtico, o pesquisador se
dirige a um grande salo de beleza e entrevista as pessoas que ali se encontram.

O grande risco desse procedimento que fica sujeito ao julgamento de uma ou mais pessoas.
5) Amostragem por voluntrios

A amostra constituda por elementos da populao que concordam em ser voluntrio


principalmente em experincias com novos medicamentos.
Exerccios

1) Os pronturios dos pacientes de um hospital esto organizados em um arquivo, por ordem


alfabtica. Qual a maneira mais rpida de amostrar 1/3 do total de pronturios?
2) Um pesquisador tem dez gaiolas que contm, cada uma seis periquitos. Como o pesquisador
pode selecionar dez periquitos para uma amostra?
3) Para levantar dados sobre o nmero de filhos por casal, em uma comunidade, um pesquisador
organizou um questionrio que enviou, pelo correio, a todas as residncias. A resposta ao
questionrio era facultativa, pois o pesquisador no tinha condies de exigir a resposta. Nesse
questionrio pergunta-se o nmero de filhos por casal morador na residncia. Voc acha que
os dados assim obtidos tm algum tipo de tendenciosidade?
4) Um pesquisador pretende levantar dados sobre o nmero de moradores por domiclio, usando
a tcnica de amostragem sistemtica. Para isso, o pesquisador visitar cada domiclio
selecionado. Se nenhuma pessoa estiver presente na ocasio da visita, o pesquisador excluir
o domiclio da amostra. Esta ltima determinao introduz tendenciosidade. Por qu?
5) Muitas pessoas acreditam que as famlias se tornaram menores. Suponha que, para estudar
essa questo, foi selecionada uma amostra de 2000 casais e perguntou-se quantos filhos eles
tinham, quantos filhos tinham seus pais e quantos filhos tinham seus avs. O procedimento
introduz tendenciosidade nos dados. Por qu?
6) Supondo que os dados abaixo sejam os dimetros, medidos em mm, de 15 peas recebidas
por uma empresa. Tome uma amostra de 5 elementos utilizando a tabela de nmeros
aleatrios a partir do 31 dgito da 5 linha. Calcule a mdia, a varincia e o desvio padro das
medidas dos dimetros das peas da amostra.
11
18
17

15
14
23

16
12
13

10
12
22

20
19
17
13

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

NOTA: Para resolver as questes de 6 a 10, utilizar a tabela aleatria abaixo:


25 19 64 82 84
23 02 41 46 04
55 85 66 96 28
68 45 19 69 59
69 31 46 29 85

Tabela de nmeros aleatrios


62 74 29 92 24 61 03 91 22 48 64 94 63 15 07
44 31 52 43 07 44 06 03 09 34 19 83 94 62 94
28 30 62 58 83 65 68 62 42 45 13 08 60 46 28
35 14 82 56 80 22 06 52 26 39 59 78 98 76 14
18 88 26 95 54 01 02 14 03 05 48 00 26 43 85

66 85 12 00 27
48 28 01 51 92
95 68 45 52 43
36 09 03 01 86
33 93 81 45 95

37 31 61 28 98
66 42 19 24 94
33 65 78 12 35
76 32 06 19 35
43 33 42 02 59

94 61 47 03 10
13 13 38 69 96
91 59 11 38 44
22 95 30 19 29
20 39 84 95 61

67 80 84 41 26
76 69 76 24 13
23 31 48 75 74
57 74 43 20 90
58 22 04 02 99

88 84 59 69 14
43 83 10 13 24
05 30 08 46 32
20 25 36 70 69
99 78 78 83 82

77 32 82 81 89
18 32 84 85 04
90 04 93 56 16
38 32 11 01 01
43 67 16 38 95

28 31 93 43 94
97 19 21 63 34
82 80 37 14 20
03 68 03 13 60
65 16 58 11 01

87 73 19 38 47
69 33 17 03 02
56 39 59 89 63
64 13 90 37 11
98 78 80 63 23

54 36 90 98 10
11 15 50 46 08
33 90 38 44 50
86 02 57 41 99
07 37 66 20 56

83 43 32 26 26
42 69 60 17 42
78 22 87 10 88
31 66 60 65 64
20 96 06 79 80

22 00 90 59 22
14 68 61 14 48
06 58 87 39 67
03 03 02 58 97
33 39 40 49 42

24 65 58 57 04
02 72 64 07 75
79 16 78 63 99
04 75 14 93 39
40 64 64 57 60

18 62 85 28 24
85 66 48 38 73
43 61 00 66 42
68 52 16 83 34
97 00 12 91 33

26 45 17 82 76
75 10 96 59 31
76 26 71 14 33
64 09 44 62 58
22 14 73 01 11

39 65 01 73 91
48 78 58 08 88
33 86 76 71 66
48 32 72 26 95
83 97 68 95 65

50 37 49 38 73
72 08 54 57 17
37 85 05 56 07
32 67 35 49 71
67 77 80 98 87

7) Resolva o exerccio anterior tomando uma amostra de 6 elementos, utilizando a tabela de


nmeros aleatrios a partir da interseco da vigsima segunda coluna com a oitava linha.
8) Uma indstria recebeu determinado tipo de pea de dois fornecedores, sendo 30 peas do
fornecedor A e 20 do B. Sabe-se que o aspecto a ser analisado o peso. As peas foram
numeradas ao darem entrada no almoxarifado e as 30 primeiras foram as do fornecedor A.
33
35
34
34
34

38
34
33
35
34

34
30
33
34
36

34
37
34
33
35

34
36
31
31
34

31
33
32
35
33

36
34
36
35
32

35
34
33
35
38

32
32
29
37
34

37
39
36
32
33

Pede-se:
a) Utilizando a tabela de nmeros ao acaso a partir do 11 dgito da 5 linha, tome uma
amostra de tamanho 10 e calcule o peso mdio e a varincia dos pesos das peas da
amostra;
a) Se fosse efetuada uma amostragem estratificada proporcional e a amostra fosse de 15
elementos, quantos seriam retirados de cada estrato?
b) Suponha que das 30 pea do fornecedor A tenha sido colhida uma amostra sistemtica de
5 peas e sabe-se que a 3 pea a entrar no almoxarifado faz parte da amostra. Calcule a
mdia e o desvio padro dos pesos das peas dessa amostra.
14

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

9) Uma populao est dividida em 4 estratos de tamanhos 180, 420, 240 e 360. Foi realizada
uma amostragem estratificada proporcional e foram retirados 9 elementos do menor estrato.
Qual o tamanho total da amostra?
10) Na terceira srie de um curso de Engenharia Mecatrnica existem duas turmas: a da manh
com 40 alunos e a da noite com 20 alunos. As 40 primeiras notas so dos alunos da manh e
as outras 20 so dos alunos da noite.
6,0
6,3
6,6
6,8
6,0
4,5

6,2
6,5
6,8
6,0
5,1
4,6

6,6
6,8
6,9
6,6
4,8
5,1

6,1
6,3
6,2
7,0
6,0
5,3

6,0
6,4
6,4
6,3
5,0
5,5

6,8
6,5
6,6
7,1
4,5
4,7

7,0
7,2
7,0
6,8
4,0
4,8

7,1
6,0
6,4
6,3
5,0
5,3

6,5
6,2
6,3
6,1
5,1
5,2

6,9
6,1
6,5
6,0
5,5
5,8

a) Foi retirada uma amostra aleatria de 10 notas com auxlio da tabela de nmeros ao acaso,
a partir da interseco da stima linha com a vigsima sexta coluna. Calcule a mdia e a
varincia das notas dessa amostra;
b) Se tivesse sido realizada uma amostragem estratificada uniforme de 10 notas e tivesse sido
obtida mdia 6,4 para os alunos da manh e 5,2 para os alunos da noite, em quanto voc
estimaria a mdia dos 60 alunos?
c) Se das notas dos alunos da manh fosse retirada uma amostra sistemtica de 8 notas e
soubssemos que a oitava nota (7,1) faz parte dessa amostra, qual a mdia e o desvio
padro das notas dessa amostra?
Respostas:

1) Seleciona-se, para a amostra, um de cada trs pronturios ordenados (por exemplo, o


terceiro de cada trs).
2) O pesquisador pode usar a tcnica de amostragem estratificada, isto , sortear um
periquito de cada gaiola para compor a amostra.
3) Neste caso, razovel esperar os seguintes tipos de tendenciosidade: a) os casais
com muitos filhos responderiam, pensando na possibilidade de algum tipo de ajuda,
como instalao de uma creche no bairro; b) os casais que recentemente tiveram o
primeiro filho tambm responderiam; c) muitos dos casais que no tm filhos no
responderiam.
4) Nos domiclios onde moram muitas pessoas, ser fcil o pesquisador encontrar pelo
menos uma pessoa, por ocasio de sua visita. Ento razovel admitir que os
domiclios com poucos moradores tm maior probabilidade de serem excludos da
amostra.
5) Os casais de geraes anteriores que no tiveram filhos no tm possibilidade de
serem selecionados para a amostra. Por outro lado, os casais de geraes anteriores
que tiveram muitos filhos tero grande probabilidade de serem amostrados.
6) 16,0
22,5
4,74
7) 16,17
18,17
4,26
8) a) 35
4,44
b) 9 do A e 6 do B
c) 34,4
2,8
9) 60
10) a) 5,98 e 0,508
b) 6,0
c) 6,25 e 0,78
15

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

MDULO 3 - CORRELAO E REGRESSO

CORRELAO
1. INTRODUO:
Uma das atividades humanas que realizamos sem cessar a de associar a variao de uma varivel
variao de outra, constituindo em um dos principais mtodos de ajustamento ao ambiente em que vivemos. J
nos primeiros anos de vida, a criana capaz de associar certas expresses faciais dos pais ao seu
comportamento provvel. capaz, tambm, de associar certos rudos com determinadas atividades que se
passam no lar, e quanto maior for o nmero de associaes que seja capaz de fazer, tanto melhor ser o seu
ajustamento ao lar.
Esse relacionamento entre variveis recebe o nome de correlao. Existe uma grande quantidade de
variveis que se relacionam atravs de uma frmula matemtica, como por exemplo, a rea de um quadrado,
que depende da medida do seu lado, ou seja, a rea do quadrado igual ao valor do seu lado elevado ao
quadrado: A = l2 ; outras variveis no se relacionam atravs de uma frmula matemtica, como por exemplo,
beleza x inteligncia. Em estatstica o assunto abordado pela correlao exatamente uma tentativa de
matematizar, sem no entanto resumir por frmulas, a relao que existe entre duas variveis.
Outros exemplos estudados pela correlao:
nvel econmico x nvel escolar
cigarros x cncer
horas trabalhadas x rendimento escolar
peso x idade da pessoa
consumo da famlia x renda familiar
demanda de um produto x preo
etc....
Particularmente em psicologia esse assunto largamente aplicado em T.E.P. (tcnicas do exame
psicolgico) na medida em que avalia a preciso e a validade de testes psicolgicos,tambm em exames
vocacionais que procuram indicar a profisso futura adequada para adolescentes. O que se faz correlacionar
os resultados obtidos pelos sujeitos com os resultados esperados para cada uma das profisses e da, indicase a profisso onde a correlao apresentou o maior grau.
2. DIAGRAMA DE DISPERSO
a representao dos pares ordenados (xi ; yi), de duas variveis aleatrias X e Y, em um sistema de
coordenadas cartesianas, obtendo uma nuvem de pontos que denominamos diagrama de disperso.
Exemplo:
A tabela abaixo fornece as notas de 10 alunos de uma universidade nas
disciplinas de matemtica e estatstica:
ALUNO
01
02
03
04
05
06
07
08
09
10

N O T A S
MATEMTICA (xi)
ESTATSTICA (yi)
5,0
6,0
5,0
9,0
7,0
8,0
10,0
10,0
6,0
5,0
7,0
7,0
9,0
8,0
3,0
4,0
8,0
6,0
2,0
2,0

xi e yi so as
variveis dadas
na tabela.

16

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

notas de estatstica

Diagrama de disperso (grfico da tabela):


12
10
8
6
4
2
0
0

10

12

notas de matemtica

Os pontos obtidos, no diagrama (nuvem de pontos), vistos em conjunto, formam uma elipse em
diagonal.

notas de estatstica

Podemos imaginar que, quanto mais fina (achatada) for a elipse, mais ela se aproximar de
uma reta. Dizemos, ento, que a correlao de forma elptica tem como imagem uma reta, sendo,
por isso, denominada correlao linear. Se essa reta for crescente, a correlao ser linear positiva
e se for decrescente, a correlao ser linear negativa.
12
10
8
6
4
2
0

Correlao linear positiva

10

12

notas de matemtica

y
10

8
6
4

2
0

Correlao linear negativa

10

17

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

y
10

8
6

4
2

Ausncia de correlao
(correlao nula)

0
2

10

1. MEDIDAS DE CORRELAO

A correlao linear procura medir a relao entre duas variveis X e Y atravs da disposio
dos pontos (x, y) em torno de uma reta. O instrumento de medida da correlao linear dado pelo
coeficiente de correlao de Pearson que varia entre 1 e +1 no seguinte esquema:

correlao aumenta
negativamente

1
|

0,75
|

0,5
|

0,25
|

correlao aumenta
positivamente

0
|

0,25
|

0,5
|

0,75
|

1
|

Correlao positiva perfeita


Correlao positiva alta (forte)
Correlao positiva mdia
Correlao positiva baixa (fraca)
Ausncia de correlao (correlao inexistente)
Correlao negativa baixa (fraca)
Correlao negativa mdia
Correlao negativa alta (forte)
Correlao negativa perfeita
18

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

4. Coeficiente de Pearson (rP) Se as variveis em questo X e Y so cardinais, utilizamos o


coeficiente de Pearson (Karl Pearson, 1857 1936) dado pela frmula:

rP =

n . (x i . y i ) ( x i ) . ( y i )
[n . x i 2 ( x i ) 2 ] . [ n . y i 2 ( y i ) 2 ]

onde:

n = nmero de observaes
OBS.: O coeficiente de Correlao Linear de Pearson pode ser calculado tambm por uma Frmula
Alternativa que :

rP =

S xy
S xx .S yy

S xy = cov( x, y ) =

, onde:

(xi x).(yi y) , que a covarincia entre as variveis x e y,

n 1
cujo resultado determina o sinal e o grau da correlao das variveis;
2
(
)
x
i

S xx = (xi )2

2
(
)
y
i

S yy = (yi )2

NOTA: O Coeficiente de Pearson calculado pela primeira frmula mais preciso que o calculado pela
segunda frmula (frmula alternativa), pois trabalha com os Dados Brutos, sem transformaes, sem
arredondamentos.
Exemplo: Calcule e interprete o coeficiente de Pearson (rP) para os dados da tabela:
ALUNO BIOLOGIA (Xi) FISIOLOGIA (Yi)
1
4,5
3,5
2
6
4,5
3
3
3
4
2,5
2
5
5
5,5
6
5,5
5
7
1,5
1,5
8
7
6
35
31

Completando a tabela, temos:

19

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

ALUNO BIOLOGIA (Xi) FISIOLOGIA (Yi)


1
4,5
3,5
2
6
4,5
3
3
3
4
2,5
2
5
5
5,5
6
5,5
5
7
1,5
1,5
8
7
6
35
31

Xi . Yi
15,75
27
9
5
27,5
27,5
2,25
42
156

(Xi)2
20,25
36
9
6,25
25
30,25
2,25
49
178

(Yi)2
12,25
20,25
9
4
30,25
25
2,25
36
139

OBSERVAO: Como o clculo de rP trabalhoso, recomenda-se fazer o grfico antes de comear


qualquer clculo. Se os pontos do grfico distriburem-se de tal modo que lembrem uma linha reta,
convm calcular rP; se os pontos estiverem dispersos de modo no-linear, no convm calcular rP .

Notas de Fisiologia

A) Diagrama de Disperso:
8
6
4
2
0
0

Notas de Biologia

B) Coeficiente de Pearson:

rP =

rP =

n . (x i . y i ) ( x i ) . ( y i )
[n . x i 2 ( x i ) 2 ] . [ n . y i 2 ( y i ) 2 ]
163
173,35

8 . 156 35 . 31
[ 8 . 178 35 2 ] . [ 8. 139 312 ]

rP = 0,94

20

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

C) Interpretao do resultado (correlao positiva alta)


O resultado obtido pelo coeficiente de Pearson (rP = 0,94) indica uma correlao positiva
altamente significativa entre as duas variveis analisadas.
D) Clculo pela Frmula Alternativa:
35 2
312
35.31
S xx = 178
= 24,875 , S yy = 139
= 18,875 , S xy = 156
= 20,375
8
8
8
rP =

20,375
24,875.18,875

20,375
21,668

rP = 0,94

OBSERVAO: A natureza no produz correlaes perfeitas (do tipo rP = 1,00 ou rP = 1,00).


Essas correlaes pertencem ao campo da Matemtica, por exemplo, se y = 2x, ento:

rP =

rP =

Yi
0
2
4
6
8
20

Xi
0
1
2
3
4
10

(Xi)2
0
1
4
9
16
30

Xi . Yi
0
2
8
18
32
60

(Yi)2
0
4
16
36
64
120

(x i . y i ) ( x i ) . ( y i )
[n . x i 2 ( x i ) 2 ] . [ n . y i 2 ( y i ) 2 ]
n.

100
50.200

100
10000

100
100

5 . (60) (10) . (20)


[ 5 . (30) (10) 2 ] . [ 5. (120) (20) 2 ]

rP = 1,00

EXERCCIOS PROPOSTOS:
1. Descreva um exemplo de correlao linear positiva e um exemplo de correlao linear negativa,
esboando para cada um o respectivo diagrama de disperso;

21

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

2. Numa pesquisa realizada sobre, nmero de cigarros fumados por dia (x) e idade da morte (y):

N de cigarros/dia Idade da morte


20
60
25
55
30
40
15
70
25
55
20
61
18
63
28
42
20
58
Pede-se:
a) esboar o diagrama de disperso;
b) calcular o coeficiente de Pearson;
c) interpretar os resultados.
3.De acordo com um estudo realizado por uma equipe de pesquisadores, as variveis medo do
escuro e tempo de convivncia diria com a me esto correlacionadas. A varivel medo foi
medida atravs de uma escala que variou entre 1 e 5, sendo 1 o grau mnimo e 5 o grau mximo. A
varivel tempo foi avaliada em nmero de horas dirias que a criana convive exclusivamente com a
me. Abaixo encontram-se os resultados do estudo em questo, obtidos com 8 crianas:
Artigo I.
Artigo II.

Medo do escuro
Tempo de convivncia

2
10

4
8

3
6

5
3

1
12

3
8

5
4

3
7

Pede-se:
a) esboar o diagrama de disperso;
b) calcular o coeficiente de Pearson;
c) interpretar os resultados.
4. De acordo com uma pesquisa em uma clnica psicolgica, levantou-se a hiptese segundo a qual o
tempo de internao dos pacientes teria uma relao com o grau de satisfao que os sujeitos tm
por sua famlia. Foi elaborado um questionrio cujo resultado identificava, em uma escala de 0 a 10, o
grau de satisfao dos sujeitos. Com base nos resultados, realize o procedimento adequado para a
confirmao ou no desta hiptese, e interprete o resultado.
X = grau de satisfao familiar
Y = tempo de internao (nmero de dias)
Artigo III.
Artigo IV.

X
Y

8
20

4
5

2
14

1
8

9
3

10
2

3
18

5
30

6
5

2
15

22

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

REGRESSO LINEAR
Como vimos na Correlao, os pares ordenados de uma tabela determinam o que
denominamos de diagrama de disperso, que representa uma correlao entre as variveis da
tabela dada.
Cabe regresso linear fazer o ajustamento da reta, ou seja, obter a equao da reta que
melhor se ajusta aos pontos dados no diagrama de disperso.
A anlise de regresso tem por objetivo descrever, atravs de uma equao matemtica, o
relacionamento entre duas variveis, partindo de n observaes das mesmas.
A varivel sobre a qual desejamos fazer uma estimativa recebe o nome de varivel
dependente (y) e a outra recebe o nome de varivel independente (x)
A equao do ajustamento de uma reta dada por: y* = a x + b, onde a e b so os
parmetros. A indicao y* devida pelo fato da eq. de regresso ter um valor aproximado ou terico.
Os valores dos parmetros a e b so obtidos pelo mtodo dos mnimos quadrados em que:
a=

n . (x i . y i ) x i . y i
2

n . x i ( x i )2

b= y ax
y

n o nmero de observaes;

x a mdia dos valores xi :


y a mdia dos valores yi :

, onde:
reta imagem

10

xi
x =

yi
y =

10

EXEMPLO:
A tabela a seguir indica as quantidades produzidas mensalmente de um produto e os
respectivos custos totais de produo:

quantidade produzida
custo total (R$)

xi
yi

10
200

12
230

13
270

14
290

15
280

16
300

Pede-se estabelecer pela anlise de regresso:


a) a reta que melhor se ajusta a esses dados;
b) o valor mais provvel dos custos fixos;
c) o valor do custo estimado para 18 produtos.

23

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

a)

x=

a=

xi
n

Eurpedes MACHADO Rodrigues

xi
10
12
13
14
15
16

yi
200
230
270
290
280
300

xi . yi
2000
2760
3510
4060
4200
4800

xi2
100
144
169
196
225
256

80

1570

21330

1090

80
= 13,33
6

n . (x i . y i ) x i . y i
2

n . x i ( xi )

yi

y=

1570
= 261,66
6

6. 21330 80 . 1570
6 . 1090 80

custo total (R$)

b = y a x = 261,66 17 . 13,33 = 35,05 35


Portanto a equao de ajuste da reta : y = ax + b

2380
= 17
140

y* = 17x + 35

350
300
250
200
150
100
50
0

Reta que melhor se


ajusta aos dados

10

15

20

quantia produzida (unid.)

b) o Custo fixo obtido quando fazemos x = o, assim:


y* = 17 . 0 + 35 = 0 + 35
y* = R$ 35,00 (custo fixo)
d) o Custo estimado para x = 18 dado por:
y* = 17 . 18 + 35 = 306 + 35
y* = R$ 341,00 (custo estimado)
EXERCCIOS:
1. A tabela abaixo indica a quantidade de bolas de basquete produzidas mensalmente e os
respectivos custos totais de produo:

quantidade
custos em R$

xi
yi

10
100

11
112

12
119

13
130

14
139

15
142
24

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Pede-se:
a) a reta que melhor se ajusta a esses dados;
b) o valor mais provvel dos custos fixos;
c) qual o custo para a quantidade de 16 bolas.
2. A tabela abaixo mostra a taxa de desemprego em porcentagem da populao economicamente
ativa de 1980 a 1992 de um determinado pas.
Pede-se:
a) a reta que melhor se ajusta a esses dados;
b) avaliar (estimar) a taxa de desemprego para o ano de 1993

Ano (xi) 80 81 82 83 84 85 86 87 88 89 90 91 92
% (yi) 2,2 4,3 4 4,3 4,9 4,5 2,4 2,6 3,8 3,2 2,6 4,5 6
3. A tabela abaixo mostra as alturas e o peso em quilogramas de uma amostra de alunos do
curso de administrao do 1 semestre.
Pede-se:
a) a reta que melhor se ajusta a esses dados;
b) avaliar a altura do aluno cujo peso 63 kg;
c) avaliar o peso do aluno cuja altura 180 cm

peso (xi) 45 60 58 55 66 58 70 68 76
altura (yi) 150 155 158 160 162 165 170 175 178
4. A tabela abaixo revela uma amostra de valores de seguro pessoal contratados em funo da
quantidade de salrios mnimos recebidos. Usando a equao de regresso linear, qual
seria o montante segurado para algum que recebe 30 salrios mnimos?

Salrios (xi)
Seguro (mil R$) (yi)

13
50

16 17 18 20 25 26 32 38 40 42
150 200 100 100 120 150 300 400 500 400

5. A variao do valor do BTN (Bnus do Tesouro Nacional), relativamente a alguns meses de


1990, deu origem tabela:

Meses
(xi)
Valores ($) (yi)

abr
41,73

mai
41,73

jun
43,98

jul
48,91

ago
53,41

set
59,06

out
66,65

nov
75,76

Pede-se:
a) a reta que melhor se ajusta a esses dados;
( y* = 4,9x + 17,15 )
b) estime o valor do BTN para o ms de dezembro do mesmo ano.
( $ 75,95 )

25

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Resoluo dos exerccios da pgina 24 Prof. Machado


1.

quantidade
custo total (R$)
a)

x=

a=

xi
yi

10
100

11
112

13
130

xi
10
11
12
13
14
15

yi
100
112
119
130
139
142

xi . yi
1000
1232
1428
1690
1946
2130

xi2
100
121
144
169
196
225

75

742

9426

955

x i = 75 = 12,5
n

12
119

n . (x i . y i ) x i . y i
n . x i ( x i )2
2

y=

14
139

15
142

y i = 742 = 123,66
n

6. 9426 75 . 742
6 . 955 75

906
105

= 8,63

custo total (R$)

b = y a x = 123,66 8,63 . 12,5 = 15,785 15,78


Portanto a equao de ajuste da reta : y* = ax + b
y* = 8,63x + 15,78

160
140
120
100
80
60
40
20
0

Reta que melhor se


ajusta aos dados

10

15

20

quantidade de bolas

b) o Custo fixo obtido quando fazemos x = o, assim:


y* = 8,63 . 0 + 15,78 = 0 + 15,78
y* = R$ 15,78 (custo fixo)
c) o Custo estimado para x = 16 dado por:
y* = 8,63 . 16 + 15,78 = 138,08 + 15,78

y* = R$ 153,86 (custo estimado)


26

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

2.

Ano (xi) 80 81 82 83 84 85 86 87 88 89 90 91 92
% (yi) 2,2 4,3 4 4,3 4,9 4,5 2,4 2,6 3,8 3,2 2,6 4,5 6
a)

x=

a=

xi
80
81
82
83
84
85

yi
2,2
4,3
4
4,3
4,9
4,5

xi . yi
176
348,3
328
356,9
411,6
382,5

xi2
6400
6561
6724
6889
7056
7225

86

2,4

206,4

7396

87

2,6

226,2

7569

88

3,8

334,4

7744

89

3,2

284,8

7921

90

2,6

234

8100

91

4,5

409,5

8281

92

552

8464

1118

49,3

xi = 1118 = 86
n

13

4250,6 96330

n . (x i . y i ) x i . y i
n . x i 2 ( x i ) 2

b= y ax

y=

yi = 49,3 = 3,8
n

13

13. 4250,6 1118 . 49,3


13.96330 1118 2

140,4
2366

= 0,06

= 3,8 0,06 . 86 1,36

Portanto a equao de ajuste da reta : y* = ax + b

y* = 0,06x 1,36

b) a taxa de desemprego (estimada) para 1993 obtida fazendo na equao do ajuste


x = 93. Assim,
y* = 0,06 . 93 1,36 = 5,58 1,36 = 4,2%

27

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

3.
peso (xi) 45
60
58
55
66
58
70 68 76
altura (yi) 150 155 158 160 162 165 170 175 178
a)

yi
150
155
158
160
162
165
170
175
178

xi . yi

xi2

6750
9300
9164
8800
10692
9570
11900
11900
13528

2025
3600
3364
3025
4356
3364
4900
4624
5776

556

1473

91604 35034

xi = 556 = 61,78

n . (x i . y i ) x i . y i

x=

a=

xi
45
60
58
55
66
58
70
68
76

n . x i2 ( x i )2

b= y ax

y=

yi = 1473 = 163,67
n

9. 91604 556 . 1473


9 . 35034 556 2

5448
6170

= 0,88

= 163,67 0,88 . 61,78 = 109,3

Portanto a equao de ajuste da reta : y* = ax + b

y* = 0,88x + 109,3

b) para um peso x = 63 kg, temos: y* = 0,88 . 63 + 109,3

y* = 164,74 cm

c) para uma altura y = 180 cm, temos: 180 = 0,88 x + 109,3


0,88 x = 180 109,3

0,88 x = 70,7

x = 80,34 kg

28

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

4.
Salrios (xi)
Seguro (mil R$) (yi)
a)

x=

a=

13
50

16 17 18 20 25 26 32 38 40 42
150 200 100 100 120 150 300 400 500 400

xi
13
16
17
18

yi
50
150
200
100

xi . yi

xi2

650
2400
3400
1800

169
256
289
324

20

100

2000

400

25

120

3000

625

26

150

3900

676

32

300

9600

1024

38

400

15200

1444

40

500

20000

1600

42

400

16800

1764

287

2470

78750

8571

xi = 287 = 26,1
n

11

n . (x i . y i ) x i . y i
2

n . x i ( xi )

b= y ax

y=

yi = 2470 = 224,5
n

11

11. 78750 287 . 2470


11.8571 287

157360
11912

= 13,2

= 224,5 13,2 . 26,1 120

Portanto a equao de ajuste da reta : y* = ax + b

y* = 13,2x 120

b) para quem recebe x = 30 salrios mnimos, temos:


y* = 13,2 . 30 120 = 396 120

y* = R$ 276,00 de montante segurado.

29

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

5.

Meses
(xi)
Valores ($) (yi)

abr
41,73

a)

xi
4
5
6
7

10

100

11

75,76 833,36

121

60

431,23 3440,5

492

a=

n . (x i . y i ) x i . y i
2

n . x i ( xi )

b= y ax

out
66,65

nov
75,76

36

81

y=

set
59,06

16
25

59,06 531,54
66,65 666,5

ago
53,41

xi2

xi . yi
yi
41,73 166,92
41,73 208,65
43,98 263,88

xi = 60 = 7,5
n

jul
48,91

49

x=

jun
43,98

48,91 342,37
53,41 427,28

mai
41,73

64

yi = 431,23 = 53,9
n

8. 3440,5 60 . 431,23
8.492 60

1650,2
336

= 4,9

= 53,9 4,9 . 7,5 = 17,15

Portanto a equao de ajuste da reta : y* = ax + b

y* = 4,9x + 17,15

b) para o ms de dezembro, devemos ter x = 12. Logo:


y* = 4,9 . 12 + 17,15 = 58,8 + 17,15

y* = $ 75,95

30

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

MDULO 4 ESTIMATIVA DE PARMETROS.

1. Parmetro a medida usada para descrever uma caracterstica numrica


populacional, ou seja, da populao.
Exemplos de parmetros populacionais: mdia (representada por ), varincia
(representada por 2) e desvio-padro (representado por ).
2. Estatsticas da amostra so medidas caractersticas determinadas na
amostra para escolher os estimadores de um parmetro populacional.
Exemplos de parmetros populacionais: mdia amostral (representada por x ),
Varincia amostral (representada por s2) e desvio-padro amostral (representado por s).
Resumindo:

Mdia
Varincia
Desvio padro

Parmetros
Populacionais

Estatsticas da amostra
(Estimadores)
x

s2
s

3. Distribuio Amostral quando selecionamos aleatoriamente vrias amostras de


tamanho n da populao, os valores da mdia e do desvio-padro calculados estaro
distribudos em torno de valores verdadeiros para a populao.
Se selecionarmos aleatoriamente, todas as amostras com mesmo tamanho n desta populao
e calcularmos uma estatstica x ou uma estatstica s para as amostras, podemos construir
uma distribuio de probabilidades da estatstica. Essa distribuio chamada de
Distribuio Amostral.
Observaes:
a) A mdia das mdias das amostras igual mdia populacional, ou seja:
x =

b) O desvio-padro das mdias das amostras igual ao desvio-padro populacional

dividido pela raiz quadrada de n, ou seja: x =

O desvio-padro da distribuio amostral das mdias das amostras denominado erro


padro da mdia.
c) Amostra com reposio aquela em que o elemento extrado devolvido populao
aps anotadas suas caractersticas.
d) Amostra sem reposio aquela em que o elemento extrado no devolvido
populao aps anotadas suas caractersticas.
Exemplo:
Suponha que a mdia de uma populao bastante grande seja = 50 e o desvio padro
=12. Determinar a distribuio de amostragem das mdias das amostras de tamanho
n = 36.
31

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Soluo: Em termos de valor esperado e de erro padro da distribuio, temos:


x = = 50

x =

12
36

12
=2
6

Notas: 1) Se usarmos amostras de uma populao finita, deve-se incluir um fator de


correo finita (ou fator de correo para populao finita) na frmula do erro padro da
mdia. Uma regra de bolso que a correo insignificante e pode ser omitida sempre
que n < 0,05.N; isto , quando o tamanho da amostra for menor que 5% do tamanho da
populao. A frmula para o erro padro da mdia quando se inclui o fator de correo

finita : x =

Nn
N1

2) Se o desvio padro da populao for desconhecido, o erro padro da mdia


pode ser estimado, usando-se o desvio padro da amostra s como um estimador do desvio
padro da populao. Para diferenciar este erro padro daquele baseado em um
conhecido, denota-se o mesmo por s x . A frmula para o erro padro estimado da mdia

: s x =

s
n

A frmula para o erro padro estimado da mdia quando se inclui o fator de correo
finita : s x =

s
n

Nn
, onde
N1

Nn
o fator de correo finita.
N1

Exemplo: Um auditor toma uma amostra aleatria de tamanho n = 16 de um conjunto de


N = 100 contas a receber. No se conhece o desvio padro dos valores das 100 contas
a receber. Contudo, o desvio padro da amostra s = $ 57,00. Determinar o valor do
erro padro da distribuio de amostragem da mdia.
Soluo:
Temos: n = 16 e 5%.N = 0,05 . 100 = 5, ento, n > 5%.N. Logo, usaremos o fator de
correo finita para calcularmos o erro padro estimado da mdia com base no desvio
padro amostral, ou seja:
sx =

s
n

Nn
57
100 16
57 84
=
.
=
.
= 14,25 . 0,9211 $ 13,13
N1
100 1
4
99
16

3.1. Distribuio amostral das propores


Uma distribuio de propores amostrais indica quo provvel determinado um
conjunto de propores amostrais, dados o tamanho da amostra e a proporo populacional.
Quando o tamanho da amostra 20 ou menos, as probabilidades dos diversos resultados
possveis podem ser lidas diretamente numa tabela de probabilidades binomiais simplesmente
convertendo o nmero de sucessos em porcentagens. Por exemplo, 3 ocorrncias em 10
observaes correspondem a 30%, 5 ocorrncias em 20 observaes correspondem a 25%.
Para maiores amostras, a aproximao normal da binomial d resultados bastante
satisfatrios.
A mdia (proporo ou porcentagem mdia) da distribuio amostral sempre igual
proporo populacional, isto ,
p = p , onde:
p = proporo populacional
e p = mdia da distribuio amostral das propores.
32

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Quando a populao muito grande ou infinita, o desvio padro da distribuio


amostral se calcula pela frmula:
(p ) =

p. (1 p )
ou
n

(p) =

p. q
, pois (1 p) = q
n

Exemplo1:
Um varejista compra copos diretamente da fbrica em grandes lotes. Os copos vm
embrulhados individualmente. Periodicamente o varejista inspeciona os lotes para determinar
a proporo dos quebrados ou lascados. Se um grande lote contm 10% de quebrados ou
lascados, qual a probabilidade de o varejista obter uma amostra de 100 copos com 17% ou
mais defeituosos?
Soluo:
Temos: ( p ) = p = 10%, que a porcentagem populacional de defeitos, ento (1 p) = 90%;
n = 100

O desvio padro ser: (p) =


z=

p. (1 p )
=
n

(0,10 ).(0,90 )
0,3
=
= 0,03 = 3%.
100
10

17% 10%
7%
p (p)
=
=
= 2,33
3%
3%
(p)

tab.: 0,4901
0,4901

10% 17%

0 2,33

Potanto, P( p 17%) = P(z 2,33) = 0,5 0,4901 = 0,0099 = 0,99% 1%


4. Teorema do Limite Central medida que se aumenta o tamanho da amostra, a
distribuio de amostragem da mdia se aproxima da forma da distribuio normal,
qualquer que seja a forma da distribuio populacional. Na prtica, a distribuio de
amostragem da mdia pode ser considerada como distribuio normal sempre que o
tamanho da amostra for n 30.
Portanto, o uso da distribuio normal na estimativa da mdia populacional
garantido para qualquer grande amostra (n 30), sendo-o para uma pequena amostra
(n < 30) somente se a populao for normalmente distribuda e for conhecido, ou
seja, importante saber que a populao submetida a amostragem tem distribuio
normal, ou ao menos aproximadamente normal.
Exemplo 1:
Um auditor toma uma amostra de n = 36 de uma populao de 1.000 contas a receber. O
desvio padro da populao desconhecido, mas o desvio padro da amostra s = $
43,00. Se o verdadeiro valor da mdia da populao de contas a receber = $ 260,00,
qual a probabilidade de que a mdia da amostra seja menor ou igual a $ 250,00, ou seja,
P( x 250) = ?
Soluo: 5%N = 0,05.1000 = 50
n < 5%N. Logo, no inclui fator de correo.
33

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

A distribuio de amostragem descrita pela mdia e pelo erro padro:


x = = 260,00 (como foi dado);

sx =

43
36

43
7,17
6

Nota: s usado como estimador de , e o fator de correo finita no necessrio,


uma vez que (n = 36 < 5%N = 0,05 . 1000 = 50)
zo =
50%

x
250 260
10
=
=
= 1,39
7,17
7,17
sx

Tab.: 0,4177

0,5

1,39

1.3

0.4032

---

0.09

---

zo

250 260

0.00

0,4177

0.4177

P( x 250) = P(z 1,39) = 0,5 0,4177 = 0,0823 = 8,23%


Exemplo 2: Uma transportadora entrega em uma adega 30 caixas, cada uma contendo trs
dzias de garrafas de vinho. Sabendo-se que o volume mdio do lote 750 ml por garrafa,
com um desvio-padro de 20 ml, determine:
a) o volume mdio de cada caixa;
b) a probabilidade de uma caixa, que contm 36 garrafas ter volume mdio inferior a 740
ml, ou seja, P( x < 740) = ?

Como a populao composta de N = 30 x 36 = 1080 garrafas, ela pode ser considerada


infinita; Como n = 36 garrafas (n > 30), pode ser considerada uma grande amostra. Da, a
distribuio amostral do volume mdio por garrafa pode ser considerado normal, seja qual
for a distribuio populacional.
a) A mdia da distribuio amostral sempre igual mdia da populao. Logo, o volume
mdio por caixa ser: ( x ) = = 750 ml
b) Para determinar a probabilidade de uma caixa ter volume mdio inferior a 740 ml,
devemos calcular:
I) o desvio padro da distribuio amostral do volume mdio:
(x) =

20
36

20
10
=
(n = 36 < 5%N = 54
6
3

no inclui fator de correo finita).

II) o valor do volume limite na escala reduzida padronizada Z:


zo =

x ( x )
( x )

50%

740 750
3. 10
=
10
10
3

zo = 3

tab.: 0,4986

0,5
0,4986

740 750

P( x < 740) = P(z < 3) = 0,5000 0,4986 = 0,0014 = 0,14%


34

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Exemplo2: Uma mquina de encher sacos plsticos de leite foi ajustada para um volume
mdio de 1.000 ml, com um desvio padro de 25 ml. O ajuste deve ser sempre verificado
porque o Servio de Inspeo Federal SIF multar o fabricante se uma amostra aleatria
acusar volume mdio inferior a 950 ml e os sacos podero romper-se no transporte se
contiverem mais que 1.050 ml de leite. Se uma amostras de 25 unidades for aleatoriamente
escolhidas sem reposio de um lote de 750 sacos, qual ser:
a) O volume mdio esperado?
b) O desvio padro da distribuio amostral correspondente?
c) O nmero de amostras com volume mdio entre 990 ml e 1.010 ml?
= 25; 5%N = 0,05.750 = 37,5
n < 5%N
Temos: N = 750; n = 25;
a) o volume mdio esperado igual ao volume populacional: ( x ) = = 1000 ml
b) o desvio padro da distribuio amostral correspondente :
(x) =

25
25

25
5

5 ml

c) como conhecido e a populao tem distribuio amostral, ela aproximadamente


normal.
P(990 < x < 1010) =?

( x )

tab.: 0,4772

1010 1000
=2
5

tab.: 0,4772

zo
2.0

0,4772

990

1000

1010

0.00

0.01

0.4772

0.4778

0.02

x ( x )

990 1000
=2
5

( x )

z2 =

x ( x )

z1 =

0.4783

0,4772

Ento: P(990 < x < 1010) = P(2 < z < 2) = 2 . 0,4772 = 0,9544 = 95,44%
Portanto, o nmero de amostras com volume mdio entre 990ml e 1010ml :
n = 25 . 95,44% = 23,86 24
5. Estimao Pontual Uma estimativa pontual quando obtida de um nico valor para
um parmetro populacional. Exemplo: a mdia amostral x uma estimativa pontual para a
mdia populacional .
6. Estimao por Intervalos.
a) Uma estimativa intervalar um intervalo (ou uma amplitude) de valores usados para
estimar um parmetro populacional.
b) Nvel de confiana (ou grau de confiana ou coeficiente de confiana) a
probabilidade de que o intervalo estimado contenha o parmetro populacional.
Vimos que: Se n 30, a distribuio amostral das mdias uma distribuio normal.
35

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

O nvel de confiana c a rea sob a curva normal reduzida, entre os valores crticos
zc e zc

c
(1 )

zc

Nota: Alguns autores representam


o nvel de confiana por (1 )
(geralmente expressa com valor
porcentual).

zc

z=0

7. Intervalos de confiana para a mdia (amostras grandes)


Sendo c um nvel de confiana, a margem de erro E a maior distncia possvel entre a
estimativa pontual e o valor do parmetro a ser estimado. Esse erro dado pela frmula:

E = zc .

ou E = z .

Observao: Se n 30, o desvio padro amostral s poder ser usado no lugar do desvio
padro populacional quando este for desconhecido. Neste caso,

E = zc .

ou

E = z .
2

s
n

Um intervalo de confiana c para a mdia populacional dado por:


x E<< x +E

ou

= x E

ou

= x z .
2

Nota: Dizemos que c ou (1 ) a probabilidade de que o intervalo de confiana


contenha a mdia populacional .
Observao: Os intervalos de confiana mais freqentemente utilizados so os de 90%,
95% e 99%
Propores selecionadas de rea sob a curva
Valor crtico
Nvel (ou grau) de confiana

zc = z
c ou (1 )%
2

90% = 0,90
95% = 0,95
99% = 0,99
45%

45%=0,45

2 = 5%

90%

1,645 0 1,645

1 = 90%

2 = 5%

= 10%

47,5%

10% = 0,10
5% = 0,05
1% = 0,01

1,645
1,96
2,575

47,5%=0,475

49,5%

2 = 2,5%

95%
1,96

2 = 2,5%

49,5%=0,495

2 = 0,5%

2 = 0,5%

99%
1,96

1 = 95%

= 5%

2,57 0 2,57

1 = 99%

= 1%

Exemplo:
36

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Uma amostra aleatria de n = 36 elementos retirados de uma populao aproximadamente


normal forneceu mdia x = 15,5 e desvio-padro s = 1,5. Construir um intervalo de 95% de
confiana para a mdia dessa populao.
Soluo:
c = 95% = 0,95 ; n = 36 (n 30);
s = 1,5
e x = 15,5

E = zc .

zc

s
n

= 1,96 .

1.9

1,5
36

0.00

---

z=0

zc

zc

c = 95%

Na tabela da distribuio normal


reduzida encontramos zc = 1,96

47,5% = 0,4750

---

0.4750

0.4032

0.06

= 0,49 (margem de erro)

O intervalo ser: 15,5 0,49 < < 15,5 + 0,49


15,01 < < 15,99
Portanto, com 95% de confiana, podemos dizer que a mdia populacional est entre
15,01 e 15,99.
Refazer o exerccio anterior para intervalo de 90% e 99% de confiana.
(Voc pode usar o valor de zc de acordo com a tabela de propores selecionadas de rea
sob a curva representada na p.36)
Nota: Quando a populao finita e a amostra constitui mais de 5% da populao,
devemos aplicar o fator de correo finita para modificar os desvios padres das frmulas:

E = zc .

Nn
N 1

E = zc .

s
n

Nn
N 1

8. Tamanho da amostra
O tamanho da amostra para estimar a mdia, depende do grau de confiana desejado,
da quantidade de disperso entre os valores individuais da populao e certa quantidade
especfica de erro tolervel.
Para um nvel de confiana c e um erro mximo E, podemos obter o tamanho mnimo da
amostra necessria para estimar a mdia populacional a partir da frmula do erro, ou seja:

E = zc .

( n)

z .
n = c
E

z .
= c
E

z .
n= c
E

Exemplo 1 Que tamanho de amostra ser necessrio para produzir um intervalo de 90%
de confiana para a verdadeira mdia populacional, com erro de 1,0 em qualquer dos
sentidos, se o desvio padro da populao 10?
Soluo: Temos: E = 1,0; = 10; c = 90% = 0,90
zc = z = 1,645
2

zc .
1,645 . 10
=
= 272,25
1

n=

n 273

Obs.: quando necessrio n ser arredondado para o prximo inteiro.


37

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Exemplo 2 Uma populao aproximadamente normal forneceu mdia x = 15,5 e


desvio-padro de 1,5. Determinar o tamanho requerido de uma amostra para assegurar
que, com confiana de 95%, a mdia amostral esteja dentro do intervalo 0,25 da mdia
populacional.
Soluo: Temos: E = 0,25;
2

s = 1,5 ;

c = 95% = 0,95

zc = 1,96

zc . s
1,96 . 1,5
=
= 138,2976
0,25
E

n=

n 139

Exemplo 3 Um comprador potencial deseja estimar o valor mdio das compras por
cliente em uma loja de brinquedos em um aeroporto. Com base em dados de outros
aeroportos similares, o desvio padro de tais valores de venda estimado em cerca de =
$ 0,80. Qual o tamanho mnimo que deveria ter uma amostra aleatria se a distribuio das
vendas no for considerada normal e ele desejar estimar a mdia dos valores dentro de
$ 0,50 com uma confiana de 99%?
Soluo: Temos: E = 0,50; = 0,80 ;
2

c = 99% = 0,9

zc .
2,575 . 0,80
=
= 16,97
0,50

n=

zc = 2,575

n 17

Contudo, uma vez que a populao no pode ser considerada como


normalmente distribuda, o tamanho mnimo da amostra n = 30, de tal forma que o
Teorema do Limite Central possa ser invocado para usar-se a distribuio normal de
probabilidade para construir o intervalo de confiana.
9. Intervalos de confiana para a mdia (amostras pequenas)
Nos casos em que n < 30 e o desvio-padro populacional (ou, a varincia populacional
2) conhecido, o intervalo de confiana c ou (1 ) o mesmo para grandes amostras,
isto :

x E < < x + E, onde E = zc .


n
Exemplo 1 De uma populao normalmente distribuda, com = 2, tiramos uma amostra
de 20 elementos e obtemos x = 5,2. Determinar um intervalo de 90% de confiana para a
mdia populacional .
Soluo: Temos: = 2; x = 5,2; n = 20; c = 90% = 0,9

2
I) E = zc .
= 1,645 .
= 0,7
n
20
II) x E < < x + E
5,2 0,7 < < 5,2 + 0,7

zc = 1,645

4,5 < < 5,9

Portanto, com 90% de confiana, podemos dizer que a mdia populacional est
entre 4,5 e 5,9.
38

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Exemplo 2 Suponha que o desvio padro da vida til de uma determinada marca de
tubo de imagem de TV conhecido e igual a = 500 horas, mas que a mdia da vida til
desconhecida. Supe-se que a vida til dos tubos de imagem tem uma distribuio
aproximadamente normal. Para uma amostra de n = 15, a mdia da vida til x = 8.900
horas de operao. Construir um intervalo de confiana de 95% para estimar a mdia da
populao.
Soluo: Temos: = 500; x = 8900; n = 15; c = 95% = 0,95
zc = 1,96 (p.36)
A distribuio normal de probabilidade pode ser usada neste caso
porque a populao normalmente distribuda e o conhecido.

500
I) E = zc .
= 1,96 .
= 253
15
n
II) x E < < x + E
8900 253 < < 8900 + 253
8647 < < 9153

Portanto, com 95% de confiana, podemos estimar a mdia populacional como


estando entre 8.647 horas e 9.153 horas.
Nota: Em muitos casos desconhecemos o valor do desvio-padro populacional e
tambm no conseguimos uma amostra com (n 30). Nestes casos, se a populao for
normalmente distribuda, construmos um intervalo de confiana para a mdia utilizando a
distribuio t de Student.
Distribuio t de Student (ou Distribuio T)

O criador da distribuio t foi William S. Gossett (1876 1937), empregado de uma


cervejaria irlandesa chamada Guinnes, no incio do sculo XX ele precisava de uma
distribuio que pudesse ser utilizada com pequenas amostras. A empresa no gostava
que seus empregados publicassem resultados de pesquisas e trabalhos em seu prprio
nome, de modo que Gossett adotou o pseudnimo de Student em seus trabalhos sobre a
distribuio t. Por isso que ela tomou o nome de distribuio t de Student.
Se a distribuio de uma varivel aleatria normalmente distribuda, ento a
x
x ( x )
distribuio amostral de x uma distribuio t, onde t =
ou t =
.
s
sx
n

Propriedades da curva t:
a) A curva tem a forma de um sino tendo maior rea nas caudas do que a curva
Normal. Isto significa que, para um dado nvel de confiana, o valor t ser um pouco
maior que o correspondente valor z;
b) A rea sob a curva igual a 1;
39

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

c) A curva t simtrica em torno da mdia;


d) A distribuio t uma famlia de curvas, cada uma delas depende de um parmetro
denominado grau de liberdade (g.l.). Quando usamos da distribuio t para estimar a
mdia populacional, o nmero de graus de liberdade igual ao tamanho da amostra
subtrado de uma unidade, ou seja, g.l. = n 1

curva t

curva normal

curva t

-3

-2

-1

Para encontrarmos um intervalo de confiana para a mdia populacional de amostras


pequenas, devemos encontrar primeiramente o erro mximo, dado pela frmula:
s
E = tc .
n
onde o valor de tc encontrado na tabela de distribuio t, levando-se em conta o grau
de liberdade (g.l.)

40

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Tabela da Distribuio t (Student)


normal

0
g.l.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29

0,50
1,000
0,816
0,765
0,741
0,727
0,718
0,711
0,706
0,703
0,700
0,697
0,695
0,694
0,692
0,691
0,690
0,689
0,688
0,688
0,687
0,686
0,686
0,685
0,685
0,684
0,684
0,684
0,683
0,683
0,674

0,80
3,078
1,886
1,638
1,533
1,476
1 ,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,282

Nvel de confiana c
0,90
0,95
6,314
12,706
2,920
4,303
2,353
3,182
2,132
2,776
2,015
2,571
1,943
2,447
1,895
2,365
1,860
2,306
2,262
1,833
1,812
2,228
1,796
2,201
1,782
2,179
1,771
2,160
1,761
2,145
1,753
2,131
1,746
2,120
1,740
2,110
1,734
2,101
1,729
2,093
1,725
2,086
1,721
2,080
1,717
2,074
1,714
2,069
1,711
2,064
1,708
2,060
1,706
2,056
1,703
2,052
1,701
2,048
1,699
2,045
1,645
1,960

0,98
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,326

0,99
63,657
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,576

Exemplo: O valor de tc na tabela para uma amostra de 10 elementos com nvel de


confiana de 95%, igual 2,262

Temos: n = 10
c = 95%

g.l. = n 1 = 10 1 = 9
c = 0,95

Logo, no cruzamento da coluna g.l. = 9 com a coluna c = 0,95, encontramos o valor de


tc = 2,262.

41

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Um intervalo de confiana c para a mdia populacional para amostras pequenas dado


por:
x E<< x +E
Exemplo 1 Uma amostra de 15 elementos, extrada de uma populao com distribuio
normal, forneceu mdia x = 5,60 e desvio-padro s = 0,80. Construir um intervalo de 90%
de confiana para a mdia dessa populao.
Soluo: Temos: n = 15; x = 5,60; s = 0,80
g.l. = n 1 = 15 1 = 14 e c = 90% = 0,90
Como n < 30 e desconhecido, usamos a distribuio t de Student:

0,90

14

de confiana c
-------

nvel
0,50

g.l.

0,692

-------

1,761

Logo, tc = 1,761 . Assim:


s
0,80
I) E = tc .
= 1,761 .
= 0,36
15
n
II) x E < < x + E
5,60 0,36 < < 5,60 + 0,36

5,24 < < 5,96

Portanto, com 90% de confiana, podemos dizer que a mdia populacional est entre
5,24 e 5,96.

I) E = tc .

s
n

= 2,145 .

II) x E < < x + E

500
15

-------

14

0,50

g.l.

Exemplo 2 No exemplo (2) da pgina 39, construmos intervalos de confiana para


estimar a mdia da vida til de uma marca de tubos de imagens de TV com base na
hiptese de que a vida til de todos os tubos tinham distribuio aproximadamente normal
e = 500 horas, dada uma amostra de n = 15, com x = 8900 horas. Suponha que seja
desconhecido e que o desvio padro da amostra seja s = 500 horas. Construir um intervalo
de confiana de 95% para estimar a mdia da populao e comparar este intervalo com a
resposta daquele exemplo.
Soluo:
O uso de uma distribuio t, neste caso, apropriado porque a populao
considerada como normalmente distribuda, no conhecido, e a amostra pequena
(n < 30).
Temos: n = 15
g.l. = 15 1 = 14
Tabela t: tc = 2,145
c = 95% = 0,95
s = 500
nvel de confiana c
0,95

0,692

-------

2,145

= 277

8900 277 < < 8900 + 277

8623 < < 9177


42

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Portanto, com 95% de confiana, podemos estimar a mdia populacional como


estando entre 8.623 horas e 9.177 horas.
Neste caso, nota-se claramente que o intervalo de confiana mais amplo do que o
do exemplo (2) da pgina 39 (8.647 horas e 9.153 horas), refletindo a diferena entre a
distribuio t e a distribuio normal z.
10. Intervalos de confiana para a varincia e o desvio padro.
Em muitos casos necessrio controlar o tamanho da variabilidade de um processo.
Para isto utilizamos a distribuio 2 (l-se: qui-quadrado).
Distribuio qui-quadrado 2 (: letra grega pronncia: qui)

A distribuio qui-quadrado uma estatstica concebida por Karl Pearson em 1899, que
relaciona a distribuio da varincia amostral com uma famlia de distribuies de
probabilidades.
a) Definio Se a varivel aleatria tiver uma distribuio normal, ento a distribuio
2 =

(n 1).s 2
2

formar uma distribuio qui-quadrado para amostras de qualquer

tamanho (n > 1).


b) Propriedades da distribuio qui-quadrado:
I) A distribuio qui-quadrado uma famlia de curvas, onde cada uma dessas curvas
determinada pelo nmero de graus de liberdade. Quando usamos a distribuio 2
para estimar a varincia populacional, o nmero de graus de liberdade igual ao
tamanho da amostra menos 1, isto , g.l. = n -1

II) A rea sob cada uma das curvas igual a 1 (100%)


Para encontrarmos o intervalo de confiana para a varincia, primeiramente
devemos encontrar o valor de 2 e 2 na tabela de distribuio qui-quadrado, onde
1

1 c
1 e 2 valem, respectivamente: 1 =
2

e 2 =

1+ c
, sendo c o nvel (ou grau) de
2

confiana.
De posse dos valores encontrados por 1 e por 2 e, conforme o grau de liberdade,
determinamos os valores de 2 e 2 na tabela.
1

c (nvel de confiana)
5%

5%
90%

Ex.:
2
1

2
2

2
1

43

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

O Intervalo de confiana para a varincia populacional 2 dado por:


(n 1).s 2
2

< 2 <

(n 1).s 2
2

O intervalo de confiana para o desvio padro populacional dado por:


(n 1).s 2
2

< <

Tabela da Distribuio qui-quadrado


g.l.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100

0,995

0,99

0,010
0,072
0,207
0,412
0,676
0,989
1,344
1,735
2,156
2,603
3,074
3,565
4,075
4,601
5,142
5,697
6,265
6,844
7,434
8,034
8,643
9,262
9,886
10,520
11,160
11,808
12,461
13,121
13,787
20,707
27,991
35,534
43,275
51,172
59,196
67,328

0,020
0,115
0,297
0,554
0,872
1,239
1,646
2,088
2,558
3,053
3,571
4,107
4,660
5,229
5,812
6,408
7,015
7,633
8,260
8,897
9,542
10,196
10,856
11,524
12,198
12,879
13,565
14,257
14,954
22,164
29,707
37,485
45,442
53,540
61,754
70,065

0,975
0,001
0,051
0,216
0,484
0,831
1,237
1,690
2,180
2,700
3,247
3,816
4,404
5,009
5,629
6,262
6,908
7,564
8,231
8,907
9,591
10,283
10,982
11,689
12,401
13,120
13,844
14,573
15,308
16,047
16,791
24,433
32,357
40,482
48,758
57,153
65,647
74,222

0,950
0,004
0,103
0,352
0,711
1,145
1,635
2,167
2,733
3,325
3,940
4,575
5,226
5,892
6,571
7,261
7,962
8,672
9,390
10,117
10,851
11,591
12,338
13,091
13,848
14,611
15,379
16,151
16,928
17,708
18,493
26,509
34,764
43,188
51,739
60,391
69,126
77,929

(n 1).s 2
2

2 .

0,90
0,10
0,05
0,016
2,706
3,841
0,211
4,605
5,991
0,584
6,251
7,815
1,064
7,779
9,488
1,610
9,236 11,071
2,204 10,645 12,592
2,833 12,017 14,067
3,490 13,362 15,507
4,168 14,684 16,919
4,865 15,987 18,307
5,578 17,275 19,675
6,304 18,549 21,026
7,042 19,812 22,362
7,790 21,064 23,685
8,547 22,307 24,996
9,312 23,542 26,296
10,085 24,769 27,587
10,865 25,989 28,869
11,651 27,204 30,144
12,443 28,412 31,410
13,240 29,615 32,671
14,042 30,813 33,924
14,848 32,007 35,172
15,659 33,196 36,415
16,473 34,382 37,652
17,292 35,563 38,885
18,114 36,741 40,113
18,939 37,916 41,337
19,768 39,087 42,557
20,599 40,256 43,773
29,051 51,805 55,758
37,689 63,167 67,505
46,459 74,397 79,082
55,329 85,527 90,531
64,278 96,578 101,879
73,291 107,565 113,145
82,358 118,498 124,342

0,025
5,024
7,378
9,348
11,143
12,833
14,449
16,013
17,535
19,023
20,483
21,920
23,337
24,736
26,119
27,488
28,845
30,191
31,526
32,852
34,170
35,479
36,781
38,076
39,364
40,646
41,923
43,194
44,461
45,722
46,979
59,342
71,420
83,298
95,023
106,629
118,136
129,561

0,01
6,635
9,210
11,345
13,277
15,086
16,812
18,475
20,090
21,666
23,209
24,725
26,217
27,688
29,141
30,578
32,000
33,409
34,805
36,191
37,566
38,932
40,289
41,638
42,980
44,314
45,642
46,963
48,278
49,588
50,892
63,691
76,154
88,379
100,425
112,329
124,116
135,807

0,005
7,879
10,597
12,838
14,860
16,750
18,548
20,278
21,955
23,589
25,188
26,757
28,299
29,819
31,139
32,801
34,267
35,718
37,156
38,582
39,997
41,401
42,796
44,181
45,559
46,928
48,290
49,645
50,993
52,336
53,672
66,766
79,490
91,952
104,215
116,321
128,299
140,169

44

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Exemplo do uso da tabela:


Encontrar 2 e 2 para um g.l. = 15, com 90% de confiana.
1

Temos: c = 90% = 0,90


Ento: I) 1 =

1 c
1 0,90
=
= 0,05
Na tabela, com g.l. = 15 e = 0,05, obtemos:
2
2
2 = 24,996
1

1+ c
1+ 0,90
II) 2 =
=
= 0,95
Na tabela, com g.l. = 15 e = 0,95, obtemos:
2
2
2 = 7,261
2

Exemplo1: Uma amostra de 15 elementos, extrada de uma populao com distribuio


normal, forneceu varincia s2 = 7,05. Construir intervalos de confiana de 95% para a
varincia populacional e o desvio padro populacional.
Soluo: Temos: c = 95% = 0,95; n = 15; g.l. = n 1 = 15 1 = 14; s2 = 7,05
1 c
1 0,95
=
= 0,025
2
2
1+ c
1+ 0,95
II) 2 =
=
= 0,975
2
2

I) 1 =

Na tabela (distribuio 2), com g.l. = 14, 1 = 0,025 e 2 = 0,975, obtemos:

g.l.
0,995

0,99

0,975
0,001

0,950
0,004

0,90
0,016

0,10
2,706

0,05
3,841

0,025
5,024

0,01
6,635

0,005
7,879

---

---

---

---

---

---

---

---

---

---

---

14

4,075

4,660

5,629

6,571

7,790

21,064

23,685

26,119

29,141

31,139

2 = 26,119
1

e 2 = 5,629
2

Ento, teremos os intervalos:


I) O intervalo de 95% de confiana para a varincia populacional :
(n 1).s 2
2
1

< 2 <

(n 1).s 2

(15 1).7,05
(15 1).7,05
< 2 <
26,119
5,629

2
2

3,78 < 2 < 17,53

II) O intervalo de 95% de confiana para o desvio padro populacional :


(n 1).s 2
2
1

< <

3,78 < <

(n 1).s 2

17,53

2
2

(15 1).7,05
< <
26,119

(15 1).7,05
5,629

1,94 < < 4,19

Exerccios Resolvidos

45

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

1. Uma amostra de 40 elementos, extrada de uma populao normal, forneceu mdia


amostral x = 35,56 e desvio padro amostral de s = 3,50. Construir um intervalo de confiana
de 99% para a mdia populacional.
Soluo: Temos: n = 40; s = 3,50; c = 99% = 0,99
zc = 2,575 (vide p. 36)

I) E = zc .

s
n

= 2,575 .

II) x E < < x + E

3,50
40

E = 1,42

35,56 1,42 < < 35,56 + 1,42

34,14 < < 36,98

Portanto, com 99% de confiana, podemos dizer que a mdia populacional est entre
34,14 e 36,98.
2. Com os dados do exerccio anterior, determinar o tamanho requerido de uma amostra para
assegurar que, com confiana de 95%, a mdia amostral esteja dentro do intervalo de 1,0 da
mdia populacional.
Soluo: Temos: c = 95% = 0,95
zc = 1,96 (vide p. 36); E = 1,0; s = 3,5.
2

z .s
1,96 . 3,5
Ento: n = c =
= 47,05
1

n 48

3. Uma amostra extrada de uma populao normal forneceu os seguintes valores:

5,0
5,1
5,3
5,5
5,6
5,9
6,0
6,3
Construir:
a) Um intervalo de confiana de 90% para a mdia populacional;
b) Um intervalo de confiana de 90% para a varincia populacional e para o desvio padro
populacional.
Soluo:

n=8

xi
5,0
5,1
5,3
5,5
5,6
5,9
6,0
6,3
44,7

xi x
0,59
0,49
0,29
0,09
0,01
0,31
0,41
0,71

(xi x )2
0,3481 = 0,35
0,2401 = 0,24
0,0841 = 0,08
0,0081 = 0,01
0,0001 = 0,00
0,0961 = 0,10
0,1681 = 0,17
0,5041 = 0,50
1,4488 = 1,45

II) o desvio padro amostral : s =

Temos:
I) a mdia amostral : x =

xi
n

44,7
x =
= 5,59
8

( x i x )2
n 1

1,45
0,46
7

s = 0,46

a) sendo n = 8
g.l. = n 1 = 8 1
g.l. = 7
O uso de uma distribuio t, neste caso, apropriado porque a populao
considerada como normalmente distribuda, no conhecido, e a amostra
pequena (n < 30).
c = 90% = 0,90
tc = 1,895 (p. 41)
46

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

E = tc .

s
n

0,90

de confiana c
-------

nvel
0,50

g.l.

0,711

-------

1,895

= 1,895 .

0,46
8

x E<< x +E

Eurpedes MACHADO Rodrigues

E = 0,31

5,59 0,31 < < 5,59 + 0,31

5,28 < < 5,90

Portanto, com 90% de confiana, podemos dizer que a mdia populacional est entre
5,28 e 5,90.
b) Para a varincia e o desvio populacional, temos:
1 c
1 0,90
=
= 0,05
2
2
1+ c
1+ 0,90
2 =
=
= 0,95
2
2

2 = 14,067

1 =

2
2

(g.l. = n 1 = 7)

= 2,167

g.l.
0,995

0,99

0,975
0,001

0,950
0,004

0,90
0,016

0,10
2,706

0,05
3,841

0,025
5,024

0,01
6,635

0,005
7,879

---

---

---

---

---

---

---

---

---

---

---

0,989

1,239

1,690

2,167

2,833

12,017

14,067

16,013

18,475

20,278

Assim, temos:
I) O intervalo de confiana de 90% para a varincia populacional :
(n 1).s 2
2
1

< 2 <

(n 1).s 2

(8 1).0,46 2
(8 1).0,46 2
< 2 <
14,067
2,167

2
2

0,11 < 2 < 0,68

II) O intervalo de 95% de confiana para o desvio padro populacional :


(n 1).s 2
2

< <

0,11 < <

0,68

(n 1).s 2
2

(8 1).0,46 2
< <
14,067

(8 1).0,46 2
2,167

0,33 < < 0,82


MDULO 5 Testes de Hipteses

1. Introduo
Hiptese uma afirmao sobre um determinado parmetro. A aceitao ou a rejeio
de uma hiptese, ou seja, a tomada de uma deciso denominada de teste de hiptese.
O teste de hiptese empregado para se tomar decises sobre o valor de um parmetro
de uma populao tal como, sua mdia ou uma proporo da populao. Por exemplo, podese ter uma situao onde um grupo de pessoas deseja saber se o volume informado pelo
fabricante no rtulo das embalagens de leite mesmo verdadeiro, ou se todos esto sendo
lesados e ele faz o envasamento com uma quantidade menor do que a especificada. Outro
exemplo poderia ser a do departamento de engenharia que quer comprovar se os
componentes adquiridos de um fornecedor realmente tm uma vida til de 1000 horas como a
especificada em projeto.
47

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Tipicamente existem duas hipteses em um teste de hiptese. A hiptese nula e a


hiptese alternativa.
Hiptese nula: a hiptese a ser testada. Usamos a notao Ho para indicar a hiptese nula.
A hiptese nula expressa uma igualdade.
Hiptese alternativa: a hiptese a ser considerada como uma alternativa hiptese nula,
caso esta seja rejeitada. Usamos a notao Ha para indicar a hiptese alternativa. A hiptese
alternativa expressa uma desigualdade.

Por exemplo: no caso de latas de refrigerantes, a hiptese nula poderia ser:


Ho = o contedo mdio de todas as latas de refrigerante envasadas igual ao contedo
anunciado de 350 ml e a hiptese alternativa pode ser:
Ha = o contedo mdio de todas as latas de refrigerantes envasadas difere do contedo
anunciado de 350 ml.
Podemos indicar as hipteses do exemplo por:
Ho: = 350 ml (o envasamento est sendo feito corretamente)
Ha: 350 ml (o envasamento no est sendo feito corretamente).
A hiptese nula, em um teste de hiptese relacionado com a mdia de uma populao
, deve sempre especificar um nico valor para aquele parmetro. Isto significa que a
hiptese nula deveria ser sempre da forma = o, onde o algum valor pr-determinado.
Ho: = o
A hiptese alternativa, por outro lado, deve refletir o propsito do teste de hiptese em
questo. Existem trs possibilidades para a escolha da hiptese alternativa.
a) Teste bilateral: Se estivermos preocupados em decidir se a mdia de uma populao
, diferente de um valor especfico o. Neste caso expressamos a hiptese alternativa como:
Ha: o

b) Teste unilateral esquerda: Se quisermos comprovar que a mdia de uma populao


, menor do que um valor especfico o. Neste caso expressamos a hiptese alternativa
como:
Ha: < o
c) Teste unilateral direita: Se estivermos preocupados em decidir se a mdia de uma
populao , maior que um valor especfico o. Neste caso expressamos a hiptese
alternativa como:
Ha: > o
Exemplos:
48

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

a) Ho: = 1,65 m
Ha: 1,65 m

Dar origem a um teste


bilateral (ou bicaudal) .

b) Ho: = 1,65 m
Ha: > 1,65 m

Dar origem a um teste


unilateral (ou unicaudal) direita.

c) Ho: = 1,65 m
Ha: < 1,65 m

Dar origem a um teste


unilateral (ou unicaudal) esquerda.

Aps a definio das duas hipteses (nula e alternativa), devemos traar uma estratgia
que nos permita dizer qual das duas a verdadeira, precisamos estar aptos a dizer se
acatamos a hiptese nula ou se a rejeitamos em favor da hiptese alternativa.
De forma resumida, a estratgia a seguinte:
I) escolhemos uma amostra aleatria da populao;
II) fazemos uma comparao com a hiptese nula;
III) se os dados da amostra forem consistentes com esta, no rejeitamos a
hiptese nula;
IV) se os dados da amostra no forem consistentes com a hiptese nula,
rejeitamos a hiptese nula e assumimos que a hiptese alternativa
verdadeira.
2. Exemplo de aplicao do teste de hiptese
Uma empresa fabrica sabonetes de massa 90g. Para verificar se a mquina que os produz
est calibrada corretamente, uma amostra aleatria composta de 50 sabonetes foi retirada ao
longo de um dia. As massas dos sabonetes da amostra esto na tabela abaixo.

92
90
84
87
86

91
87
86
92
91

94
95
91
89
88

90
87
91
87
89

85
92
89
93
89

90
85
87
94
91

88
86
90
91
93

94
84
89
90
88

90
89
91
88
91

90
91
87
89
90

Os dados da amostra permitem concluir que a mquina que produz os sabonetes est
descalibrada? Use os seguintes passos para responder:
a)
b)
c)
d)

Escrever as duas hipteses para o teste de hiptese;


Discutir a idia bsica para realizar o teste de hiptese;
Obtenha um critrio preciso para decidir se rejeitamos ou no a hiptese nula;
Aplique o critrio e faa a concluso.

Soluo:
Seja a mdia de todos os sabonetes da empresa.
a) As duas hipteses podem ser escritas como:
Ho: = 90g
Ha: 90g
49

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

b) Basicamente, a idia de realizar um teste de hiptese a seguinte: Se a hiptese nula


verdadeira (isto , se = 90g), ento a mdia da amostra de 50 sabonetes deve ser
aproximadamente 90 gramas. natural que a mdia da amostra no seja realmente
igual mdia da populao, algum erro deve ser esperado. Entretanto, se a mdia
diferir muito do valor 90g ento estaremos inclinados a rejeitar a hiptese nula e
concluir que a hiptese alternativa verdadeira.
Da tabela (amostra de 50 sabonetes) podemos calcular a mdia da amostra:
x=

xi
n

4471
= 89,42g
50

x = 90 89,42 = 0,58g

A questo se a diferena de 0,58g entre a mdia hipottica da populao 90g e a


mdia da amostra 89,42g pode ser atribuda a um erro de amostragem ou se a
diferena grande o suficiente para indicar que a mdia da populao no 90g.
c) O critrio adotado foi o seguinte: Se a mdia x , dos 50 sabonetes coletados estiver
mais de dois (2) desvios padro distante da mdia da populao (90g), ento rejeite a
hiptese nula, = 90g, e conclua que a hiptese alternativa, 90g verdadeira.
Caso contrrio, no rejeite a hiptese nula.
Utilizando o Teorema do Limite Central, que nos diz que, se a amostra grande
(n 30) ento a varivel aleatria x aproximadamente normal com mdia e desvio
padro dados por:
Na tabela da distribuio normal z, com
zo = 2, obtemos rea igual a 0,4772.
Ento, de zo = 2 zo = 2, termos:
= 0,9544
= 2 . 0,4772

0,9544

x 2 x
2

x + 2 x
2

x
z

Com base neste fato podemos dizer, por exemplo, que a probabilidade da mdia x
estar em um intervalo de dois desvios padres da mdia da populao de 0,9544,
ou ainda, que a probabilidade da mdia da amostra estar fora deste intervalo de
apenas 1 0,9544 = 0,0456, como mostrado na figura acima. Podemos usar este fato
como um critrio para decidir se devemos ou no rejeitar a hiptese nula.
Especificamente, se a mdia da amostra retirada da populao estiver dentro do
intervalo ento podemos atribuir a diferena encontrada a um erro de amostragem e,
assim, aceitar a hiptese nula. Por outro lado, se a mdia da amostra estiver distante
mais de dois (2) desvios padres da mdia da populao de 90g, ento podemos
concluir que a hiptese nula verdadeira e um evento extremamente improvvel
ocorreu durante a coleta da amostra ou que a hiptese nula falsa (o que muito mais
razovel) e que a hiptese alternativa verdadeira.
Grfico correspondente ao exerccio:
50

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

No rejeite Ho
Rejeite Ho

Rejeite Ho
0,9544

0,0228

90 2 x

90

0,0228

90 + 2 x
2

A probabilidade de rejeitar Ho apenas 0,0456, como pode ser visto na figura acima.
Esta probabilidade denominada nvel de significncia do teste de hiptese.
d) Finalmente, aplicando o critrio adotado aos dados coletados da amostra, podemos
colocar nossa concluso. Assumiremos que o desvio padro da populao seja
conhecido e igual a = 2,7 gramas (s =

( x i x)2
n 1

342,18
2,7g). Para aplicar o
49

critrio da parte (c) necessitamos determinar quantos desvios padres a mdia da


amostra se desvia (ou se afasta) da mdia da populao. Isto feito determinando-se o
valor da varivel aleatrio padro.
Sabemos que = 2,7 gramas, n = 50 e, da parte (b), que a mdia da amostra
x = 89,42 gramas podemos calcular o valor de z.
z=

x
90 89,42
=
= 1,52

2,7
n

50

Como a mdia dos 50 sabonetes encontra-se a menos de 2 desvios padres da mdia


90 gramas, decidimos aceitar a hiptese nula e concluir que a hiptese alternativa,
90 gramas falsa. Em outras palavras, os dados proporcionam evidncia suficiente
para concluir que a mquina est trabalhando corretamente.
Esse procedimento de deciso pode levar a uma concluso equivocada que pode ser
de dois tipos. Uma ocorre quando rejeitamos a hiptese nula e aceitamos a hiptese
alternativa, porm erroneamente, pois a hiptese nula era verdadeira, esse tipo de erro
chamado de erro tipo I. Tambm possvel ocorrer de aceitarmos a hiptese nula
quando ela falsa, esse erro denominado erro tipo II.
As probabilidades desses dois tipos de erros so designadas, respectivamente,
por e .
Resultados possveis de um teste de hiptese.
Realidade
Ho verdadeira
Ho falsa
Aceitar Ho deciso correta (1 )
erro tipo II ()
Deciso
Rejeitar Ho
erro tipo I ()
deciso correta (1 )
51

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Nvel de significncia Ao testar uma hiptese, a probabilidade mxima de ocorrer


um erro tipo I denominada nvel de significncia do teste. Essa probabilidade,
representada freqentemente por , geralmente especificada antes da extrao de
quaisquer amostras, de modo que os resultados obtidos no influenciem a escolha.
Na prtica, usual a adoo de um nvel de significncia de 5% ou 1%, embora
possam ser usados outros valores. Se usarmos um nvel de significncia 0,05 ou 5%
haver ento cerca de 5 probabilidades em 100, da hiptese nula ser rejeitada, quando
deveria ser aceita, isto , h uma confiana de 95% de que a deciso tomada foi acertada.

Tabela com alguns valores de :


0,10
0,05

z0,10
z0,05
z
Valores
1,28
1,645
crticos de z

0,025
z0,025

0,01
z0,01

0,005
z0,005

1,96

2,33

2,575

3. Teste de hiptese par mdia de uma populao - grandes amostras (n 30)

Descrevemos a seguir um procedimento para aplicao do teste de hiptese para a mdia


de uma populao.
Condio: O tamanho da amostra grande (n 30).
Passo 1 Escreva as hipteses nula e alternativa;
Passo 2 Defina o nvel de significncia ;
Passo 3 Determine o(s) valor(es) crtico(s):
a) Para teste bilateral z/2
b) Para teste unilateral esquerda z
c) Para teste unilateral direita z
Use a tabela da distribuio normal padro:
Rejeite
Ho

z/2

No rejeite Ho Rejeite
Ho

Rejeite No rejeite Ho
Ho

z/2

Bilateral

No rejeite Ho

Unilateral esquerda

Passo 4 Calcule o valor da estatstica de teste: z =

Rejeite
Ho

Unilateral direita

x o

Passo 5 Se o valor da estatstica de teste cair na regio de rejeio, ento


rejeite Ho; caso contrrio, no rejeite Ho;
Passo 6 D sua concluso.
52

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Exemplo 1 Uma empresa de coleta de informaes verificou que em 2003, o preo mdio
das refeies em restaurantes da cidade de So Paulo era de R$ 28,44. Neste ano realizouse uma pesquisa em 40 restaurantes, aleatoriamente escolhidos, e foram obtidos os valores
da tabela abaixo. Os dados fornecidos proporcionam evidncia suficiente para concluir que o
preo mdio deste ano dos restaurantes da cidade de So Paulo aumentou com relao
mdia de R$ 28,44 de 2003? Realize o teste apropriado com nvel de significncia de 1%.

Tabela de preo mdio das refeies (por pessoa) nos restaurantes de


So Paulo neste ano.
35
32
39
33
18

37
33
25
25
28

33
48
28
35
32

26
27
31
32
36

50
20
36
41
22

32
24
32
36
34

30
33
26
45
26

30
31
41
27
21

Soluo:
Como a amostra considerada grande (n 30), podemos aplicar o procedimento descrito
acima.
Passo 1 Escreve as hipteses nula e alternativa.
O teste em questo ser do tipo unilateral direita.
Ho: = 28,44 (o preo mdio no aumentou)
Ha: > 28,44 (o preo mdio aumentou)
Passo 2 Defina o nvel de significncia .
O nvel de significncia pedido de 1%. Assim, = 0,01.
Passo 3 Determine o(s) valor(re) crtico(s).
Para = 0,01, o valor crtico ser z0,01. Da tabela, obtemos: z0,01 = 2,33

z
Valores
crticos de z

0,10
z0,10

0,05
z0,05

0,025
z0,025

0,01
z0,01

0,005
z0,005

1,28

1,645

1,96

2,33

2,575

Portanto, o valor crtico 2,33, conforme mostrado na figura:


No rejeite Ho

Rejeite Ho
rea de 0,01

2,33

Unilateral direita

2,94

53

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Passo 4 Clculo do valor da estatstica de teste: z =

x o
s
n

Sabemos que o = 28,44 e n = 40. Calculando a mdia e o desvio padro da


amostra, encontramos:
x=

xi
n

1270
= 31,75 e s =
40

( x i x)2
n 1

1979,48
7,12
39

Assim, o valor da estatstica de teste :


z teste =

x o
31,75 28,44
=
= 2,94
s
7,12
n

40

Esse valor de z est marcado na figura acima por um ponto prximo do valor z
tabelado 2,33.
Passo 5 Se o valor de estatstica de teste cair na regio de rejeio, ento rejeite Ho;
caso contrrio, no rejeite Ho.

O valor da estatstica de teste encontrado de 2,94. Como pode ser visto no


grfico correspondente (figura acima), esse valor cai na regio de rejeio e, assim, ns
devemos rejeitar a hiptese nula Ho e aceitar a hiptese alternativa Ha.
Passo 6 D sua concluso.
Os dados proporcionam evidncia suficiente para concluir que o preo mdio
dos restaurantes da cidade de So Paulo aumentou com relao ao preo mdio de 2003.
Exemplo 2 Uma fbrica anuncia que o ndice de nicotina dos cigarros da marca X
apresenta-se abaixo de 26mg por cigarro. Um laboratrio realiza 10 anlises do ndice
obtendo a mdia de 25,3mg.
Sabe-se que o ndice de nicotina dos cigarros da marca X se distribui normalmente com
desvio padro 2,32mg. Pode-se aceitar a afirmao do fabricante, ao nvel de 5%?
Soluo: Temos: n = 10; o = 26; x = 25,3 e = 2,32.

1) O teste em questo ser unilateral esquerda.


Ho: = 26 (o nvel de nicotina no abaixou)
Ha: < 26 (o nvel de nicotina abaixou)
2) O nvel de significncia pedido de 5%, ou seja, = 5% = 0,05.
3) O valor crtico ser: z0,05 = 1,645 (tabela p.52)
4) Clculo do valor da estatstica de teste: z =

x o
25,3 26
=
= 0,954

2,32
n

10
54

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Rejeite
Ho

Anotaes de Aula

Eurpedes MACHADO Rodrigues

No rejeite Ho

Como zcalc pertence a regio de no rejeitar Ho,


no se rejeita Ho, isto , ao nvel de 5%,
podemos concluir que a afirmao do fabricante
falsa.

0,05
95%

1,645

0
zcalc = 0,954

Exemplo 3 De uma populao normal com desvio padro 6, toma-se uma amostra casual
de tamanho 16, obtendo-se x = 43. Ao nvel de 10%, teste as hipteses:
Ho: = 45
Ha: 45
Soluo:
As hipteses j esto definidas. O nvel de significncia de 10%, ou seja, = 10% = 0,10.
A amostra de tamanho n = 16 , a estimativa da mdia j foi calculada, isto , x = 43 e = 6
Como o teste para mdia de populaes normais com desvio padro conhecido,
usaremos a varivel z como critrio.
Temos:
1) Como o teste em questo do tipo bilateral, ento o valor de se divide
igualmente nas caudas, ou seja:
= 0,10
/2 = 0,05
z0,05 = 1,645 (tabela p.52)

2) z calc =

x o
43 45
=
= 1,33

6
n

Rejeite
Ho

16

No rejeite Ho
Rejeite
Ho
= 0,05

0,05 =

1,645

Como zcalc pertence a regio de no


rejeitar Ho, no se rejeita Ho, isto , a
mdia 45, com 10% de risco de no
rejeitarmos uma hiptese falsa.

1,645

zcalc = 1,33

4. Teste de hiptese para uma populao normal (n < 30)

Em muitos casos no possvel ou no econmico coletar uma amostra grande.


Estudaremos um mtodo que no requer amostras grandes, porm requer que a populao
sendo amostrada seja normalmente distribuda. Como na maioria dos problemas no
conhecemos o desvio padro populacional (), utilizaremos para a realizao do teste o
desvio padro da amostra estudada (s).

55

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Vimos no captulo anterior que se tomarmos uma amostra de tamanho n de uma populao
normalmente distribuda com mdia , a varivel aleatria tem uma distribuio t com (n -1)
graus de liberdade. Em outras palavras, as probabilidades para aquela varivel aleatria so
iguais s reas sob a curva t com g.l. = n 1. Conseqentemente, quando a populao
amostrada normalmente distribuda, ns podemos realizar um teste de hiptese com a
hiptese nula Ho: = o, empregando a varivel aleatria acima como nossa estatstica de
teste e usando a tabela da distribuio t para obter o valor crtico (ou valores crticos).
Procedimento para aplicao do Teste de hiptese par a mdia de uma populao
com amostras de tamanho n < 30:

Condio: Populao Normal


Passo 1 Escreva as hipteses: nula e alternativa;
Passo 2 Defina o nvel de significncia ;
Passo 3 Determine o(s) valor(es) crtico(s)
a) Para teste bilateral t/2
b) Para teste unilateral esquerda t
c) Para teste unilateral direita t.
Com g.l. = n 1, use a tabela da distribuio t de Student da p.58
Rejeite
Ho

t/2

No rejeite Ho Rejeite
Ho

Rejeite No rejeite Ho
Ho

t/2

Bilateral

No rejeite Ho

Unilateral esquerda

Passo 4 Calcule o valor da estatstica de teste: t =

Rejeite
Ho

Unilateral direita

x o
s
n

Passo 5 Se o valor da estatstica de teste cair na regio de rejeio, ento rejeite Ho;
caso contrrio no rejeite Ho.
Passo 6 D sua concluso.
Exemplo 1 Assuma que a mdia de gasto com combustvel de todas as famlias de uma
certa regio seja de R$ 1123,00 em um determinado ano. Neste mesmo ano, coletando-se
uma amostra aleatria de 15 famlias de classe mdia alta obteve-se os valores mostrados na
tabela abaixo, arredondados para o inteiro mais prximo. Com um nvel de significncia de
5%, os dados indicam que famlias da classe mdia alta gastam, em mdia, em combustvel
mais do que a mdia da regio de R$ 1123,00? (Assuma que a distribuio de gasto com
combustvel das famlias da classe mdia alta seja normalmente distribuda).
56

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Tabela dos gastos com combustvel (R$)


1254
1615
1711

1350
1521
1293

1227
908
1205

1154
1231
1351

1790
1369
1185

Soluo:
Uma vez que a populao em questo normalmente distribuda, podemos aplicar o
procedimento abaixo para realizar o teste de hipteses.

Passo 1 Escreva as hipteses nula e alternativa.


O teste em questo ser do tipo unilateral direita.
Ho: = 1123 (a mdia no maior que a mdia nacional)
Ha: > 1123 (a mdia maior que a mdia nacional)
Passo 2 Defina o nvel de significncia
O nvel de significncia pedido de 5%. Assim, = 0,05.
Passo 3 Determine o(s) valor(es) crtico(s).
O valor crtico par um teste unilateral direita t, com g.l. = n 1.
Neste caso, n = 15. Logo, g.l. = 15 1 = 14, com = 0,05.
Da tabela (p.58), obtemos t0,05 = 1,761
Passo 4 Calcule o valor da estatstica de teste: t =

x o
s
n

Sabemos que o = 1123 e n = 15. Da tabela dos gastos com


combustveis determinamos que: x = 1344,27 e s = 231. Assim,
temos: t =

x o
1344,27 1123
=
= 3,7098... 3,710
s
231
n

15

Passo 5 Se o valor da estatstica de teste cair na regio de rejeio, ento


rejeite Ho; caso contrrio no rejeite Ho.
O valor encontrado igual a 3,710 e este valor cai dentro da regio
de rejeio de Ho. Assim, rejeitamos Ho.
Passo 6 D sua concluso.
Os dados proporcionam a evidncia suficiente para concluir que
famlias da classe mdia alta gastaram mais com combustveis do
que a mdia nacional.

57

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

58

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

MDULO 6 Teste de Hipteses com duas amostras


Teste de hiptese para mdias de duas populaes

Quando temos duas populaes com amostras grandes e independentes, podemos fazer
inferncia estatstica sobre as mdias das populaes. Duas amostras so independentes se
a amostra retirada de uma populao no interfere na amostra retirada da outra populao.
O problema consiste em comparar as mdias de duas populaes para decidir se existe
alguma diferena entre elas. A lgica para se fazer esta comparao pode ser resumida como
mostrado na figura abaixo:
Populao 1
1
1

Populao 2
2
2

Amostra 1

Amostra 2

Calcule mdia 1

Calcule mdia 2

Compare a mdia 1
com a mdia 2.
Tome uma deciso.

Uma amostra grande (n 30) retirada aleatoriamente de cada populao. As mdias das
amostras so calculadas e comparadas, levando a uma concluso de que as mdias no so
iguais se houver uma diferena significativa entre elas.
O procedimento adotado para realizar um teste de hiptese para as mdias de duas
populaes similar ao adotado anteriormente para uma nica populao. Os principais
pontos do procedimento so:
1. Como temos duas populaes com mdias 1 e 2 e desejamos saber se existe
diferena entre elas. A hiptese nula :
Ho: 1 = 2 (as mdias coincidem)
2. Retiramos uma amostra de cada uma das populaes e calculamos as mdias.
A diferena observada x 1 x 2 , agora, a estatstica de teste (em vez de x da
seo anterior).
3. Se retirssemos todas as possveis amostras de tamanho n1 e n2 das duas
populaes, ns teramos uma distribuio das diferenas entre as mdias das
amostras. Se as amostras so grandes, o Teorema do Limite Central nos
permite assumir que a distribuio da amostragem aproximadamente normal.
59

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

4. Se a hiptese nula Ho: 1 = 2 verdadeira, ento a mdia da distribuio das


diferenas das mdias das amostras deve ser zero, como mostrado na figura:
/2

/2
|

x a xb

1 2 = 0

O prximo passo localizar a estatstica de teste ( x 1 x 2 ) nesta distribuio e


verificar onde ela cai relativo mdia zero assumida.
5. Para localizar a estatstica de teste na distribuio necessitamos calcular o
desvio padro da distribuio. Podemos provar que o desvio padro dado por
x1 x 2 = ( x1 )2 + ( x2 )2 =

12 22

+
n1 n 2

6. Como os valores das varincias das duas populaes so raramente conhecidos,


podemos usar as varincias das amostras como estimadores ou estimativas das
varincias das populaes para calcular uma estimativa do desvio padro. Para
isso, basta substituir por s na frmula anterior.
s2 s2
s x1 x 2 = 1 + 2
n1 n 2

7. A localizao da estatstica da amostra x1 x 2 , relativa mdia da distribuio, pode


ser encontrada calculando-se o valor de z.

z=

( x1 x 2 ) 0
s
x1 x 2

8. Se a estatstica de teste cair na regio de rejeio ento rejeite Ho; caso


contrrio, no rejeite Ho.
Procedimento para aplicao do Teste de hiptese para aa mdias de duas
populaes:

Hiptese nula Ho: 1 = 2


Condies: Grandes amostras (n1 30, n2 30) e amostras independentes.
Passo 1 Escreva as hipteses nula e alternativa;
Passo 2 Defina o nvel de significncia ;
Passo 3 Determine o(s) valor(es) crtico(s):
a) Para teste bilateral z/2
b) Para teste unilateral esquerda z
c) Para teste unilateral direita z.
60

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Use a tabela da distribuio normal padro.


Rejeite
Ho

z/2

No rejeite Ho Rejeite
Ho

Rejeite No rejeite Ho
Ho

z/2

No rejeite Ho

Unilateral esquerda

Bilateral

Rejeite
Ho

Unilateral direita

Passo 4 Calcule o valor da estatstica de teste

z=

s2 s2
( x1 x 2 )
, com s x1 x 2 = 1 + 2
n1 n 2
s

x1 x 2

Passo 5 Se o valor da estatstica de teste cair na regio de rejeio, ento


rejeite Ho; caso contrrio, no rejeite Ho.
Passo 6 D sua concluso.
Exemplo 1 Deseja-se verificar se existe diferena entre os salrios pagos a engenheiros
que atuam na regio Sul e Sudeste do pas atravs de um teste de hipteses. Para isso,
selecionou-se aleatoriamente 30 engenheiros da regio Sul e, com base em seus salrios
anuais, determinou-se a mdia e seus salrios como sendo R$ 46.720,00 com desvio padro
de R$ 14.700,00. O mesmo procedimento foi adotado para 35 engenheiros da regio Sudeste
obtendo-se mdia de R$ 51.910,00 e desvio padro R$ 16.200,00. O teste de hiptese deve
ser feito com nvel de significncia igual a 5%.
Soluo:
Passo 1 Definir as hipteses nula e alternativa.
Seja 1 a mdia salarial dos engenheiros da regio Sul e 2 a mdia salarial dos
engenheiros da regio Sudeste. As hipteses nula e alternativa podem ser escritas como:
Ho: 1 = 2 (as mdias salariais coincidem)
Ha: 1 2 (as mdias salariais so diferentes)
Passo 2 O nvel de significncia foi definido em 5%.
Passo 3 Os valores crticos de z para = 0,05 so definidos como z/2
Da tabela da curva normal de z, p.52, determinamos z0,05/2 = z0,025 = 1,96
Passo 4 Clculo do valor da estatstica de teste.
s x1 x 2

s12 s 22
=
=
+
n1 n 2

zteste =

14700 2 16200 2

= 3834,23
+
30

35

( x1 x 2 )
46720 51910
=
= 1,35
s
3834,23
x1 x 2

61

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Rejeite
Ho

Eurpedes MACHADO Rodrigues

No rejeite Ho

Rejeite
Ho
= 0,025

0,025 =
1,96

1,96

1,35

Passo 5 Na figura observamos que o valor zcalc = 1,35 no cai dentro da regio
de rejeio. Assim, ns no rejeitamos a hipteses nula Ho.
Passo 6 D sua concluso.
Baseado nos dados da amostra ns no temos evidncia suficiente para
concluir que existe uma diferena entre as mdias salariais dos engenheiros das regies Sul e
Sudeste.
EXERCCIOS RESOLVIDOS
01. Uma amostra de 80 elementos, extrada de uma populao aproximadamente normal
cujo desvio padro s = 2,8, forneceu mdia x = 45,8. Construir um intervalo de
confiana de 95% para a mdia dessa populao.
Resoluo: Temos: n = 80; s = 2,8; x = 45,8; c = 0,95
Tabela: zc = 1,96

E = zc .

s
n

= 1,96 .

x E<< x +E

2,8
80

= 0,6
45,2 < < 46,4

45,8 0,6 < < 45,8 + 0,6

02. Em uma clnica de endocrinologia, uma amostra de 40 pacientes foi observada. Depois
de uma semana de dieta foram medidos os pesos que cada um dos pacientes perdeu,
obtendo-se a tabela.
Classes de
pesos
1,0 |--- 1,5
1,5 |--- 2,0
2,0 |--- 2,5
2,5 |--- 3,0
3,0 |--- 3,5
3,5 |--- 4,0

N de
pacientes (fi)
5
6
10
8
6
5
40

xi = PM

xi . fi

xi x

(xi x )2. fi

1,25
1,75
2,25
2,75
3,25
3,75

6,25
10,5
22,5
22
19,5
18,75
99,5

1,24
0,74
0,24
0,26
0,76
1,26

7,69
3,29
0,58
0,54
3,47
7,94
23,51

Construa um intervalo de confiana de 90% para a mdia populacional da quantidade


de peso perdido pelos pacientes desta clnica.
Resoluo:

x i .fi
x=
n

99,5
x=
= 2,49;
40

s=

( x i x)2 .fi
n 1

23,51
=
40 1

23,51
= 0,77
39
62

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

c = 90% = 0,90

Eurpedes MACHADO Rodrigues

Tabela: zc = 1,645;

x E<< x +E

E = zc .

s
n

= 1,645 .

0,77
40

= 0,20

2,29 < < 2,69

2,49 0,20 < < 2,49 + 0,20

03. Uma amostra de 10 peas forneceu os seguintes valores da largura em cm:

7,5

7,8

7,6

7,5

7,0

6,9

7,2

7,1

7,0

7,4

a) Determine um intervalo de confiana de 90% para a mdia populacional;


b) Determine um intervalo de confiana de 99% para a mdia populacional;
c) Construir um intervalo de confiana de 95% para o desvio padro populacional.
Resoluo: Temos: n = 10
(xi x )2
0,04
0,25
0,09
0,04
0,09
0,16
0,01
0,04
0,09
0,01
0,82

xi x
0,2
0,5
0,3
0,2
0,3
0,4
0,1
0,2
0,3
0,1

xi
7,5
7,8
7,6
7,5
7,0
6,9
7,2
7,1
7,0
7,4
= 73

x=

s=

xi
n

73
= 7,3
10

( x i x)2
n 1

0,82
=
10 1

0,82
= 0,30
9

Como n = 10 (n < 30) e no conhecido, usamos a tabela t de Student com grau


de liberdade g.l. = n 1 = 10 1 = 9.
a) c = 90% = 0,90
g.l.
--9

nvel
0,50
--0,703

E = tc .

s
n

de confiana c
---------------

= 1,833 .

x E<< x +E

b) c = 99% = 0,99
E = tc .

s
n

Tabela: tc = 1,833

= 3,250 .

x E<< x +E

0,30
10

0,90
--1,833

0,95
--2,262

0,99
--3,250

= 0,17

7,3 0,17 < < 7,3 + 0,17

7,13 < < 7,47

Tabela: tc = 2,262
0,30
10

= 0,31

7,3 0,31 < < 7,3 + 0,31

6,99 < < 7,61

c) O intervalo de 95% de confiana para o desvio padro populacional dado

63

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

por

Anotaes de Aula

(n 1).s 2

(n 1).s 2

< <

Eurpedes MACHADO Rodrigues

, em que:

1 c
1 0,95
=
= 0,025
2
2
1+ c
1+ 0,95
II) 2 =
=
= 0,975
2
2

I) 1 =

Na tabela (distribuio 2), com g.l. = 9, 1 = 0,025 e 2 = 0,975, obtemos:

g.l.
1
--9

0,995

0,99

--1,735

--2,088

0,975
0,001
--2,700

0,950
0,004
--3,325

2 = 19,023
1

Portanto:

(n 1).s 2
2

0,90
0,10
0,05 0,025 0,01 0,005
0,016 2,706 3,841 5,024 6,635 7,879
------------4,168 14,684 16,919 19,023 21,666 23,589

e 2 = 2,700
2

(n 1).s 2

<<

9.0,30 2
9.0,30 2
< <
19,023
2,7

0,21 < < 0,55

04. As alturas dos alunos do sexo masculino de uma Universidade apresentam distribuio
normal. Para estimar a altura mdia dessa populao, foram observadas as alturas de
100 alunos, obtendo-se x = 170 cm e s = 20 cm. Determine um intervalo de confiana
de 95% para a mdia populacional.
Resoluo: Temos: n = 100 (n 30); x = 170 e s = 20
c = 95% = 0,90
zc = 1,96

E = zc .

s
n

= 1,96 .

x E<< x +E

20
100

= 3,92

170 3,92 < < 170 + 3,92

166,08 < < 173,92

05. Uma empresa diz que a vida mdia das lmpadas fabricadas por elas de 1800 horas.
Para que ela no corra o risco de sofrer punio do rgo fiscalizador, seu
departamento de controle de qualidade realiza testes freqentes com amostras
retiradas da linha de produo. Sabendo-se que a empresa s seria autuada caso as
lmpadas tivessem uma vida til inferior a 1800 horas, determine baseando na amostra
indicada abaixo, com um nvel de significncia igual a 5%:
a) A mdia e o desvio padro da amostra;
b) O valor da estatstica de teste;
c) A empresa corre os risco de ser autuada por no cumprir o nmero mdio de
horas divulgado?
64

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Tabela do nmero de horas


1700
1700
1710

1750
1820
1700

1720
1810
1790

1810
1620
1750

1800
1815
1690

1790
1800
1830

1850
1780
1780

1810
1760
1790

1600
1500
1820

1800
1740
1800

Resoluo:
Horas (xi)
1500
1600
1620
1690
1700
1710
1720
1740
1750
1760
1780
1790
1800
1810
1815
1820
1830
1850

xi . f i
1500
1600
1620
1690
5100
1710
1720
1740
3500
1760
3560
5370
7200
5430
1815
3640
1830
1850
52635

fi
1
1
1
1
3
1
1
1
2
1
2
3
4
3
1
2
1
1
30

xi x
-254,5
-154,5
-134,5
-64,5
-54,5
-44,5
-34,5
-14,5
-4,5
5,5
25,5
35,5
45,5
55,5
60,5
65,5
75,5
95,5

(xi x )2. fi
64770,25
23870,25
18090,25
4160,25
8910,75
1980,25
1190,25
210,25
40,50
30,25
1300,50
3780,75
8281
9240,75
3660,25
8580,50
5700,25
9120,25
172917,5

a) x =

x i . fi = 52635
n

30

x = 1754,5 horas
2

s =

fi .( x i x)2
n 1

s2 = 5962,67

172917,5
30 1

s=

5962,67

s = 77,22 h ou s = 77,2 h
b) z =

x 1754,5 1800
=
s
77,2
n

30

z = 3,22

c) Temos: n = 30; o = 1800; x = 1754,5;


s = 77,2 e zteste = 3,22
1) O teste em questo ser unilateral esquerda.
Ho: = 1800 h
Ha: < 1800 h
2) O nvel de significncia pedido de 5%, ou seja, = 5% = 0,05.
3) O valor crtico ser: z0,05 = 1,645 (tabela p.52)
Rejeite
Ho

No rejeite Ho

0,05
95%

1,645 0

Como zcalc pertence regio de rejeio de Ho,


rejeita Ho, isto , ao nvel de 5%, podemos
concluir que a empresa corre os risco de ser
autuada por no cumprir o nmero mdio de
horas divulgado.

zcalc = 3,22

65

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

06. A carga esttica suportada por cabos utilizados na prtica de alpinismo apresenta a
mdia de 1800 kg e o desvio padro de 100 kg. Com o desenvolvimento de uma nova
fibra o fabricante afirma ter aumentado a capacidade de carga dos cabos. Para testar a
veracidade da informao, ensaiou-se uma amostra de 50 cabos. A carga mdia
suportada pelos novos cabos foi de 1850 kg. Pergunta:
a) Qual o valor da estatstica de teste?;
b) Pode-se confirmar a declarao de que a nova fibra mais resistente?
Resp.: a) z = 3,54
b) Sim
Utilize um nvel de significncia de 1%.
Resoluo: Temos: = 1800 kg; = 100 kg; n = 50 (n 30) e x = 1850 kg.

a) z =

x 1850 1800
=

100
n

zcalc. = 3,54

50

b)1) O teste em questo ser unilateral direita.


Ho: = 1800 kg
Ha: > 1800 kg
2) O nvel de significncia pedido de 1%, ou seja, = 1% = 0,01.
3) O valor crtico ser: ztab. = z0,01 = 2,33 (tabela p.52)
No rejeite Ho

Rejeite Ho
rea de 0,01

2,33

zcalc = 3,54

O valor da estatstica de teste encontrado z = 3,54. Como pode ser


visto no grfico correspondente (figura acima), esse valor cai na regio
de rejeio de Ho e, assim, devemos rejeitar a hiptese nula Ho e
aceitar a hiptese alternativa Ha, que afirma que a nova fibra mais
resistente.
07. A altura mdia dos jogadores que participam da liga nacional de vlei 196 cm. Um
dos times participantes tem 12 jogadores com estatura mdia de 190 cm e desvio
padro 12 cm. Podemos afirmar com base nesses dados, que os jogadores do referido
time so mais baixos do que a mdia nacional? Utilize um nvel de significncia de
0,01.
Resoluo: Temos: = 196 cm; s = 12 cm; n = 12 (n < 30) e x = 190 cm.

I) O teste em questo ser unilateral esquerda.


Ho: = 196
Ha: < 196
66

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

II) Como n = 12 (n < 30) e no conhecido, usamos a tabela t de Student com


grau de liberdade g.l. = n 1 = 12 1 = 11. (vide p. 58)
III) O nvel de significncia : = 0,01
IV) A estatstica de teste : tcalc. =

Rejeite
Ho

No rejeite Ho

0,01

2,718

Tabela: t0,01 = 2,718

x 190 196
=
= 1,732
s
12
n
12

Como o valor da estatstica do teste caiu na


regio de no rejeio de Ho, no podemos
rejeitar Ho, ou seja, podemos afirmar com base
nesses dados, que os jogadores do referido time
tm estatura igual mdia nacional.

t = 1,732

MDULO 7
TESTE DE QUI-QUADRADO E TESTE F
I. Teste de Qui-Quadrado.

O teste de Qui-Quadrado verifica as hipteses de aderncia e de independncia.


O teste de aderncia mostra se os dados coletados experimentalmente se ajustam de
modo adequado a uma dada teoria, com determinado grau de certeza.
O teste de Independncia mostra se duas ou mais variveis esto ou no vinculadas
entre si por uma relao de dependncia, para determinado grau de certeza.
Teste de Qui-Quadrado Aderncia.
O teste de Qui-Quadrado de aderncia compara os dados coletados experimentalmente
com os dados que seriam obtidos pela aplicao de determinada lei, ou seja, o teste tem
interesse em verificar se a distribuio dos elementos, numa populao, est de acordo com
uma dada teoria. Essas comparaes podem gerar diferenas grandes ou diferenas
pequenas.

Sejam:
Ho: hiptese nula (hiptese que ser testada)
Ha: hiptese alternativa (hiptese que substitui Ho caso a mesma seja rejeitada).

67

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Exemplo 1 No lanamento de uma moeda honesta, a probabilidade de sair cara 0,5


(50%) e de sair coroa 05, (50%). Nesse caso, a referida teoria (ou lei) pode ser dada pela
probabilidade P(cara) = 0,5.
Assim, podemos obter as hipteses:
Ho: P(cara) = 0,5
Ha: P(cara) 0,5
Concluso:
Para grandes diferenas: Ho dever ser rejeitada e deve ser utilizada Ha;
Para pequenas diferenas: Ho no deve ser rejeitada e as diferenas verificadas
so atribudas ao acaso.

A avaliao quantitativa das diferenas pode ser obtida elevando-as ao quadrado e


dividindo-as pelos resultados teoricamente esperados pela lei em estudo. A soma dos
referidos quocientes gera o parmetro o2. A deciso final (ou seja, verificar se a hiptese Ho
deve ou no ser rejeitada) norteada pela comparao entre o2 e t2, que pode ser
localizado na tabela Qui-Quadrado, para determinado nvel de significncia (p. 44).
Exemplo 2 Em 50 lanamentos de uma moeda foram observados os seguintes resultados:
28 caras e 22 coroas. Que concluses podem ser obtidas desses dados ao nvel de
significncia = 5%?

Etapas para se calcular o2 :


Resultado
observado
Cara: 28
Coroa: 22

Resultado
esperado
(moeda honesta)
Cara: 25
Coroa: 25

Diferena entre o
resultado observado e
o resultado esperado.
28 25 = 3
22 25 = 3

Quadrado da
diferena
(3)2 = 9
(3)2 = 9

Quociente entre o
quadrado da diferena e o
resultado esperado.
9/25 = 0,36
9/25 = 0,36

A soma dos quocientes entre o quadrado das diferenas e os resultados esperados


fornece o valor o2 = 0,36 + 0,36 = 0,72.
Para o teste de Aderncia, calcula-se o nmero de graus de liberdade (g.l.) subtraindo 1
do nmero de linhas da tabela de dados, ou seja: g.l. = (n de linhas 1). No caso, a tabela de
dados apresenta duas linhas com dados experimentais, logo, g.l. = 2 1 = 1.
Na tabela de Qui-Quadrado p.44, localizamos o parmetro t2 correspondente ao nvel
de significncia estabelecido ( = 5% = 0,5) com grau de liberdade calculado (g.l. = 1):

g.l.
0,995

0,99

0,975
0,001

0,950
0,004

0,90
0,016

0,10
2,706

0,05
3,841

0,025
5,024

0,01
6,635

0,005
7,879

---

---

---

---

---

---

---

---

---

---

70,065

74,222

77,929

1
---

100 67,328

82,358 118,498 124,342 129,561 135,807 140,169

Temos: t2 = 3,841
68

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Como o2 (0,72) < t2 (3,841), a hiptese Ho no rejeitada, ou seja, a probabilidade de


sair cara de 50%. Assim, a moeda pode ser considerada honesta para um nvel de
significncia de 5%.
De modo geral, o teste de aderncia indica que:
Se o2 > t2 , a hiptese Ho rejeitada;
Se o2 < t2 , a hiptese Ho no rejeitada.
Teste de Qui-Quadrado Independncia.
O teste de Qui-Quadrado de independncia semelhante ao teste Qui-Quadrado de
aderncia, mas considera uma lei oriunda da prpria tabela de dados experimentais a fim de
avaliar se h ou no dependncia entre duas variveis. Quanto maior a dependncia entre
as duas variveis, maior ser o valor de o2.
Quando as duas variveis so independentes, o valor de o2 tende a zero.
Exemplo 1 Uma pesquisa classificou uma amostra de 800.000 alunos dos ensinos
fundamental e mdio (sendo 500.000 alunos do turno matutino e 300.000 alunos do turno
vespertino) de acordo com o seguinte critrio de rendimento escolar: timo, regular e pssimo,
conforme a tabela abaixo:
Tabela: turno e rendimento escolar:
Turno Matutino
Turno vespertino
Totais

Rendimento
timo
80.000
150.000
230.000

Rendimento
Regular
300.00
60.000
360.000

Rendimento
Pssimo
120.000
90.000
210.000

Totais
500.000
300.000
800.000

A tabela apresenta como dados experimentais, 2 linhas e 3 colunas.


Da amostra de 500.000 alunos do turno matutino, 80.000 apresentam rendimento
escolar timo, 300.000 apresentam rendimento escolar regular e 120.000 apresentam
rendimento escolar pssimo.
Da amostra de 300.000 alunos do turno vespertino, 150.000 apresentam rendimento
escolar timo, 60.000 apresentam rendimento escolar regular e 90.000 apresentam
rendimento escolar pssimo.
Da amostra dos 800.000 alunos, 230.000 apresentam rendimento escolar timo,
360.000 apresentam rendimento escolar regular e 210.000 apresentam rendimento escolar
pssimo.
Observando-se a amostra total:

230.000
= 0,2875 = 28,75% dos alunos pesquisados
800.000

apresentam rendimento escolar timo. Caso essa proporo fosse mantida, seriam
esperados:
0,2875 x 500.000 = 143.750 com timo rendimento escolar no perodo matutino e
0,2875 x 300.000 = 86.250 com timo rendimento escolar no perodo vespertino.
Essa a lei terica extrada da tabela turno e rendimento escolar.
69

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Podemos obter a tabela dos clculos dos resultados esperados.


Tabela: Proporo: lei da tabela
Resultado
Observado

Proporo
(Lei da Tabela)
230.000
= 0,2875
800.000
360.000
= 0,4500
800.000
210.000
= 0,2625
800.000
230.000
= 0,2875
800.000
360.000
= 0,4500
800.000
210.000
= 0,2625
800.000

80.000
300.000
120.000
150.000
60.000
90.000

Resultado
Esperado
0,2875 x 500.000 = 143.750

Matutino

0,4500 x 500.000 = 225.000


0,2625 x 500.000 = 131.250
0,2875 x 300.000 = 86.250

Vespertino

0,4500 x 300.000 = 135.000


0,2625 x 300.000 = 78.750

Tabela: Etapas para calcular o2


Resultado
observado

Resultado
esperado

Diferena entre o
resultado observado e o
resultado esperado.

Quadrado da
diferena

80.000
300.000
120.000
150.000
60.000
90.000

143.750
225.000
131.250
86.250
135.000
78.750

80.000 143.750 = 63.750


300.000 225.000 = 75.000
120.000 131.250 = 11.250
150.000 86.250 = 63.750
60.000 135.000 = 75.000
90.000 78.750 = 11.250

4.064.062.500
5.625.000.000
126.562.500
4.064.062.500
5.625.000.000
126.562.500

Quociente entre o
quadrado da diferena e
o resultado esperado.
28.271,7391
25.000
964,2857
47.119,5652
41.666,6667
1.607,1429
144.629,3996

A soma dos quocientes entre o quadrado das diferenas e os resultados esperados (soma
dos valores da ltima coluna da tabela) fornece o valor o2 = 144.629,3996
Para o teste de Independncia, calcula-se o nmero de graus de liberdade (g.l.)
efetuando-se o produto entre o nmero de linhas da tabela de dados subtrado de 1 e o
nmero de colunas da tabela de dados, subtrado de 1, ou seja, g.l. = (n de linhas -1) x (n de
colunas -1). Para o nosso exemplo, temos que o nmero de graus de liberdade :
g.l. = (2 1).(3 1) = 1 . 2 = 2
Na tabela de Qui-Quadrado (p. 44), localizamos o parmetro t2 correspondente a
= 5% (ou = 0,05) e o valor de g.l. calculado (g.l. = 2): t2 = 5,991

g.l.
0,995

0,99

0,010

--100 67,328

1
2
---

0,020

0,975
0,001
0,051

0,950
0,004
0,103

0,90
0,016
0,211

0,10
2,706
4,605

0,05
3,841
5,991

0,025
5,024
7,378

0,01
6,635
9,210

0,005
7,879
10,597

--70,065

--74,222

--77,929

------------82,358 118,498 124,342 129,561 135,807 140,169

70

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Como o2 (144.629,3996) > t2 (5,991), a hiptese Ho rejeitada, ou seja, a varivel


turno de estudo dos alunos dos ensinos fundamental e mdio e a varivel rendimento
escolar so dependentes.
II. Teste F.
O teste F utilizado para verificar se duas populaes apresentam varincias
populacionais iguais.
Populao 1
12

Populao 2
22

Amostra 2: s22

Amostra 1 : s12

Calcule gl 2

Calcule gl 1

Fgl1, gl2 =

s1
s2

Para tanto, devem ser conhecidas as varincias amostrais normais s12 e s22 da duas
populaes em estudo. A varivel do teste, denominada varivel F, segue uma distribuio
amostral assimtrica, que assume apenas valores positivos. Este teste tambm conhecido
como teste da razo entre variveis, pois a varivel F do teste o quociente entre as duas
varincias amostrais. Para determinado grau de certeza, F dada por:
Fgl1, gl2 =

s1

s2

, onde:

g.l. 1 o grau de liberdade referente populao 1;


g.l. 2 o grau de liberdade referente populao 2.
O grau de liberdade g.l. calculado subtraindo 1 do nmero de amostras.
Para se realizar o teste F a fim de comparar duas varincias populacionais usando amostras de
cada populao, primeiramente devemos verificar se as amostras so independentes e selecionadas
aleatoriamente de populaes normalmente distribudas. Devemos ento seguir os seguintes passos:
Identificar Ho e H ;
Determinar o grau de certeza;
Determinar os graus de liberdade gl 1 e gl 2;
Observar o valor na tabela da distribuio F;
Se F estiver na rea de rejeio, rejeitamos Ho.

71

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

Tabela F para grau de certeza de 99%, tomando-se gl 1 na horizontal e gl 2 na vertical.


g.l.

10

12

14

16

18

20

25

30

35

4052,24

4999,3

5403,5

5624,3

5764,0

5859,0

5928,3

5981,0

6022,4

6055,9

6106,7

6143,0

6170,0

6191,4

6208,7

6239,9

6260,4

6275,3

98,50

99,00

99,16

99,25

99,30

99,33

99,36

99,38

99,39

99,40

99,42

99,43

99,44

99,44

99,45

99,46

99,47

99,47

34,12

30,82

29,46

28,71

28,24

27,91

27,67

27,49

27,34

27,23

27,05

26,92

26,83

26,75

26,69

26,58

26,50

26,45

21,20

18,00

16,69

15,98

15,52

15,21

14,98

14,80

14,66

14,55

14,37

14,25

14,15

14,08

14,02

13,91

13,84

13,79

16,26

13,27

12,06

11,39

10,97

10,67

10,46

10,29

10,16

10,05

9,89

9,77

9,68

9,61

9,55

9,45

9,38

9,33

13,75

10,92

9,78

9,15

8,75

8,47

8,26

8,10

7,98

7,87

7,72

7,60

7,52

7,45

7,40

7,30

7,23

7,18

12,25

9,56

8,45

7,85

7,46

7,19

6,99

6,84

6,72

6,62

6,47

6,36

6,28

6,21

6,16

6,06

5,99

5,94

11,26

8,56

7,59

7,01

6,63

6,37

6,18

6,03

5,91

5,81

5,67

5,56

5,48

5,41

5,36

5,26

5,20

5,15

10,56

8,02

6,99

6,42

6,06

5,80

5,61

5,47

5,35

5,26

5,11

5,01

4,92

4,86

4,81

4,71

4,65

4,60

10

10,04

7,56

6,55

5,99

5,64

5,39

5,20

5,06

4,94

4,85

4,71

4,60

4,52

4,46

4,41

4,31

4,25

4,20

11

9,65

7,21

6,22

5,67

6,32

5,07

4,89

4,74

4,63

4,54

4,40

4,29

4,21

4,15

4,10

4,01

3,94

3,89

12

9,33

6,93

5,95

5,41

5,06

4,82

4,64

4,50

4,39

4,30

4,16

4,05

3,97

3,91

3,86

3,76

3,70

3,65

13

9,07

6,70

5,74

5,21

4,86

4,62

4,44

4,30

4,19

4,10

3,96

3,86

3,78

3,72

3,66

3,57

3,51

3,46

14

8,85

6,51

5,56

5,04

4,69

4,46

4,28

4,14

4,03

3,94

3,80

3,70

3,62

3,56

3,51

3,41

3,35

3,30

15

8,68

6,36

5,42

4,89

4,56

4,32

4,14

4,00

3,89

3,80

3,67

3,56

3,49

3,42

3,37

3,28

3,21

3,17

16

8,53

6,23

5,29

4,77

4,44

4,20

4,03

3,89

3,78

3,69

3,55

3,45

3,37

3,31

3,26

3,16

3,10

3,05

17

8,40

6,11

5,19

4,67

4,34

4,10

3,93

3,79

3,68

3,59

3,46

3,35

3,27

3,21

3,16

3,07

3,00

2,96

18

8,29

6,01

5,09

4,58

4,25

4,01

3,84

3,71

3,60

3,51

3,37

3,27

3,19

3,13

3,08

2,98

2,92

2,87

19

8,18

5,93

5,01

4,50

4,17

3,94

3,77

3,63

3,52

3,43

3,30

3,19

3,12

3,05

3,00

2,91

2,84

2,80

20

8,10

5,85

4,94

4,43

4,10

3,87

3,70

3,56

3,46

3,37

3,23

3,13

3,05

2,99

2,94

2,84

2,78

2,73

21

8,02

5,78

4,87

4,37

4,04

3,81

3,64

3,51

3,40

3,31

3,17

3,07

2,99

2,93

2,88

2,79

2,72

2,67

22

7,95

5,72

4,82

4,31

3,99

3,76

3,59

3,45

3,35

3,26

3,12

3,02

2,94

2,88

2,83

2,73

2,67

2,62

23

7,88

5,66

4,76

4,26

3,94

3,71

3,54

3,41

3,30

3,21

3,07

2,97

2,89

2,83

2,78

2,69

2,62

2,57

24

7,82

5,61

4,72

4,22

3,90

3,67

3,50

3,36

3,26

3,17

3,03

2,93

2,85

2,79

2,74

2,64

2,58

2,53

25

7,77

5,57

4,68

4,18

3,85

3,63

3,46

3,32

3,22

3,13

2,99

2,89

2,81

2,75

2,70

2,60

2,54

2,49

26

7,72

5,53

4,64

4,14

3,82

3,59

3,42

3,29

3,18

3,09

2,96

2,86

2,78

2,72

2,66

2,57

2,50

2,45

27

7,68

5,49

4,60

4,11

3,78

3,56

3,39

3,26

3,15

3,06

2,93

2,82

2,75

2,68

2,63

2,54

2,47

2,42

28

7,64

5,45

4,57

4,07

3,75

3,53

3,36

3,23

3,12

3,03

2,90

2,79

2,72

2,65

2,60

2,51

2,44

2,39

29

7,60

5,42

4,54

4,04

3,73

3,50

3,33

3,20

3,09

3,00

2,87

2,77

2,69

2,63

2,57

2,48

2,41

2,36

30

7,56

5,39

4,51

4,02

3,70

3,47

3,30

3,17

3,07

2,98

2,84

2,74

2,66

2,60

2,55

2,45

2,39

2,34

35

7,42

5,27

4,40

3,91

3,59

3,37

3,20

3,07

2,96

2,88

2,74

2,64

2,56

2,50

2,44

2,35

2,28

2,23

Exemplo 1 Um engenheiro est elaborando um novo sistema que poderia reduzir a varincia do
tempo para a fabricao de peas. No sistema anterior, uma amostra aleatria de 10 peas,
apresentava varincia de 140. Com o novo sistema, uma amostra aleatria de 25 peas teria uma
varincia de 100. Sendo o grau de certeza de 99%, h evidncias suficientes que garantam que o
novo sistema melhor que o antigo?
Temos: Sistema 1 (antigo): s12 = 140 , n = 10
Sistema 2 (novo): s22 = 100 , n = 25
2

Fgl1, gl2 =

s1
s2

F9,24 =

g.l.1 = 10 1 = 9
g.l.2 = 25 1 = 24

140
= 1,40
100

Hipteses: Ho : 12 22
Ha : 12 > 22
Utilizando a tabela da distribuio F, para 99%, temos: F9, 24 = 3,26.
Concluso: Como F no est na regio de rejeio, no possvel rejeitar Ho.

EXERCCIOS RESOLVIDOS SOBRE TESTE DE QUI-QUADRADO


72

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

1. Em 40 lanamentos de uma moeda, foram observados os seguintes resultados: 10 caras e 30


coroas. A moeda em questo pode ser considerada honesta, com nvel de significncia de 5%?
Soluo: Etapas para se calcular o2 :
O
Resultado
observado
Cara: 10
Coroa: 30

OE

Resultado
esperado
(moeda
honesta)
Cara: 20
Coroa: 20

Diferena entre o
resultado observado
e o resultado
esperado.
10 20 = 10
30 20 = 10

(O E)2

(O E ) 2
E

Quadrado
da diferena

Quociente entre o
quadrado da diferena e
o resultado esperado.

(10)2 = 100
(10)2 = 100

100/20 = 5
100/20 = 5

(O E ) 2
E = 5 + 5 = 10 ou 2cal. = 10
Para o teste qui-quadrado de aderncia, o g.l. = (n de linhas da tabela) 1, ou seja, g.l. = 2 1 = 1
e t2 obtido na tabela p.44 com o nvel de significncia definido no problema, no caso,
= 5% = 0,05: 2t = 3,841
o2 =

g.l.
0,995

0,10
0,05 0,025 0,01 0,005
2,706 3,841 5,024 6,635 7,879
--------------118,49 124,34 129,56 135,80 140,16
100 67,328 70,065 74,222 77,929 82,358
8
2
1
7
9
1
---

0,99

0,975
0,001
---

0,950
0,004
---

0,90
0,016
---

Concluso: Como o2 = 10 > 2t = 3,841, rejeitamos a hipteses Ho e podemos considerar que a


moeda no honesta.

Lembrete: De modo geral, o teste de aderncia ou de independncia indica que:


Se o2 > t2 , a hiptese Ho rejeitada;
Se o2 < t2 , a hiptese Ho no rejeitada.

2. Foi feita uma pesquisa para saber se a audincia de 2 emissoras A e B, independe de sua
programao, que so divididas em 3 tipos: Programas Musicais, Programas de Notcias e
Programas Esportivos. Em uma amostra com 100 ouvintes, obtiveram-se os dados da tabela
abaixo. Ao nvel de 5% de significncia podemos dizer que:
Emissoras
A
B

Programas
Musicais Notcias Esportivos
5
10
25
10
20
30

Soluo:
Neste caso, o teste de Qui-Quadrado Independncia
73

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

I) Da tabela temos:
Programas
Musicais Notcias Esportivos TOTAIS
A
5
10
25
40
B
10
20
30
60
TOTAIS
15
30
55
100

Emissoras

2 linhas

3 colunas
II) Tabela das propores e Etapas para calcular o2 :

(O E)2

= 0,15

0,15 x 40 = 6

5 6 = 1

0,167

= 0,30

0,30 x 40 = 12

10 12 =2

0,337

= 0,55

0,55 x 40 = 22

25 22 = 3

0,409

= 0,15

0,15 x 60 = 9

10 9 = 1

0,111

= 0,30

0,30 x 60 = 18

20 18 = 2

0,222

= 0,55

0,55 x 60 = 33

30 33 = 3

0,272

15
100
30
100
55
100
15
100
30
100
55
100

25
10
B

OE

Proporo

10

20
30

(O E ) 2
E

= 1,517
(O E ) 2
= 0,167 + 0,337 + 0,409 + 0,111 + 0,222 + 0,272 = 1,517 ou
E
diretamente na tabela, temos: o2 = 1,517
o2 =

Para o teste Qui-Quadrado de Independncia, o g.l. = (n de linhas da tabela 1) x (n de colunas


da tabela 1), ou seja, g.l. = (2 1) x ( 3 1) = 1 x 2 = 2 e t2 obtido na tabela p.44 com o nvel de
significncia definido no problema, no caso, = 5% = 0,05:
2t = 5,991

g.l.
0,995

0,99
0,020

0,975
0,001
0,051

0,950
0,004
0,103

0,90
0,016
0,211

1
2

0,10
2,706
4,605

0,05
3,841
5,991

0,025
5,024
7,378

0,01
6,635
9,210

0,005
7,879
10,597

0,010

---

---

---

---

---

---

---

---

---

---

---

100 67,328 70,065 74,222 77,929 82,358 118,498 124,342 129,561 135,807 140,169

Concluso: Como o2 = 1,517 < 2t = 5,991, no podemos rejeitar Ho, ou seja, podemos dizer que
a audincia no depende da programao das duas emissoras.

74

Estatstica Indutiva para os cursos de


Engenharia e Informtica.

Anotaes de Aula

Eurpedes MACHADO Rodrigues

UNIP UNIDADE UNIVERSITRIA DE SOROCABA


ENGENHARIA-2ANO

ESTATSTICA INDUTIVA
(ANOTAES DE AULA)

ALUNO(A):______________________________ RA.:_________

PROF. MACHADO

2 SEMESTRE DE 2012

75

S-ar putea să vă placă și