Documente Academic
Documente Profesional
Documente Cultură
E
P ROBABILIDADE
1a Edio - 2.007
SOMESB
S OCIEDADE M ANTENEDORA DE E DUCAO S UPERIOR DA B AHIA S/C LTDA .
G ERVSIO M ENESES
DE O LIVEIRA
P RESIDENTE
W ILLIAM O LIVEIRA
V ICE -P RESIDENTE
S AMUEL S OARES
S UPERINTENDENTE A DMINISTRATIVO E F INANCEIRO
G ERMANO TABACOF
S UPERINTENDENTE DE E NSINO, P ESQUISA E E XTENSO
P EDRO DALTRO G USMO DA S ILVA
S UPERINTENDENTE DE D ESENVOLVIMENTO E P LANEJAMENTO ACADMICO
FTC-E A D
DE
T ECNOLOGIA
A NDR P ORTNOI
D IRETOR A DMINISTRATIVO E F INANCEIRO
R ONALDO C OSTA
G ERENTE ACADMICO
J ANE F REIRE
G ERENTE DE E NSINO
L US C ARLOS N OGUEIRA A BBEHUSEN
G ERENTE DE S UPORTE T ECNOLGICO
M ATERIAL D IDTICO
P RODUO ACADMICA
J ANE F REIRE
G ERENTE DE E NSINO
A NA PAULA A MORIM
S UPERVISO
G ECIARA
DA S ILVA C ARVALHO
C OORDENADOR DE C URSO
DO
N ASCIMENTO
AUTOR ( A )
P RODUO T CNICA
J OO J ACOMEL
C OORDENAO
C ARLOS M AGNO B RITO A LMEIDA S ANTOS
R EVISO
DE
T EXTO
J ONES G ARCIA DA
R EVISO DE C ONTEDO
M ATA
EM
LATEX 2
E QUIPE
A LEXANDRE R IBEIRO, A NGLICA J ORGE , C EFAS G OMES, C LAUDER F ILHO, D ELMARA B RITO, D IEGO D ORIA A RAGO, FBIO
G ONALVES , F RANCISCO F RANA J NIOR , H ERMNIO F ILHO, I SRAEL DANTAS, LUCAS DO VALE , MARCIO S ERAFIM , MARIUCHA
P ONTE , RUBERVAL F ONSECA E TATIANA C OUTINHO.
c 2.007 FTC-E A D
Copyright
Todos os direitos reservados e protegidos pela lei 9.610 de 19/02/98.
proibida a reproduo total ou parcial, por quaisquer meios, sem autorizao prvia, por escrito, da
FTC-E A D - Faculdade de Tecnologia e Cincias - Ensino a distncia.
www.ead.ftc.br
Sumrio
Bloco 1: Estatstica Descritiva
1.1
Mtodo Estatstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1
1.2
Divises da Estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3
Populao e Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4
Variveis Estatsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.5
Sries Estatsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Dados Brutos e Rol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Classificao das Sries Estatsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.6
Apresentao Tabular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Apresentao do Tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Arredondamento de Dados Numricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.7
1.6.2
Exerccio Proposto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.6.3
1.6.4
Exerccios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Distribuio de Freqncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.7.1
Tipos de Freqncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.7.2
1a - Variveis Qualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.7.3
1.7.4
1.7.5
1.7.6
A Regra de Sturges . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.7.7
A Regra do Quadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.7.8
1.7.9
1.9
Apresentao Grfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.8.1
1.8.2
Exerccios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Medidas de Posio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.9.1
Mdia Aritmtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Exerccios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
1.9.3
Mdia Geomtrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Mdia Harmnica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Mdia Quadrtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
1.9.6
1.9.7
Exerccios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
1.9.8
Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Mtodo de King . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Mtodo de Czuber . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Frmula de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Relao entre a Mdia Aritmtica, a Moda e a Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
1.9.10 Exerccios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
Tema 2: Medidas
2.1
53
Separatrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.1.2
2.1.3
Exerccios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.1.4
Amplitude Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.1.5
Desvio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Propriedades do Desvio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.1.6
Desvio Quartil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.1.7
2.1.8
Varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
Propriedades da Varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.1.9
Desvio Padro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.3
Medidas de Assimetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.2.1
2.2.2
Exerccio Proposto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Medidas de Curtose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.3.1
2.4
Exerccio Proposto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Gabarito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
63
Tema 3: Probabilidade
63
3.1
Apresentao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.2
Consideraes Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.2.1
3.3
Exerccios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
Exerccios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.4
Um Pouco de Histria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.5
Clculos Probabilsticos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.5.1
A Probabilidade de um Evento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
Exerccios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4
3.5.2
Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.5.3
Exerccios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.5.4
3.5.5
Independncia de Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
Exerccios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.5.6
Exerccios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.5.7
O Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
Exerccios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.6
Gabarito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
81
Varivel Aleatria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.1.1
4.2
Funes de Probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.2.1
Distribuio de Probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.2.2
Densidade de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.3
Funo de Repartio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
Exerccios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.4
4.5
4.6
4.7
4.8
4.9
Exerccios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.10
Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.11
Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
4.13
Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
4.14
Varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
Desvio Padro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.16
4.17
Exerccios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
96
101
102
102
105
106
107
107
108
108
109
110
110
111
113
Regresso e Correlao
113
4.20 Ajustamento de Curvas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.21 Equaes Normais (Mtodo dos Mnimos Quadrados) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
4.21.1 Processo Alternativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.21.2 Exerccio Proposto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
4.22 Correlao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
4.22.1 O Coeficiente de Correlao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
4.22.2 Interpretao Grfica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
4.23 Erro Padro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
4.24 Limites de Confiana para Coeficientes de Regresso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
4.25 Gabarito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
Referncias Bibliogrficas
Atividade Orientada
5.1
Etapa 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2
Etapa 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3
Etapa 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
123
1
1
3
7
A PRESENTAO
DA
D ISCIPLINA
Caro aluno,
Este material foi produzido com o objetivo de dar suporte aos graduandos do curso de Licenciatura em Matemtica na disciplina Estatstica e Probabilidades.
Dois grandes blocos so apresentados: a Estatstica Descritiva e a Teoria de Probabilidades. A
primeira utiliza-se de mtodos para organizar, resumir e descrever os aspectos importantes de um
conjunto de caractersticas observadas ou comparar tais caractersticas entre dois ou mais conjuntos. Os blocos so divididos em quatro temas.
No Tema 1, apresentamos alguns conceitos introdutrios. As sries estatsticas e as representaes tabular e grfica. Alm disso, abordaremos o clculo das mdias, da moda e da mediana de
uma distribuio de freqncias.
No Tema 2, trabalharemos as separatrizes e as medidas de disperso, assimetria e curtose.
No Tema 3, veremos os principais resultados na teoria de probabilidades.
No Tema 4, expande-se o conceito de probabilidade com a insero do conceito de varivel
aleatria. Os eventos que possuem determinadas caractersticas so associadas a determinadas
funes de probabilidade. O grau de dependncia entre duas variveis aleatrias inserido e tambm apresentado o conceito de Regresso Linear.
Aqui, observar-se- como a Estatstica essencial para a compreenso dos resultados de uma
pesquisa.
Prof.
BLOCO 01
TEMA 01
Estatstica Descritiva
Sries Estatsticas, Medidas de
Tendncia Central e Moda
Apresentao
Desde remota antigidade, os governos tm se interessado por informaes sobre suas populaes e
riquezas, tendo em vista, principalmente, fins militares e tributrios. Confcio relatou levantamentos feitos
na China, h mais de 2.000 anos antes da era crist. No antigo Egito, os faras fizeram uso sistemtico de
informaes de carter estatstico, conforme evidenciaram pesquisas arqueolgicas. Desses registros tambm
se utilizaram as civilizaes pr-colombianas dos maias, astecas e incas. conhecido de todos os cristos o
recenseamento dos judeus, ordenado pelo Imperador Augusto.
Os balancetes do imprio romano, o inventrio das posses de Carlos Magno, o Doomsday Book, registro que
Guilherme, o Conquistador, invasor normando da Inglaterra, no sculo XI, mandou levantar das propriedades
rurais dos conquistados anglo-saxes para se inteirar de suas riquezas, so alguns exemplos anteriores
emergncia da estatstica descritiva no sculo XVI, na Itlia. Essa prtica tem sido continuada nos tempos
modernos, por meio dos recenseamentos, dos quais temos um exemplo naquele que se efetua a cada decnio,
em nosso Pas, pela Fundao IBGE, rgo responsvel por nossas estatsticas (dados estatsticos) oficiais.
Com o Renascimento, foi despertado o interesse pela coleta de dados estatsticos, principalmente por suas
aplicaes na administrao pblica.
A palavra estatstica, derivada do termo latino status (estado), parece ter sido introduzida na Alemanha, em
1.748, por Achenwall. A Estatstica encarada, atualmente, como uma cincia capaz de obter, sintetizar, prever
e tirar inferncias sobre dados. Porm, no sculo XVII, na Inglaterra, a estatstica era a Aritmtica do Estado
(Political Arithmetic), consistindo, basicamente, na anlise dos registros de nascimentos e mortes, originando,
mais tarde, as primeiras tbuas de mortalidade. Ao longo da Idade Mdia e at ao sculo XVIII, a estatstica
foi puramente descritiva, coexistindo duas escolas: a escola descritiva alem, cujo representante mais conhecido o economista G. Achenwall (1.719-1.772), professor na Universidade de Gottingen, considerado pelos
alemes como o pai da estatstica, e a escola dos matemticos sociais, que procuravam traduzir por leis a regularidade observada de certos fenmenos, de carter econmico e sociolgico. Embora esta escola procurasse
fundamentar a formulao de previses com base em leis sugeridas pela experincia, a estatstica confundiase, praticamente, com a demografia qual fornecia mtodos sistemticos de enumerao e organizao. Na
realidade, a necessidade sentida, em todas as pocas, de conhecer, numrica e quantitativamente, a realidade
poltica e social tornou a anlise demogrfica uma preocupao constante.
John Graunt (1620-1674), juntamente com William Petty (1.623-1.687), autor de Political Arithmetic, e o
astrnomo Edmond Halley (1.656-1.742) so os principais representantes da escola inglesa, que d um novo
impulso estatstica, fazendo-a ultrapassar um estado puramente descritivo: analisam-se os dados na procura
de certas regularidades, permitindo enunciar leis e fazer previses. No entanto, a estatstica, para adquirir o
estatuto de disciplina cientfica, e no puramente ideogrfica ou descritiva, teve que esperar pelo desenvolvimento do clculo das probabilidades, que lhe viria a fornecer a linguagem e o aparelho conceptual permitindo
a formulao de concluses com base em regras indutivas.
Data do sculo XVII o incio do estudo sistemtico dos problemas ligados aos fenmenos aleatrios, comeando
8
a ser manifestada a necessidade de instrumentos matemticos, aptos a analisar este tipo de fenmenos, em
todas as cincias que pem o problema do tratamento e interpretao de um grande nmero de dados. Podese datar dos fins do sculo XIX, o desenvolvimento da estatstica matemtica e suas aplicaes, com F. Galton
(1.822-1.911), K. Pearson (1.857-1.936) e mtodos estatsticos na investigao experimental se fica a dever,
fundamentalmente, aos trabalhos de K. Pearson e R. A. Fisher (1.890-1.962). A partir de Pearson e Fisher o
desenvolvimento da estatstica matemtica, por um lado, e dos mtodos estatsticos aplicados, por outro, tm
sido tal que praticamente impossvel referir nomes.
Em todas as reas da cincia, a coleta de dados se faz necessria e com isso a Estatstica tem crescido
muito nos ltimos anos, especialmente com o advento dos computadores e surgimento de softwares cada
vez mais sofisticados. Observar uma extensa listagem de dados coletados no nos permite chegar a uma
concluso concisa. Este fato se agrava se esse conjunto de dados, possui muitas caractersticas que devam
ser investigadas.
Os mtodos descritivos so utilizados, portanto, para organizar, resumir e descrever aspectos importantes
de um conjunto de caractersticas observadas ou comparar tais caractersticas entre dois ou mais conjuntos.
Ao se resumir ou condensar um conjunto de dados, informaes so perdidas, visto que, no estamos mais
trabalhando com as observaes originais. Entretanto, esta perda de informao pequena se compararmos
ao ganho que se tem com a clareza da interpretao proporcionada.
A descrio dos dados tambm tem como objetivo identificar anomalias, at mesmo resultante do registro
incorreto de valores, e dados dispersos, aqueles que no seguem a tendncia geral do restante do conjunto.
No s nos artigos tcnicos direcionados para pesquisadores, mas tambm, nos artigos de jornais e revistas escritos para o pblico leigo, cada vez mais freqente a utilizao dos recursos de descrio para
complementar a apresentao de um fato, justificar ou referendar um argumento.
As ferramentas descritivas so os muitos tipos de grficos e tabelas e as medidas de sntese, como os
ndices e as mdias.
1.1
Mtodo Estatstico
A Estatstica originou-se da coleta e construo de tabelas de dados para o governo. A situao foi evoluindo
e esta coleta de dados representa somente um dos aspectos da Estatstica. Hoje em dia podemos adotar a
seguinte definio para a Estatstica: Cincia que se baseia na Teoria das Probabilidades e cujo objetivo
principal nos auxiliar a tomar decises ou tirar concluses em situaes de incerteza, a partir de informaes
numricas.
1.1 Definio. Mtodo um conjunto de meios dispostos convenientemente para se chegar a um determinado
objetivo.
Dos mtodos cientficos podemos destacar os mtodos:
Experimental - consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de
modo que o pesquisador possa descobrir seus efeitos, caso existam. o mtodo preferido no estudo da
Fsica e da Qumica.
Estatstico - diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes
variando-as, registrando essas variaes e procurando determinar, no resultado final, que influncias
cabem a cada uma delas. Como exemplo, podemos citar a determinao das causas que definem o
preo de uma mercadoria. Para aplicarmos o mtodo experimental, teramos de fazer variar a quantidade
da mercadoria e verificar se tal fato iria influenciar seu preo. Porm, seria necessrio que no houvesse
ESTATSTICA E PROBABILIDADE
alterao nos outros fatores. Assim, deveria existir, no momento da pesquisa, uma uniformidade dos
salrios, o gosto dos consumidores deveria permanecer constante, seria necessria a fixao do nvel
geral dos preos das outras necessidades e etc. Mas, isso tudo impossvel. Da a necessidade de
utilizao do mtodo estatstico.
1.1.1
seu administrador a importante tarefa de tomar decises, e o conhecimento e uso da Estatstica facilitar
seu trplice trabalho de organizar, dirigir e controlar a empresa.
1.2
Divises da Estatstica
1.3
Populao e Amostra
1.2 Definio. [Populao, Censo ou Universo Estatstico] Conjunto de indivduos, objetos ou informaes
que apresentam pelo menos uma caracterstica comum, cujo comportamento interessa analisar. Ou, em outras
palavras, conjunto de todas as medidas, observaes relativas ao estudo de determinado fenmeno.
Seja = {xi } uma populao, onde i representa a ordem do elemento populacional e { = Yk } um conjunto
de caractersticas da populao as quais no interessa estudar. Ento, a cada elemento de podemos
associar a uma caracterstica Yk .
Exemplo 1.1.
i) O Ministrio da Sade pretende estudar o nvel da glucose no sangue das crianas brasileiras com 7 anos
de idade em 2.001.
Populao: = {o conjunto formado por todas as crianas portuguesas com 7 anos}.
Caracterstica: { = nvel de glucose no sangue}.
ii) Deseja-se saber se nas indstrias situadas no Estado da Bahia, em 1997, existia algum tipo de controle
ambiental.
Populao: = {indstrias situadas no Estado da Bahia em 1997}.
Caracterstica: { = existncia ou no de algum tipo de controle ambiental na indstria}.
iii) Estudo sobre a precipitao pluviomtrica na Regio Nordeste no ano 1997.
Populao ou universo: = {rea referente Regio Nordeste}.
Caracterstica: { = precipitao pluviomtrica}.
ESTATSTICA E PROBABILIDADE
11
iv) Deseja-se conhecer o patrimnio lquido, faturamento, nmero de empregados, tempo de existncia, das
empresas situadas no Plo Petroqumico de Camaari neste ano.
Populao ou universo: = {empresas existentes no Plo Petroqumico de Camaari no ano em
estudo}.
Tcnicas de amostragem
x
?
?
Concluses sobre
as caractersticas da populao
Amostra
Anlise ?
?
descritiva
Inferncia Estatstica
Informaes
contidas nos dados
Desta forma, analisaremos quais i so menores que um valor fixo aceitvel para o erro. Claro que,
quanto maior a quantidade de valores i menores ou iguais que , mais confivel ser a estimativa, ou seja,
quando trabalhamos com amostras, visando conhecer a populao, necessrio conhecer a probabilidade
de que o erro obtido no seja maior do que :
P (|xi | ) = 1 .
Assim, dizemos que cada amostra representativa da populao e que a medida xi , de uma amostra
previamente selecionada, pode ser utilizada como estimativa para a medida .
Uma medida, obtida com clculos baseados em informaes de uma amostra, chamada de estatstica
enquanto que a medida, obtida com clculos baseados em informaes de uma populao, chamada de
parmetro. A parte da Estatstica responsvel pela determinao do tamanho da amostra e da forma de
seleo dos seus elementos chamada Amostragem.
1.4
Variveis Estatsticas
QUALITATIVA
QUANTITATIVA
NOMINAL
ORDINAL
13
1.5
Sries Estatsticas
Uma srie estatstica toda e qualquer coleo de dados estatsticos referidos a uma mesma ordem de
classificao quantitativa. Genericamente podemos dizer que uma sucesso de nmeros que se relacionam
com qualquer varivel do fenmeno em estudo. A palavra srie usada normalmente para designar um conjunto de dados dispostos de acordo com um carter varivel. Assim, ao realizarmos um levantamento de dados
sobre um fenmeno ou varivel, o que obtemos uma srie estatstica.
1.6
O modo de condensao ou apresentao das informaes so dadas por tabelas ou grficos que facilitam
a visualizao do fenmeno, permitem a comparao com outros elementos ou, ainda, fazer previses. Os
principais tipos de grficos sero apresentados, porm, antecedendo-os, sero apresentadas as normas de
apresentao tabular e as tabelas das sries estatsticas que deram origem aos grficos.
1.6.1
Apresentao Tabular
A representao tabular (tabela) uma das modalidades mais utilizadas para a apresentao dos dados
estatsticos coleta dos na amostragem.
TOPO
Cabealho das colunas
Coluna
Linha
Clula
RODAP
Centro : Espao central de uma tabela destinado a moldura, aos dados numricos e aos termos necessrios
a sua compresso. No centro identificam-se quatro espaos menores: o espao do cabealho, a coluna,
a linha e a clula.
Espao do cabealho: espao superior do centro de uma tabela destinado a indicao do contedo
das colunas. Toda tabela deve ter cabealho, escrito no espao do cabealho, para indicar, complementarmente ao ttulo, o contedo das colunas. O contedo das colunas deve ser feito com palavras ou com
notaes, de forma clara e concisa. Recomenda-se que a indicao com palavras seja feita por extenso,
sem abreviaes;
Coluna: Espao vertical do centro de uma tabela destinado aos dados numricos (coluna de dados
numricos) ou aos indicadores de linha (colunas indicadoras);
Linha: Espao horizontal do centro de uma tabela destinado aos dados numricos. Toda tabela deve
ter indicadores de linha, inscritos nas colunas indicadoras, para indicar, complementarmente ao ttulo, o
contedo as linhas. O contedo das linhas deve ser feito com palavras ou com notaes, de forma clara
e concisa. Recomenda-se que a indicao com palavras seja feita por extenso, sem abreviaes;
Dado numrico : Quantificador de um fato especifico observado. A estrutura dos dados numricos e dos
termos necessrios a compreenso de uma tabela deve ser feita com, no mnimo, trs traos horizontais
paralelos. O primeiro para separar o topo, o segundo para separar o espao do cabealho. O terceiro
para separar o rodap;
ESTATSTICA E PROBABILIDADE
15
Clula : espao mnimo do centro de uma tabela, resultante do cruzamento de uma linha com uma coluna,
destinado ao dado numrico ou ao sinal convencional.
Sinal convencional: Representao grfica que substitui um dado numrico. A substituio de um
dado numrico deve ser feita por um dos sinais abaixo, conforme o caso:
Apresentao do Tempo
1o . Toda srie temporal consecutiva deve ser apresentada, em uma tabela, por seus pontos, inicial e final,
ligados por hfen (-).
16
Exemplo 1.2.
2001-2004: apresenta dados numricos para os anos de 2001, 2002, 2003 e 2004.
SET 2000-FEV 2001: apresenta dados numricos para os meses de Setembro, Outubro, Novembro,
Dezembro de 20001 e Janeiro, Fevereiro e Maro de 2001.
30.05.2001-06.06.2001: dados referentes aos dias 30 e 31 de Maio de 2001 e 1, 2, 3, 4, 5, e 6 de Junho de
2001.
2o . Toda srie temporal no consecutiva deve ser apresentada, em uma tabela, por seus pontos, inicial e final,
ligados por barra (/).
Exemplo 1.3.
2001/2004: apresenta dados numricos para os anos de 2001 e 2004, no sendo apresentados dados
numricos de pelo menos um dos anos desta serie temporal.
OUT 2001/MAR 2002: dados referentes aos meses de Outubro de 2001 e Maro de 2002, no sendo
apresentados dados numricos de pelo menos um dos meses desta serie temporal.
30.05.2001/06.06.2001: dados referentes aos dias 30 de Maio de 2001 e 6 de junho de 2001, no sendo
apresentados dados numricos de pelo menos um dos dias desta serie temporal.
3o . No caso de uma serie temporal no consecutiva que contenha um numero reduzido de pontos, a serie temporal pode ser apresentada por todos os seus pontos, separados por vrgula, dispensando-se proceder
conforme o item (ii).
4o . Quando uma tabela contiver dados numricos de uma safra, abrangendo dois anos, a apresentao do
ponto no tempo deve ser feita com os dois ltimos algarismos de cada um dos anos ligados por barra (/)
e precedida da palavra Safra.
Exemplo 1.4. Safra 01/02: apresenta dados numricos de uma safra iniciada em 2001 e terminada em
2002.
5o . Quando uma tabela contiver dados numricos de um perodo anual diferente do ano civil, isto deve ser
indicado no ttulo, em nota geral ou nota especfica
17
1.6.2
Exerccio Proposto
(a)
(b)
(c)
(d)
(i)
(j)
(k)
(f)
1.6.3
IPI
Municpios
Janeiro
Fevereiro
18.633
17.497
Maro
19.470
Camaari
Candeias
Abril
Maio
18.884
20.308
Dias DAvila
Itaparica
31
15
Junho
Julho
20.146
20.258
Lauro de Freitas
Madre de Deus
69
9
Agosto
Setembro
21.614
19.717
Salvador
So Francisco do Conde
Outubro
Novembro
22.133
20.503
Simes Filho
73
Vera Cruz
22
Dezempbro
12.721
Total
Quantidade
Bovinos
Eqinos
154.441
550
Ovinos
Sunos
19.956
34.532
Caprinos
12.160
1.6.4
114
68
2.496
Regio
1993
Sul
Nordeste
Centro-Oeste
Norte
713.357
342.938
778.925
375.658
18
1992
Sudeste
Exerccios Propostos
2.075
20
884.822
403.494
19
(b) O processo utilizado para se medir as caractersticas de todos os membros de uma dada populao
recebe o nome de censo.
(c) A Estatstica Descritiva compreende as tcnicas por meio das quais so tomadas decises sobre uma
populao com base na observao de uma amostra.
(d) Uma populao pode ser caracterizada se forem observados todos os seus componentes.
(e) Parmetros so medidas caractersticas de grupos, determinadas por meio de uma amostra aleatria.
EP 1.8. [TTN-94] Marque a opo correta.
(a) Um evento tem, no mnimo, dois elementos do espao-amostra de um experimento aleatrio.
(b) Em um experimento aleatrio uniforme todos os elementos do espao-amostra so iguais.
(c) Dois experimentos aleatrios distintos tm, necessariamente, espaos-amostra distintos.
(d) Uma parte no-nula do espao-amostra de um experimento aleatrio define um evento.
(e) Um experimento aleatrio pode ser repetido indefinidamente, mantidas as condies iniciais.
EP 1.9. [AFC-94] A tabela ao lado apresenta a distribuio de um
grupo de 200 estudantes segundo o curso que fazem (Estatstica ou
Matemtica) e o sexo (homem ou mulher). A nica afirmao errada :
Estatstica
Matemtica
Homem
Mulher
40
80
20
60
Brasil
Regio Nordeste
1940
1950
41, 5
45, 5
38, 7
38, 9
1960
51, 6
41, 0
1970
1980
53, 5
60, 0
45, 5
51, 0
Tabela 1.3: Fonte: IBGE, Perfil estatstico de crianas e mes no Brasil, 1984.
Da anlise da tabela podemos concluir que a nica afirmao errada :
(a) a esperana de vida do cidado brasileiro cresceu no perodo 1940/1980.
(b) a esperana de vida de um cidado do nordeste brasileiro cresceu no perodo 1940/1980.
(c) a tabela aponta uma diminuio na diferena entre a esperana de vida na Regio Nordeste e a mdia
nacional;
20
(d) a tabela indica uma defasagem de 20 anos entre os valores observados na Regio Nordeste e a mdia
nacional;
(e) no perodo 1940/1980, a esperana de vida de um cidado do Nordeste brasileiro cresceu a uma taxa
inferior taxa mdia no Brasil.
EP 1.11. [TCDF-95] Assinale a opo correta.
(a) Em Estatstica, entende-se por populao um conjunto de pessoas.
(b) A varivel discreta quando pode assumir qualquer valor dentro de determinado intervalo.
(c) Freqncia relativa de uma varivel aleatria o nmero de repeties dessa varivel.
(d) A srie estatstica cronolgica quando o elemento varivel o tempo.
(e) Amplitude total a diferena entre dois valores quaisquer do atributo.
EP 1.12. [TTN] Assinale a opo correta:
(a) Uma amostra aleatria extrada de uma populao deve ser superior, no tamanho, a 5% do nmero de
elementos populacionais.
(b) Em um experimento aleatrio, cada elemento do espao amostral tem a mesma probabilidade de ser
selecionado, em uma realizao do experimento.
(c) Em um experimento aleatrio impossvel garantir a ocorrncia de um evento em uma particular realizao
do experimento, se ele no for um evento certo.
(d) Um plano de amostragem corretamente elaborado garante a fidedignidade dos dados da populao.
(e) A opo pela amostragem em relao ao censo, garante a reduo de tempo, mas conduz sempre ao
incremento de custo e perda de preciso.
EP 1.13. [TTN] Marque a opo correta:
(a) Dois experimentos aleatrios distintos tm, necessariamente, espao-amostra distintos.
(b) Uma parte no nula de um experimento aleatrio define um evento.
(c) Um experimento aleatrio pode ser repetido indefinidamente, mantidas as condies iniciais.
(d) Um evento, tem, no mnimo, dois elementos do espao-amostra de um experimento aleatrio.
(e) Em um experimento aleatrio uniforme, todos os elementos do espao-amostra so iguais.
1.7
Distribuio de Freqncias
Aps a coleta de informaes relativamente a uma varivel dispomos dos dados de uma forma desarrumada e, naturalmente, devemos organiz-los. Essa organizao facilita a interpretao dos dados e condensa
o nmero de informaes. No rara as situaes onde existem vrios valores repetidos. Denominamos
freqncia absoluta, ou simplesmente freqncia, o nmero de vezes que um determinado valor da varivel
aparece. Somos capazes de observar muito mais facilmente estes valores ordenados se os dispusermos em
uma coluna e, ao lado de cada valor, a sua respectiva freqncia. Esta tabela, portanto, denominada distribuio de freqncia ou dados agrupados.
ESTATSTICA E PROBABILIDADE
21
1.7.1
Tipos de Freqncias
8
Absoluta
>
>
Simples
>
Relativa
>
>
>
>
<
8
Freqncia
Absoluta
>
>
>
crescente
>
<
>
Relativa
>
Acumulada
>
>
>
Absoluta
>
>
:
: decrescente
Relativa
fi
f ri = X .
fi
i
Claro que
f ri = 1.
1.7.2
1a - Variveis Qualitativas
As variveis qualitativas obtidas em uma pesquisa podem ser organizadas em formas de tabelas para
facilitar a visualizao e anlise dos dados. Por exemplo, considere as respostas de 30 pessoas que foram
entrevistadas sobre as bebidas preferidas durante a refeio. Os resultados foram os seguintes:
22
gua
Suco
gua
Suco
Refrigerante
Suco
Refrigerante
Refrigerante
Outras
Suco
Refrigerante
Suco
Outras
Refrigerante
Refrigerante
Suco
gua
Suco
Suco
Cerveja
Suco
Refrigerante
Suco
Refrigerante
Refrigerante
Cerveja
gua
Suco
Outras
Suco
TABELA DE FREQNCIAS
Bebida
preferida
Freqncia
simples
absoluta
Freqncia
acumulada
absoluta
Freqncia
simples
relativa
Freqncia
acumulada
relativa
gua
0, 13
0, 13
Cerveja
0, 07
0, 20
Refrigerante
15
0, 30
0, 50
Suco
12
27
0, 40
0, 90
Outras
30
0, 10
1, 00
Total
30
1, 00
1.7.3
No exemplo a seguir, as informaes foram obtidas atravs de um processo de contagem. Portanto, trata-se
de uma varivel discreta.
Um outro exemplo envolve o nmero de defeitos apresentados por uma mquina industrial durante o perodo
de 30 dias. Os resultados foram os seguintes:
1
1 1
1 1
0 1
2 0
0 2
1 1
1 3
4 1
0 2
3 1
2 1
0 1
TABELA DE FREQNCIAS
Nmero
de
defeitos
Freqncia
simples
absoluta
Freqncia
acumulada
absoluta
Freqncia
simples
relativa
Freqncia
acumulada
relativa
0, 20
0, 20
17
23
0, 57
0, 77
27
0, 13
0, 90
29
0, 07
0, 97
30
0, 03
1, 00
Total
30
1, 0
Nota 1. A tabela de freqncias para uma varivel qualitativa ou uma varivel quantitativa discreta
tambm chamada de distribuio de freqncias para dados no-agrupados em classes.
ER 1. Preencher a tabela que indica o nmero de salrios mnimos dos alunos da turma de estatstica com
ESTATSTICA E PROBABILIDADE
23
fi
f ri
F ci
F di
F cri
F dri
(a) Qual a probabilidade de sortearmos, nesta turma, uma pessoa que possui vencimentos igual a 7 salrios
mnimos?
(b) Qual a probabilidade de sortearmos, nesta sala, uma pessoa que recebe no mximo 7 salrios mnimos?
(c) Qual a probabilidade de sortearmos, nesta turma, uma pessoa que recebe no mnimo 5 salrios mnimos?
Soluo:
Valor
fi
f ri
F ci
F di
F cri
F dri
0, 05
20
0, 05
1, 00
0, 15
17
0, 20
0, 95
0, 20
13
0, 40
0, 80
0, 35
15
0, 75
0, 60
0, 20
19
0, 95
0, 25
0, 05
20
1, 00
0, 05
20
(a) 0, 20, pois, justamente a freqncia relativa correspondente freqncia absoluta de sete salrios
mnimos
(b) Quando se diz no mximo sete salrios mnimos, deve-se considerar o conjunto de pessoas que ganham
at sete salrios. Assim, a probabilidade 0, 95 que a freqncia acumulada crescente correspondente.
(c) Quando se diz no mnimo cinco salrios mnimos, deve-se considerar o conjunto de pessoas que ganham
cinco salrios ou mais. Assim, a probabilidade 0, 80 que a freqncia acumulada decrescente
correspondente.
1.7.4
No caso em que a srie estatstica apresenta variveis quantitativas contnuas, existe a necessidade de
organizar os dados originais em uma distribuio de freqncias na qual os valores observados so agrupados
em classes de valores. Portanto, adotemos a seguinte nomenclatura:
1. Mximo (max): maior valor pertencente ao conjunto.
2. Mnimo (min): menor valor pertencente ao conjunto.
3. Amplitude total (AT): a diferena entre o valor mximo e mnimo
AT = max min .
24
1.7.5
No existem regras gerais para a determinao do nmero de classes em uma distribuio. No entanto,
algumas regras so propostas por autores que nos do uma idia aproximada do nmero de classes em
funo do nmero de dados.
A determinao do tamanho e da quantidade de classes deve observar as seguintes normas:
1.7.6
A Regra de Sturges
Um dos mtodos mais utilizados o chamado de regra de Sturges ou regra do logaritmo. Ele estabelece
que o nmero de classes k ser o inteiro imediatamente superior ou igual a log2 (2n), em que n o nmero de
dados, isto ,
log2 (2n) k < log2 (2n) + 1, k Z.
Aplicando-se as propriedades concernes aos logaritmos
log2 (2) +
1
log(n) k k 1 + 3, 32 log(n),
log(2)
ESTATSTICA E PROBABILIDADE
25
Nota 2. Podemos encontrar o valor de k sem, necessariamente, ter que utilizar uma calculadora ou uma
tbua de logaritmos. Para isso, considere as seguintes potncias de base dois
21
22
23
24
25
26
27
28
29
210
211
212
q
2
q
4
q
8
q
q
q
q
q
q
q
q
q
16 32 64 128 256 512 1024 2048 4096.
Seja n um valor que representa a quantidade de dados. Como k o inteiro imediatamente superior ou
igual a log2 (2n), podemos escrever que k 1 < log2 (2n) k . Logo, 2k 1 < 2n 2k e, em seqncia,
2k 2 < n 2k 1 .
1.7.7
A Regra do Quadrado
n, k Z.
1.7.8
Sendo k o nmero de classes, determina-se a amplitude do intervalo de classes h, como sendo um valor
AT
, pois, desta forma, haver uma pequena folga na ltima classe. Com este procedligeiramente superior a
k
imento aumentamos a amplitude total que os dados nos permitiram obter, mas, claro que quanto menor for
este aumento, mais expressivos sero os resultados obtidos.
Para montar a tabela (distribuio de freqncias) devemos definir as classes: a partir do valor mnimo da
amostra e a amplitude de classe h temos a primeira classe. O primeiro elemento das classes seguintes sempre
sero formadas pelo ltimo elemento da classe anterior.
ER 2. Antes de enviar um lote de aparelhos eltricos para venda, o Departamento de Inspeo da empresa
produtora selecionou uma amostra casual de 32 aparelhos avaliando o desempenho atravs de uma medida
especfica, obtendo os seguintes resultados:
154 165 175 180 190 195 202 211 155 170 176 180 190 198 205 212
156 172 178 180 190 200 205 215 164 175 178 184 192 200 210 218
Construir uma tabela de distribuio de freqncias com intervalos de classes.
Soluo: Neste caso, n = 32 e pela regra de Sturges
24 < 32 25 k 1 = 5 k = 6.
A amplitude total ser dada por AT = 218 154 = 64. Assim, a amplitude de cada intervalo de classe ser:
h=
26
64
AT
=
10, 67.
k
6
Aproximando para o inteiro mais prximo, temos que h = 11. Dessa forma, a tabela de distribuio de
freqncias para dados agrupados em classes fica da seguinte maneira:
Tabela de Freqncias
Freqncia
simples
Freqncia
simples
Freqncia
simples
absoluta
acumulada
relativa
154 165
Medida
0, 13
165 176
0, 16
176 187
16
0, 22
187 198
21
0, 16
198 209
27
0, 19
209 220
32
0, 16
Total
32
1, 00
1.7.9
Informaes relativas aos verdadeiros valores das sries estatsticas so perdidas ao efetuarmos uma distribuio de freqncias por classes j que uma uma simplificao da realidade ocorre. Alm disso, esse
processo de classificao dos dados no nos permite um tratamento estatstico adequado para a descrio
dos dados. Contornarmos esse problema se adotarmos a hiptese de que todos os valores de uma classe so
iguais ao valor que se encontra no centro da classe. chamamos esse valor representativo de uma classe de
ponto mdio ou ponto central.
No caso da varivel contnua o ponto mdio da classe, que representaremos por xm , definido por:
1
xm = lm + hm ; m = 1, 2, . . . , k ,
2
onde,
xm
lm
hm
k
:
:
:
:
1.7.10
1
11 = 181, 5.
2
Exerccios Propostos
EP 1.14. A tabela abaixo mostra a distribuio de freqncia dos salrios anuais, em reais, de 65 empregados
de uma firma. Determine:
ESTATSTICA E PROBABILIDADE
27
Empregados
5.000 5.999
6.000 6.999
8
10
8.000 8.999
9.000 9.999
14
10
Total
65
7.000 7.999
16
10.000 10.999
11.000 11.999
5
2
Salrios
5 2
6 2
6
6
4 1
5 2
6 3
2 5
3 5
2 5
1 3
1 3
6 3
6 5
4 5
1 5
4 3
6 2
1
4
3 5
6 1
4 4
5 2
2 6
4 3
EP 1.17. Forme a distribuio de freqncia em intervalos de classes, a partir das seguintes notas de um
teste de inteligncia:
64 78 66 82 74
65 78 86 83 87 73 95 82 89 73
92 85 80 81 90
68 96 86 70 72
95 94 88 62 91
74 84 99 81 89 71 73 63 55 74
83 98 93 83 76 94 75 67 95 80
98 78 78 83 96
98 71 92 72 73
78 86 78 61 85
76 80 92 62 73
98 75 73 90 86 86 84 86 76 76
87 70 85 79 93 82 90 83 81 85
83 73 86 84 85
72 81 96 81 85
EP 1.18. Obtenha a distribuio de freqncia dos dados abaixo, que representam a quantidade vendida de
automveis no decorrer de um ms:
14 12 11 13 14 13 12 14 13 14 11 12
12 14 10 13 15 11 15 13 16 17 14 14
EP 1.19. [TTN] Considere a distribuio de freqncias abaixo e identifique a afirmativa correta:
(a) 65% das observaes tm peso no inferior a 4 kg e inferior a 10kg .
(b) Mais de 65% das observaes tm peso maior ou igual a 4kg .
(c) Menos de 20 observaes tm peso igual ou superior a 4kg .
(d) A soma dos pontos mdios dos intervalos de classe inferior ao tamanho
da populao.
(e) 8% das observaes tm peso no intervalo de classe 8 10.
Peso (kg)
2
4
6
8
10
fi
6
8
12
6
10
12
2
1
Total
EP 1.20. A tabela abaixo representa os salrios pagos a 100 operrios de uma empresa. Pede-se:
28
Salrios
(a) no de operrios que ganham at dois salrios mnimos;
mnimos
Operrios
40
30
6
8
10
15
10
4
6
Total
EP 1.21. Assinale, entre as alternativas, aquela que contiver uma afirmao verdadeira.
(a) Reunindo-se dados brutos em classes pode-se obter o nmero de indivduos pertencentes a cada uma
das classes, que denominado freqncia da classe.
(b) Os intervalos de classe precisam ser necessariamente iguais, na elaborao de uma tabela que apresente
uma distribuio de freqncia.
(c) O limite superior real da classe 150 155 155.
(d) O limite inferior real da classe 150 155 150.
(e) n.d.a.
EP 1.22. Assinale, entre as alternativas, aquela que contiver uma afirmao verdadeira.
(a) A amplitude do intervalo de classe calculada pela soma entre os limites reais inferior e superior de uma
classe.
(b) Obtm-se o ponto mdio de uma classe pela mdia aritmtica dos limites inferior e superior reais de uma
classe.
(c) Um intervalo de classe aberto em seus dois limites inclui ambos os nmeros extremos.
(d) Intervalos de classe fechados tm seus limites superior e inferior reais excludos dos nmeros que os
compem.
(e) n.d.a.
EP 1.23. [TTN] Os intervalos de classe podem ser apresentados de vrias maneiras. Dentre as situaes
abaixo a correta :
29
DURAO
(HORAS)
EP 1.24. Considere a distribuio de freqncias abaixo, da durao de 400 vlvulas de rdio, ensaiadas pela Companhia tima
S/A. Os limites superiores reais da quinta e oitava classes e a am-
300
400
500
600
700
800
900
1.000
1.100
NMERO
VLVULAS
399
499
599
699
799
899
999
1.099
1.199
14
46
58
76
68
62
48
22
6
400
Total
EP 1.25. Com respeito a questo 1.24, a porcentagem das vlvulas, cuja durao de 500 horas, no mnimo,
mas inferior a 1.000 horas:
(a) 78%
(b) 77%
(c) 79%
(d) 80%
(e) 85%
EP 1.26. Ouvindo-se 300 pessoas sobre o tema reforma da previdncia, contra ou a favor?, foram obtidas
123 respostas a favor, 72 contra, 51 pessoas no quiseram opinar, e o restante no tinha opinio formada sobre
o assunto. Distribuindo-se esses dados numa tabela, obtm-se:
OPINIO
fi
fr
Favorvel
123
Contra
72
Omissos
51
0, 17
Sem Opinio
54
0, 18
Total
400
1, 00
(e) 0, 30 e 0, 35;
(c) 0, 37 e 0, 28;
(FT/MG) responda s questes 1.27 e 1.28 com base na seguinte situao: a distribuio a seguir indica o
nmero de acidentes ocorridos com 40 motoristas de uma empresa de nibus.
Acidentes
Motoristas
13
10
(b) 6
(c) 10
(d) 27
(e) 304
(b) 32, 5%
(c) 42, 5%
(d) 57, 5%
(e) 75%
6
8
Dimetro(cm)
10
12
fi
8
10
8
12
12
14
10
4
1.8
Apresentao Grfica
A representao grfica de sries estatsticas constitui-se num fator importante em apresentaes de trabalhos. Esta representao pode ser dividida em trs grandes grupos: os diagramas; os cartogramas; e os
estereogramas.
Diagramas - so figuras geomtricas dispostas em duas dimenses. So os mais usados na
representao de sries estatsticas.
Cartogramas - as sries estatsticas so representadas em cartas geogrficas.
Estereogramas - representam volumes e so apresentados em trs dimenses sendo, portanto,
necessrio algum conhecimento de perspectiva.
Apresentaremos, aqui, apenas os principais diagramas, que podem ser utilizados para qualquer representao de uma srie estatstica. So eles: o grfico em barras; o grfico em colunas; o grfico em curvas; o
grfico em setores; e os Histogramas.
Recomenda-se a seguinte utilizao de correspondncia entre as sries estatsticas e a sua representao
grfica.
TIPO DE SRIE
ESTATSTICA
FATOR VARIANTE
Temporal
poca
Especificativas
Fenmeno
Geogrficas
Local
Distribuio
de freqncias
Intensidade
do fenmeno
Histograma (contnua),
Basto (discreta),
Barras, Colunas ou Setores (qualitativa)
1o . Grfico em Colunas
Exemplo 1.11. Srie Geogrfica
o grfico que corresponde ao Histograma, porm, utilizado na representao de dados nominais (ou
categorias) ou em sries temporais. Pode-se, tambm, usar barras horizontais.
Bairro
Nmero de crianas
Paripe
Periperi
Plataforma
Praia Grande
11
39
45
25
Total
120
Periperi Plataforma
Praia
Grande
ESTATSTICA E PROBABILIDADE
31
1.998
1.999
2.000
Exatas
Humanas
Biolgicas
120
72
169
156
85
145
68
112
73
150
Humanas
Biolgicas
100
50
1.998
1.999
2.000
2o . Grfico em Barras
Exemplo 1.13. Srie Especificativa
de crdito da Mastercard
Internacional no Brasil - 2.000
Tipo de fraude
Quantidade
243
85
52
46
Carto roubado
Carto falsificado
Pedido por correio/telefone
Outros
Outros
Pedido por
correio/telefone
Carto Falsificado
Carto Roubado
0
50
100
150
200
250
300
Quantidade
3o . Grfico de Pareto
O grfico de Pareto composto por barras verticais e por uma curva representado a percentagem acumulada. As barras esto disponveis em ordem decrescente, tornando evidente a priorizao de temas. Este
grfico muito utilizado na rea de Controle de Qualidade.
Exemplo 1.14 (Werkema, volume 2). Uma indstria fabricante de lentes tem como objetivo resolver o seguinte
problema: aumento do nmero de lentes defeituosas produzidas pela empresa a partir de fevereiro de 1995. A
empresa classificou uma amostra de lentes fabricadas durante uma semana de produo de acordo com os
tipos de defeitos detectados. O resultado est na tabela abaixo:
DEFEITOS ENCONTRADOS EM UMA AMOSTRA DE LENTES FABRICADAS
DURANTE UMA SEMANA DE PRODUO DE UMA INDSTRIA
Tipo de defeito
Quantidade
Arranho
12
Trinca
Revestimento inadequado
41
55
11
05
Outros
03
127
Total
Uma maneira de representarmos graficamente estes dados atravs do grfico de Pareto. Para construirmos o grfico de Pareto necessrio obtermos a planilha de dados mostrada na tabela a seguir.
PLANILHA DE DADOS PARA CONSTRUO DO GRFICO DE PARETOS
Tipo
de defeito
Quantidade
de defeito
Total
Acumulado
Percentagem do
Total Geral(%)
Percentagem
Acumulada
Revest. Inadeq.
Trinca
Arranho
Fina ou Grossa
No-Acabada
Outros
55
41
12
11
5
3
55
96
108
119
124
127
43, 3
32, 3
9, 4
8, 7
3, 9
2, 4
43, 3
75, 6
85, 0
93, 7
97, 6
100, 0
Total
127
100, 0
Nesta tabela, os tipos de defeitos foram listados em ordem decrescente de quantidade na coluna 1, a
quantidade de defeitos aparece na coluna 2 e o total acumulado est na coluna 3. Nas colunas 4 e 5 esto
as percentagens totais e as percentagens acumuladas respectivamente. As barras do grfico de Pareto foram
construdas a partir dos dados da coluna 2 e a curva acumulada conhecida como curva de Pareto, foi traada
a partir dos nmeros da coluna 5.
80
100
60
40
50
20
0
Revestimento
Inadequado
Trinca
Arranho
Fina ou
Grossa
No acabada
Outros
Defeitos
Observando o grfico acima, foi imediato para indstria perceber que os dois tipos de defeitos mais freqentes, Revestimento inadequado e trinca , representavam 75, 6% dos defeitos detectados nas lentes produzidas pela empresa. Portanto, Revestimento inadequado e Trinca foram considerados os defeitos mais
importantes, que devem ser eliminados em primeira lugar esse tipo de defeito chamado de poucos defeitos
vitais, enquanto que os outros representam apenas os muitos defeitos triviais, pois, representam a minoria das
observaes.
33
IPI, BRASIL-1979
Meses
IPI
JAN
18.633
17.497
FEV
19.470
MAR
ABR
18.884
20.308
MAI
JUN
20.146
20.258
JUL
21.614
AGO
SET
19.717
22.133
OUT
20.503
NOV
Fonte: IBGE
JAN FEV MAR ABR MAI JUN JUL AGO SET OUT NOV
5o . Grfico em Setores
Exemplo 1.16. Srie Geogrfica
Percentual de funcionrios dos coletivos
de Salvador segundo rea de residncia
rea de residncia
39, 1%
17, 2%
Percentual
Centro
17, 2
Subrbio
39, 1
Periferia
43, 7
Centro
Subrbio
Periferia
43, 7%
fi
xi
fi
10
1
2
20
30
3
4
25
10
40
30
20
10
xi
7o . Histograma
muito utilizado na representao grfica de dados agrupados em intervalos de classes, o que ocorre
normalmente com dados contnuos e, conseqentemente, h perda de informao. O seu uso recomendado
quando
- existem valores no inteiros para a varivel;
- a quantidade de valores da varivel grande, no caso de valores inteiros (discretos);
- no importante a perda de informao ocasionada pelos dados apresentados.
34
No caso de classes com a mesma amplitude, construdo um retngulo para cada classe com base igual
amplitude do intervalo de classe e altura proporcional a freqncia da classe. Quando temos classes com amplitudes diferentes, devemos construir um retngulo para cada classe, com base igual amplitude do intervalo
de classe e altura dada por:
freqncia
( 1.1)
h=
amplitude
Note que a rea do retngulo igual a freqncia da classe. A altura h em ( 1.1) chamada de densidade de
freqncia.
Exemplo 1.18. Histograma para a distribuio de freqncia do exemplo 2.
TABELA DE FREQNCIAS
Medida
fi
F ci
f ri
154 165
4
4
0, 13
5
9
0, 16
165 176
176 187
7
16
0, 22
5
21
0, 16
187 198
6
27
0, 19
198 209
209 220
5
32
0, 16
Total
32
1, 00
8
6
fi
4
2
0
154165 165176 176187 187198 198209 209220
Medida
Exemplo 1.19. Histograma para a distribuio de freqncias com amplitudes diferentes.
TABELA DE FREQNCIAS
Medida
fi
F ci
f ri
150 155
3
3
0, 09375
155 161
4
7
0, 125
5
12
0, 15625
161 173
3
15
0, 09375
173 177
177 184 10
25
0, 3125
1
26
0, 03125
184 198
198 206
3
29
0, 09375
3
32
0, 09375
206 220
Total
32
1, 00000
15
5
1
15
16
0 55
1
16
17
1
3
17
7
4
17
18
3 77
1
18
19
4
8
19
20
8
6
20
22
6
8o . Polgono de Freqncias
a representao grfica de uma distribuio por meio de um polgono e obtido ao se unir por um
segmento de reta dois pontos mdios consecutivos das bases superiores dos retngulos de um histograma.
Idade
2
4
6
8
10
fi
4
6
8
10
12
F ci
4
6
10
7
3
Total
fi
10
7
6
4
3
10
12
35
fi
fi
16
2
4
2
7
14
6
8
3
1
10
Notas
0
2
4
6
8
12
10
8
6
4
2
Total
0
1.8.1
10
Notas
H vrios problemas com este grfico. Ele impressiona mais pela tecnologia utilizada do que pela informao que passa para o leitor. Os dados no so tridimensionais. As grades do fundo mais o efeito tridimensional distraem a viso e dificultam comparaes entre trimestre e regies. Uma forma de melhorar o grfico
dar-lhe a dimenso correta. Pode-se eliminar as linhas de grade. No utilize faixas horizontais, verticais ou
similares, que s atrapalham a viso do leitor. Faa mais de um grfico at encontrar um que seja informativo,
claro, e que no possua objetos desnecessrios.
No apresente grficos suprfluos. Se retirarmos a figura abaixo, toda a informao poder ser transmitida
textualmente, com uma simples frase: 80% das respostas foram positivas e 20% negativas.
O grfico abaixo tem alguns problemas. Primeiro, o efeito 3-D dificulta o julgamento das porcentagens
relativas de cada categoria da varivel. A retirada do efeito 3-D ajudar o leitor a julgar melhor as propores
relativas observadas em cada amostra.
1.8.2
Exerccios Propostos
EP 1.30. [TCU] Grficos so instrumentos teis na anlise estatstica. Assinale a afirmao incorreta.
(a) Um histograma representa uma distribuio de freqncias para variveis do tipo contnuo.
(b) O grfico de barras representa, por meio de uma srie de barras, quantidades ou freqncias para variveis categricas.
(c) O grfico de setores apropriado, quando se quer representar as divises de um montante total.
(d) Um histograma pode ser construdo utilizando-se, indistintamente, as freqncias absolutas ou relativas
de um intervalo de classe.
(e) Uma ogiva pode ser obtida ligando-se os pontos mdios dos topos dos retngulos de um histograma.
EP 1.31. [AFTN] Analise a opo correta.
(a) A utilizao de grficos da barra ou de colunas exige amplitude de classe constante na distribuio de
freqncia.
(b) O histograma um grfico construdo com freqncias de uma distribuio de freqncias ou de uma
srie temporal.
(c) O polgono de freqncia um indicador grfico da distribuio de probabilidade que se ajusta distribuio emprica a que ele se refere.
(d) O histograma pode ser construdo para a distribuio de uma varivel discreta ou contnua.
36
(e) O polgono de freqncia construdo unido-se os pontos correspondentes aos limites inferiores dos
intervalos de classe da distribuio de freqncia.
EP 1.32. [TCDF] Em relao aos tipos de grficos, assinale a opo correta.
(d) Histograma
(e) Ogivograma
(a) A freqncia relativa nos fornece o nmero de observaes dentro de cada intervalo de classe.
(b) Ao falarmos em distribuio de freqncias estamos nos referindo a uma populao. Quando tratamos
com amostra, nos referimos a distribuio de probabilidade.
(c) Curvas de freqncias simtricas so aquelas em que as observaes equidistantes do ponto central tm
a mesma freqncia.
(d) Um polgono de freqncias um conjunto de retngulos, cujas reas so proporcionais s freqncias
das classes.
(e) A amplitude de um intervalo de classe a diferena entre o limite superior e o ponto mdio do intervalo.
A Estatstica Descritiva consiste em um conjunto de mtodos que ensinam a reduzir uma quantidade de
dados, bastante numerosa, em um nmero pequeno de medidas que substituem e representam aquela massa
de dados.
Quatro tipos fundamentais de medidas descritivas so estudadas:
(i) medidas de posio (ou de locao ou de localizao);
Entre as medidas de posio, aquelas que tendem a estar no centro da distribuio so chamadas de
medidas de tendncia central. Veremos tambm algumas idias gerais sobre assimetria e anlise exploratria
de dados.
ESTATSTICA E PROBABILIDADE
37
1.9
Medidas de Posio
Mdia Aritmtica
Mdia Geomtrica
Mdia Harmnica
Mediana
Quartis
Decis
Centis ou Percentis
Moda de Czuber
Moda de King
Moda de Pearson
Medidas de Posio
Representativas
1.9.1
Separatrizes
Dominantes
Mdia Aritmtica
Considere um conjunto de dados numricos X = {xi ; i = 1, 2, . . . , n}. Uma mdia para X um valor que
pode substituir todos os valores da lista sem alterar uma determinada caracterstica da lista.
Se a caracterstica a ser mantida a soma dos elementos de X , obtemos a mdia aritmtica. Ou seja, a
mdia aritmtica dos nmeros do conjunto X um valor x tal que
x1 + x2 + . . . + xk = x + x + . . . + x = k x .
Logo,
k
X
xi
x1 + x2 + . . . + xk
i =1
=
( 1.2)
x =
k
k
ER 4. Um estudante obteve, durante o ano letivo, as seguintes mdias para os quatro bimestres: 4.5, 6.5, 7,
6. Sabendo que a mdia final nessa instituio de ensino 5, determine se o aluno foi aprovado.
Soluo: A mdia do aluno x =
4.5 + 6.5 + 7 + 6
= 6. Portanto, o aluno foi aprovado.
4
Se o conjunto de dados numricos for X = {xi ; i = 1, 2, . . . , k }, em que cada elemento xi possui freqncia
fi , a mdia aritmtica para o conjunto X definida por:
k
X
x =
i =1
xi fi
n
,n =
k
X
fi .
( 1.3)
i =1
ER 5. Em um determinado dia de campanha de vacinao contra hepatite 100 crianas se vacinaram num
posto de sade. Destas 25 crianas tinham 12 anos, 35 crianas tinham 14 anos e, o restante, 15 anos.
Determine a mdia das idades das crianas.
n
X
Soluo: A mdia x =
i =1
xi fi
n
12 25 + 14 35 + 15 40
.
100
Pode-se entender, em diversas situaes, as freqncias com que os dados numricos de X , os quais queremos sintetizar, como diferentes graus de importncia para cada xi . A mdia aritmtica chamada, portanto,
mdia aritmtica ponderada em que as respectivas freqncias dos elementos de X so uma espcie de peso
(ou ponderao) aos valores possveis da varivel xi .
38
ER 6. Um estudante obteve mdias 8, 0, 7, 0 e 6, 0 nos trs primeiros bimestres do ano letivo. Sabendo-se que
em seu colgio adotado o sistema de pesos 1, 2, 3 e 4 para os quatro bimestres, respectivamente, calcule a
mdia que ele deve obter no quarto bimestre para que ele consiga a mdia anual 7, 0, necessria para passar
direto na disciplina.
40 + 4n
81+72+63+n4
=
, donde n = 7, 5.
1+2+3+4
10
Quando os valores das freqncias (pesos) de cada xi so iguais, a mdia aritmtica dita simples e ganha
esta palavra um cunho facultativo.
Nota 3. A mdia aritmtica a principal medida de tendncia central. Algumas das razes que fazem
com que seja a medida de posio mais recomendada so:
definida rigorosamente e pode ser interpretada sem ambigidades;
Leva em considerao todas as observaes efetuadas;
Calcula-se com facilidade.
Entretanto, esta medida apresenta alguns inconvenientes como o fato de ser muito sensvel a valores
extremos, isto , a valores excessivamente pequenos ou excessivamente grandes, em relao s demais
observaes do conjunto de dados. Por exemplo: Se estivermos interessados em conhecer o salrio
mdio de certa empresa com cinco funcionrios e obtivermos o seguinte conjunto de dados, em reais:
123 145 210 225 2.500;
podemos observar que quatro dos cinco salrios apresentam valores entre 123 e 225 reais, porm a mdia
salarial de 640, 6 reais bastante distinta desse conjunto pela influncia do salrio de 2.500 que puxou o
valor mdio para cima.
x =
xi
i =1
n
X
fi
( 1.4)
fi
i =1
39
Nota 4. Calculamos, aqui, a mdia aritmtica ponderada para valores agrupados discretamente, pois, as
classes so substitudas pelo seus respectivos pontos mdios.
ER 7. Calcule a mdia aritmtica para os dados agrupados
em classes.
Classes
fi
2
4
4
6
3
5
10
8
10
10
12
5
3
Soluo:
fi
xi
6
8
5
10
5
7
25
70
10
12
5
3
9
11
45
33
4
6
8
10
Total
26
5
X
x =
xi
i =1
5
X
fi
182
= 7.
26
fi
i =1
182
1.9.2
xi fi
Classes
2
Exerccios Propostos
EP 1.35. Um aluno da turma de estatstica da Faculdade XY obteve notas 5, 0 e 7, 0 em duas provas realizadas. Se adicionarmos a cada nota o valor 10 a mdia aritmtica
(a) fica adicionada do mesmo valor. (c) fica multiplicada do mesmo valor.
(e) n.d.a.
(b) a mesma.
EP 1.36. Um aluno da turma de estatstica da Faculdade XY obteve notas 5, 0 e 7, 0 em duas provas realizadas. Se multiplicamos cada nota pelo valor 10 a mdia aritmtica
(a) fica adicionada do mesmo valor. (c) fica multiplicada do mesmo valor.
(e) n.d.a.
(b) a mesma.
EP 1.37. Dados os conjuntos de nmeros: A = {100, 101, 102, 103, 104, 105} e B = {0, 1, 2, 3, 4, 5}, podemos
afirmar que:
(b) 65%
(c) 68%
(d) 70%
(e) 72%
xi
fi
(b) 9, 5
(c) 9, 3
(d) 9, 8
(e) 10, 2
(a)
Valor
fi
fi
24
9
46
12
68
6
8 10
2
10 12
(d)
fi
46
6
68
8
8 10
12
10 12
10
12 14
4
Classes
fi
5 25
25 45
4
6
45 65
14
105 125
125 145
8
6
65 85
85 105
26
14
145 165
Total
1.9.3
Mdia Geomtrica
Se o produto dos elementos de X a caracterstica a ser mantida, obtemos a mdia geomtrica. Ou seja,
a mdia geomtrica dos nmeros positivos e no nulos do conjunto X um valor positivo g tal que
x1 x2 . . . xn = g g . . . g = g n .
Logo,
g =
n
x1 x2 . . . xn =
n
Y
( 1.5)
xi
i =1
3
3 36 54 = 18.
41
Seja fi o peso atribudo ao respectivo valor que a varivel xi X assume. A mdia geomtrica ponderada
dos n nmeros positivos do conjunto X um valor positivo gp tal que
fi .
gp =
k
X
k
Y
xifi
( 1.6)
i =1
10
12 34 53 71 3, 0553.
xi
fi
1
3
5
7
2
4
3
1
10
4 9
= 1.
X = {4, 9}, g = 4 9 = 6 e
6 6
2. Sries que possuem o mesmo nmero de elementos com a mesma soma apresentam a mesma mdia
aritmtica e as sries que possuem o mesmo nmero de elementos com o mesmo produto tm a mesma
mdia geomtrica. Por exemplo,
X = {2, 5, 8}, x = 5; X = {2, 4, 9}, x = 5; Y = {2, 4, 7}, g = 3, 8259; Y = {1, 2, 28}, g = 3, 8259.
3. Se houver, pelo menos, um zero entre os valores da distribuio, a mdia geomtrica ser nula.
4. A mdia geomtrica tambm influenciada pelos valores extremos da distribuio.
1.9.4
Mdia Harmnica
Se a soma dos inversos dos elementos de X a caracterstica a ser observada, obteremos a mdia harmnica. Ou seja, a mdia harmnica dos nmeros positivos e no nulos do conjunto X um valor positivo h
tal que
1
n
n
1
1
1
1 1
n
.
+
+ ...+
= + + . . . + = h =
= n
1
1
1
X
x1
x2
xn
h h
h
h
1
+
+ ...+
x1
x2
xn
x
i =1 i
Podemos, facilmente, concluir que a mdia harmnica o inverso da mdia aritmtica dos inversos dos
nmeros.
ER 9. Determine a mdia harmnica dos nmeros 3, 36 e 54.
Soluo: h =
3
7, 9.
1
1
1
+
+
3 36 54
Nota 5. Evitamos a possibilidade de no existirem as mdias geomtrica e harmnica uma vez que estas
s foram definidas para nmeros positivos.
42
hp =
n
f1
f2
fk
+
+ ... +
x1
x2
xk
k
k
X
i =1
Soluo:
mnica da distribuio
xi
fi
1
3
2
4
5
7
3
1
( 1.7)
fi
xi
xi
fi
xifi
1
3
2
4
1
81
5
7
3
1
125
7
hp =
10
1 81 125 7 3, 05526797.
10
x + h
.
2
3. A presena de pelo menos um valor igual a zero inviabiliza o clculo da mdia harmnica.
4. Valores extremos tambm influenciam a mdia harmnica.
1.9.5
Mdia Quadrtica
Se a soma dos quadrados dos elementos de X a caracterstica a ser conservada, obteremos a mdia
quadrtica. Ou seja, a mdia quadrtica dos nmeros do conjunto X um valor positivo q tal que
q =
x12
x22
+ ... +
n
xn2
n
X
i =1
xi2
( 1.8)
isto , a mdia quadrtica a raiz quadrada da mdia aritmtica dos quadrados dos nmeros. Este tipo de
mdia bastante usado em Estatstica no clculo do desvio-padro.
ESTATSTICA E PROBABILIDADE
43
22 + 32 + 52
2, 4495.
3
Vejamos agora alguns exemplos para ilustrar a utilizao dos diferentes tipos de mdias.
ER 11. Uma empresa produziu durante o 1 trimestre do ano passado 500, 200 e 200 unidades em janeiro,
fevereiro e maro, respectivamente. Qual foi a produo mdia mensal?
Soluo: Que mdia devemos usar?
Queremos a produo mdia M , tal que se a produo mensal fosse sempre igual a M , a produo
trimestral seria a mesma. Uma vez que a produo trimestral
500 + 200 + 200 = 900 = M + M + M .
Ento, 3M = 900 e M = 300 (mdia aritmtica).
ER 12. Uma empresa aumentou sua produo durante o primeiro bimestre do ano passado. Em janeiro e em
fevereiro as taxas de aumento foram de 21% e 8%, respectivamente. Qual a taxa mdia de aumento mensal
neste bimestre?
(21% + 8%)
Soluo: Cuidado! No devemos fazer
= 14, 5%. Vamos pensar na soluo correta.
2
Que tipo de mdia devemos usar? Queremos uma taxa mdia i , tal que se em cada ms a taxa de
aumento fosse igual a i , o aumento bimestral seria o mesmo. E qual foi o aumento bimestral?
Sem perda de generalidade suponha que a produo em dezembro tenha sido de 100 unidades. Ento,
a produo em janeiro e em fevereiro so, respectivamente,
100 + (0, 21)100 =
121 1, 08 =
100 1, 21 = 121
100 1, 21 1, 08 = 130, 68
=
=
1, 21 1, 08
v=
44
d
d
2
d
=
=
=
,
1
1
d
1
d
d 1
t
+
+
+
v1
v2
2v1
2v2
2 v1
v2
ou seja,
v=
2
.
1
1
+
v1
v2
Observe, portanto, que a velocidade mdia a mdia harmnica das velocidades em cada trecho.
1.9.6
1.9.7
Exerccios Propostos
(b) 8
(c) 0
(d) 25
Classes
fi
1
3
5
7
9
2
4
12
4
2
(e) 4
3
5
7
9
11
fi
xi
Total
(e) n. d. a.
(b) xg x xh
(c) xg xh x
(d) xh xg x
(e) n.d.a.
(e) n. d. a.
xi
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
fi
1.9.8
Mediana
Chamamos de Mediana (Md ) o elemento que ocupa a posio central na distribuio ordenada (crescente
ou decrescente), isto , divide um rol em duas partes iguais de modo que 50% dos valores observados so
inferiores ao valor mediano e 50% superiores a esse valor.
Devemos considerar dois casos para calcular o elemento Mediana: o clculo da mediana para um conjunto
com valores no tabulveis e o outro conjunto com valores tabulveis. Devemos ainda considerar se os dados
deste conjunto so discretos ou agrupados em classes.
ESTATSTICA E PROBABILIDADE
45
Md =
x n2 + x n2 +1
,
2
( 1.9)
n par,
Md = x n+1 ,
2
n mpar.
( 1.10)
Soluo: Md =
xi
10
12
fi
10
15
12
6+6
x25 + x26
=
= 6.
2
2
P F ci 1
Md = li + hi
,
fi
n
a posio do elemento mediano;
2
li o limite inferior da classe mediana;
P =
( 1.11)
Classes
2
4
6
8
10
4
6
8
10
12
fi
F ci
3
5
7
4
1
3
8
15
19
20
20
Fci
=
= 10, temos que Md 6 8. Logo,
2
2
Soluo: Como P =
Md = li + hi
P F ci 1
10 8
=6+2
6, 57
fi
7
Total
Fonte: Dados Fictcios
A mediana uma medida de posio resistente, pois pouco afetada por mudanas de pequena poro
dos dados, ao contrrio da mdia aritmtica que sensvel a valores atpicos. Por exemplo, se
X
Y
=
=
{200, 250, 250, 300, 450, 460, 510}, xX = 345, 7 e MdX = 300.
{200, 250, 250, 300, 450, 460, 2.300}, xY = 601, 0 e MdY = 300.
Podemos observar que, no caso do conjunto Y , a mdia no sintetiza adequadamente o conjunto de dados,
pois, apenas um valor superior a ela.
Devemos empregar a mediana se: desejamos obter o ponto que divide a distribuio em duas partes iguais
(abaixo de ou acima de); existem valores extremos que afetam de uma maneira acentuada a mdia ou; a
varivel em estudo o salrio.
ER 17. Considere os seguintes dados que representam o nmero de mortes depois das erupes vulcnicas
que ficaram clebres:
Data
Nome vulco
N mortes
Data
Nome vulco
N mortes
79a.c .
16.000
1.902
1.000
1.169
1.631
15.000
4.000
1.902
1.911
30.000
1.400
1.669
1772
20.000
3.000
1.919
1.951
5.000
3.000
1792
1815
Mt. Unzen-Dake,Japan
Tamboro, Java
10.400
12.000
1.966
1.980
1.000
60
1.883
Krakatau, Indonesia
35.000
1.985
22.940
Mdia
Mediana
Soluo: Primeiramente, reescrevendo a tabela acima de modo que o nmero de mortes seja crescente,
ESTATSTICA E PROBABILIDADE
47
temos:
Data
Nome vulco
N mortes
Data
Nome vulco
N mortes
1.980
1.902
60
1.000
1792
1.815
Mt. Unzen-Dake,Japan
Tamboro, Java
10.400
12.000
1.966
1.000
1.169
15.000
1.911
1.772
1.400
3.000
79a.c .
1.669
16.000
20.000
1.951
1.631
3.000
4.000
1.985
1.902
22.940
30.000
1.919
5.000
1.883
Krakatau, Indonesia
35.000
179.800
16
Md =
x8 = x9
15.400
=
= 7.700.
2
2
479.800
= 29.987, 5. A mediana
16
(c) Neste caso a soma do nmero de mortes 480.340, donde a nova mdia x =
mediana a mesma, pois no alterou a ordem das classes.
180.340
= 11.271, 25. A
16
(d)
Mdia
Mediana
Dados originais
11.237, 5
29.987, 5
11.271, 25
7.700
7.700
7.700
A mediana ficou a mesma, pois a ordem das classes ficou a mesma, para cada alnea. J a mdia sofre
alteraes, uma vez que seu clculo depende diretamente do somatrio do nmero de mortes.
1.9.9
Moda
A moda outra importante medida de locao, mas, diferentemente das mdias, no se utiliza todos os valores do conjunto analisado em seu clculo. A Moda Mo o valor que ocorre com maior freqncia no conjunto
e em distribuies simples (sem agrupamento em classes) sua determinao facilitada pela observao do
elemento que apresenta maior freqncia. Por exemplo:
a) X = {2, 3, 3, 5, 5, 5, 6, 7}, Mo = 5;
b) Y = {10, 12, 17, 21, 32}, no existe moda, a distribuio amodal;
c) Z = {2, 2, 5, 5, 7, 7}, distribuio amodal;
d) W = {10, 12, 12, 12, 13, 13, 15, 18, 18, 18, 21}, distribuio apresentando dois valores modais, Mo1 = 12 e
Mo2 = 18 (distribuio bimodal).
e) Na tabela abaixo, observe que a determinao da moda (Mo = 3) imediata
48
xi
fi
Quando o conjunto de dados apresenta mais de uma moda damos o nome de distribuio plurimodal .
A moda uma medida mais adequada ao caso de dados agrupados. No caso de dados no agrupados, a
moda nem sempre tem utilidade com elemento representativo ou sintetizador do conjunto.
Quando a distribuio de freqncias est organizada por classes de valores, devemos identificar a classe
modal (classe em que observamos a maior freqncia). O ponto mdio da classe modal ser o valor estimado
para a moda que denominada Moda Bruta . Consideremos, por exemplo, o seguinte conjunto de dados:
Valores
11
15
17
19
21
25
fi
De acordo com a definio, a Moda 25, entretanto, este valor no representativo do conjunto de dados
e, portanto, a moda no uma boa medida de locao neste caso. Podemos obter a moda por outro mtodos:
Mtodo de King
A moda pelo Mtodo de King baseia-se na influncia das freqncias das classes adjacentes sobre a classe
modal.
fi +1
,
Mo = li + hi
fi 1 + fi +1
li o limite inferior da classe modal;
hi a amplitude do intervalo da classe modal;
fi 1 a freqncia absoluta da classe anterior classe modal.
fi +1 a freqncia absoluta da classe posterior classe modal;
Mtodo de Czuber
A moda pelo Mtodo de Czuber considera no apenas as freqncias das classes adjacentes classes
modal, mas tambm a freqncia da classe modal.
Mo = li + hi
fi fi 1
.
2fi (fi 1 + fi +1 )
Se fizermos 1 = fi fi 1 e 2 = fi fi +1 , ento
Mo = li + hi
1
1 + 2
Importante: Quando a questo no informar que moda obter, ento o que se pede a moda pelo Mtodo
de Czuber, por ser o valor mais preciso.
Frmula de Pearson
A moda Pearson dada, aproximadamente, pela diferena entre o triplo da mediana e o dobro da mdia,
ou seja,
Mo = 3 Md 2 x .
( 1.12)
Nota 6. Esta frmula apresenta uma boa aproximao quando existe uma razovel simetria.
ESTATSTICA E PROBABILIDADE
49
fi
Estaturas(cm)
fi
154
4
6
8
14
150
158
162
9
11
8
10
10
7
166
170
8
5
174
Notas
0
2
(a) 4
6
8
(b)
154
158
162
166
170
Total
Consumo(kW h)
5
25
(c)
Total
fi
25
45
10
45
65
65
85
24
50
105
125
64
72
125
145
145
165
78
80
85
105
Total
Nota 7.
Notas
fi
0
2
2
4
5
8
0
2
6
8
14
8
4
6
10
4
6
Total
Notas
fi
2
4
3
8
0
2
14
8
4
6
6
8
10
Notas
Total
fi
2
4
3
12
10
6
8
14
8
Total
x = Md = Mo .
Distribuio assimtrica : Quando existe diferena entre a mdia aritmtica, a mediana e a moda.
- positiva ( direita): A mdia aritmtica o maior dos valores e a mediana est entre a mdia
aritmtica e a moda.
x > Md > Mo .
- negativa ( esquerda): A mdia aritmtica o menor dos valores e a mediana est entre a mdia
aritmtica e a moda.
x < Md < Mo .
Nota 8. Para observamos o aspecto da assimetria atravs das medidas de tendncia central bastaramos
comparar a mdia aritmtica e a moda, visto que a mediana, em geral, situa-se entre estas duas medidas,
porm, devemos ter cuidado, pois, em alguns casos isto pode no ocorrer.
50
Nota 9. Quando usamos qualquer programa estatstico, os dados no so agrupados em classes. Desta
forma a mediana calculada como se os dados estivessem organizados de acordo com um rol.
Mdia
x =
Metade dos
valores so
maiores,
metade
menores.
Mediana
Valor
de
maior ocorrncia.
Moda
1.9.10
xi
i =1
Vantagens
Limitaes
Valor tpico;
Maior quantidade de valores
concentrados neste ponto.
No se presta a anlise
matemtica;
Pode no haver moda para certos conjuntos de dados, como
pode haver uma infinidade.
Exerccios Propostos
(c) X = {4, 6, 2, 7, 3, 8}
(e)
xi
fi
3
4
2
6
5
6
10
8
7
8
5
4
F ci
f)
Total
(h) 4
6
8
Total
fi
12
13
2
6
14
15
12
10
16
17
6
4
F ci
g)
Total
Notas
0
2
xi
fi
2
4
5
8
6
8
10
14
10
F ci
i)
fi
150 154
162 166
166 170
170 174
Total
fi
2
3
2
8
4
5
12
10
6
7
5
3
F ci
Total
Estaturas (cm)
154 158
158 162
xi
Consumo (kwh)
F ci
5 25
25 45
9
11
8
5
3
j)
fi
4
6
45 65
65 85
14
26
125 145
145 165
6
2
85 105
105 125
F ci
14
8
Total
ESTATSTICA E PROBABILIDADE
51
Operrios
40
4
6
30
10
6
8
8
10
15
5
2
4
Total
Estaturas (cm)
140
Operrios
150
150
160
160
170
10
30
180
190
40
10
190
200
170
180
Total
Gabarito
1.1 (a) 49 (b) 2, 48 (c) 0, 005 (d) 22, 3 (e) 1.001 (f) 6.500 (g) 5, 8 (h) 23, 4 (i) 5, 0 (j) 25, 4 (k) 320 (l) 6.000 1.2 (c).
1.3 discretos:
(a); contnuos (b), (c), (d) e (e).
1.4 (c).
1.5 (d).
1.6 (d).
1.7 (b).
1.8 (e).
1.9 (a).
1.10 (c).
1.11 (d).
1.12
(d).
1.13 (c).
1.14 (a) 10.000 (Aparente) (b) 8.999 (Aparente) (c) 7.499, 5 (d) 8.999, 5 e 9.999, 5 (e) 1.000 (f) 16 (g) 24, 61% (h)
7.000 7.999 (i) 52, 3% (j) 76, 9% 1.15 1.16 1.17 1.18 1.19 (b). 1.20 (a) 40 (b) 80 (c) 15% excluindo o 6 (d) 70%. 1.21 (a)
1.22 (b) 1.23 (e) 1.24 (c) 1.25 (a) 1.26 (a) 1.27 (b) 1.28 (e) 1.29 (b) 1.30 (e). 1.31 (c).
1.32 (e). 1.33 (d).
1.34
(c). 1.35 (a) 1.36 (c) 1.37 (d) 1.38 (c) 1.39 (d) 1.40 79, 6. 1.41 10, 375. 1.42 6, 2. 1.43 (b) 1.44 (a) 5, 65; (b) 5, 27 . . .;
(c) 8, 9; (d) 79, 5.
1.45 5, 1.
1.46 (c) 1.47 (c) 1.48 (d) 1.49 (a) ??
x = 26, 58; g
= 26, 27;
h = 25, 96;
q = 26, 90 1.51
1.52 (a) Moda Bruta: 5, 0; Moda de King: 5, 1; Moda de Czuber: 5, 2. (b) Moda Bruta: 160; Moda de King: 159, 9; Moda de Czuber:
159, 6. (c) Moda Bruta 75; Moda de King: 75; Moda de Czuber: 75.
1.53 (a) Md = 7, 5; (b) Md = 8; (c) Md = 5; (d) Md = 8; (e)
Md = 5; (f) Md = 14, 5; (g) Md = 4; (h) Md = 5, 23; (i) Md = 160, 55; (j) Md = 77, 31. 1.54 (b) 1.55 $35.625, 00. 1.56 1.57
52
Medidas
TEMA 02
2.1
Medidas de Posio II
2.1.1
Separatrizes
As separatrizes valores que ocupam determinados lugares em uma srie ordenada e nos permite separar
a distribuio em partes iguais. Temos quatro tipos de separatrizes, tambm chamadas de quantis:
a mediana, que tambm uma medida de tendncia central;
os decis;
os quartis;
os percentis ou centis.
2.1.2
As medidas de posio denominadas quartis, decis e centis (ou percentis) tm construo anloga a da
mediana. Enquanto a mediana separa a distribuio em duas partes iguais, esses, dividem a distribuio em
quatro partes, em dez partes e, em cem partes, respectivamente.
Variveis Discretas
O quartil Qi , o Decil Di e o Centil Ci de ordem i numa distribuio com variveis discretas determinado
por:
8
>
<
x[P ]+1
>
: xP + xP +1
, P 6 Z
( 2.13)
, P Z,
onde n a freqncia total da distribuio, [P ] representa a parte inteira de P R e P pode assumir os valores
i n i n
i n
4 , 10 ou 100 a depender de qual das separatrizes desejamos calcular.
ER 18. Dada a distribuio de freqncias ao lado, calcule:
xi
(a) Q1 ;
fi
(b) D8 ;
Soluo:
xi
fi
F ci
2
3
5
3
9
12
4
5
2
1
14
15
6
7
6
7
21
28
30
(c) C40 .
53
Variveis Contnuas
O Quartil Qi , o Decil Di e o Centil Ci de ordem i numa distribuio com variveis contnuas agrupadas em
classes determinado por:
P F ci 1
l i + hi
fi
( 2.14)
i n
i n i n
,
ou
,
4
10
100
respectivamente, posio do Quartil, do Decil ou do Centil, sendo n a freqncia total da distribuio;
li o limite inferior da classe quantlica;
hi amplitude de classe quantlica;
F ci 1 freqncia acumulada absoluta anterior classe quantlica;
f ri a freqncia absoluta da classe quantlica.
Ateno!
P F r ci 1
l i + hi
f ri
( 2.15)
i
i
P = 4i , P = 10
ou P = 100
a posio do quantil de ordem i o qual desejamos calcular, sendo n a freqncia
total da distribuio;
2.1.3
Exerccios Propostos
Classes
5
25
45
65
85
105
125
145
Total
25
45
65
85
105
125
145
165
fi
4
6
14
26
14
8
6
2
F ci
EP
Notas
fi
1
3
11
21
43
32
9
30
40
50
60
70
80
90
40
50
60
70
80
90
100
F ci
Total
EP 2.3. Considere os conjuntos Y = {6, 12, 15, 7, 10} e Z = {10, 5; 11, 8; 15, 4; 16, 5; 20, 0; 13, 6} e calcule:
(d) o valor do Primeiro Quartil;
(a) a Mdia Aritmtica;
(b) a Mediana;
Estatura (cm)
fi
140 145
145 150
15
155 160
22
165 170
40
150 155
160 165
10
(f) o valor do: sexagsimo centil C60 ; octogsimo oitavo centil C88 .
Medidas de Disperso
A anlise de um conjunto de observaes com base numa medida de tendncia central no nos fornece
informaes suficientes para o conjunto de valores. Em outras palavras, as medidas de tendncia central
(mdias, moda, mediana) so teis para identificar um valor tpico numa distribuio de freqncia, porm,
estes no apresentam as disparidades existentes numa distribuio.
Portanto, as medidas de disperso so utilizadas para avaliar o grau de variabilidade ou disperso dos
valores de uma distribuio em torno da mdia. Estas medidas permitem estabelecer comparaes entre
fenmenos de mesma natureza ou de naturezas distintas e, em geral, essa variabilidade observada em torno
de uma medida de tendncia central.
Entre duas amostras com a mesma mdia, ser mais representativa aquela que apresentar menor disperso.
Dentre as medidas de disperso destacamos a Amplitude Total, o Desvio Mdio e o Quartil, a Varincia, o
Desvio Padro e os coeficientes de Variao e de Pearson.
Medidas de Disperso
Absolutas
Amplitude Total
Desvio Quartil ou Amplitude Semi-interqualtica
Relativas
Coeficiente de Variao de Pearson
Varivel reduzida
Desvio Mdio
Varincia
Desvio padro
ESTATSTICA E PROBABILIDADE
55
As absolutas vm expressas na mesma unidade de medida da varivel em estudo. As relativas so as medidas que independem da unidade de medida de varivel observada. Servem para estudar comparativamente
duas ou mais distribuies com natureza distinta ou com unidades de medida diferentes.
2.1.4
Amplitude Total
AT = xmax xmin
A amplitude total a mais simples das medidas de disperso. Apresenta uma desvantagem em relao as outras medidas de disperso por levar em conta apenas os valores
mnimo e mximo do conjunto, ou seja, se ocorre qualquer variao no interior do conjunto de dados esta medida no se modifica. Alm disso, geralmente sofre a influncia de
um valor atpico (valores elevados o pequenos em relao ao conjunto) na distribuio.
Altura
150
154
158
162
166
170
Exemplo 2.1. Para os valores 30, 35, 38, 45, 48, 50, 56, 60, 65 temos AT = 65 30 = 35.
Exemplo 2.2. Para a tabela ao lado, temos AT = 174 150 = 24
2.1.5
fi
154
158
162
166
170
174
Total
4
9
11
8
5
3
40
Desvio
A diferena entre um determinado valor xi de uma amostra e a sua mdia x chamada de desvio di , ou
seja, di = xi x .
ER 19. Determine os desvios das seguintes amostras
(a) X = {1, 3, 5, 7, 9};
1+3+5+7+9
= 5. Portanto, os desvios so: d1 = 1 5 = 4,
5
d2 = 3 5 = 2, d3 = 5 5 = 0, d4 = 7 5 = 2 e d5 = 9 5 = 4.
104
12+34+57+74+93
=
= 5, 2. Portanto, os desvios so: d1 =
(b) A mdia de X x =
20
20
1 5, 2 = 4, 2, d2 = 3 5, 2 = 2, 2, d3 = 5 5, 2 = 0, 2, d4 = 7 5, 2 = 1, 8 e d5 = 9 5, 2 = 3, 8.
Soluo: (a) A mdia de X x =
Propriedades do Desvio
I. A soma algbrica dos desvios tomados em relao mdia aritmtica igual a zero, ou seja,
n
X
i =1
di =
n
X
i =1
(xi x ) = 0.
xi
1
3
5
7
9
Soma
di = xi x
di2
4
2
0
2
4
16
4
0
4
16
40
2.1.6
Desvio Quartil
O Desvio Quartil (DQ ) metade da amplitude interqualtica, onde a amplitude interqualtica a diferena
entre dois quartis.
Q3 Q1
DQ =
( 2.17)
2
2.1.7
O Desvio Mdio (DM ) definido como a mdia aritmtica dos valores absolutos dos desvios em relao
mdia aritmtica de distribuio.
n
X
DM =
i =1
|xi x | fi
n
X
( 2.18)
fi
i =1
Se f1 = f2 = f3 = . . . = fk = 1, ento
n
X
DM =
i =1
|xi x |
( 2.19)
O desvio mdio apresenta facilidades no clculo, mas, pouco empregado devido ao uso de mdulos. O
seu estudo serve como introduo construo do desvio padro.
ER 20. Calcule o desvio mdio para a amostra {1, 3, 4, 5, 7}.
1+3+4+5+7
= 4. Os desvios, d1 = 1 4 = 3, d2 = 3 4 = 1, d3 = 0,
5
3+1+0+1+3
d4 = 5 4 = 1 e d5 = 7 4 = 3. Portanto, DM =
= 1, 6.
5
Soluo: Temos que x =
2.1.8
Varincia
A Varincia populacional 2 a mdia aritmtica dos quadrados dos valores dos desvios em relao
mdia aritmtica da distribuio.
Sendo x1 , x2 , . . . , xn , n valores que a varivel x assume e f1 , f2 , . . . , fn , as respectivas freqncias absolutas
temos:
n
X
2 =
i =1
(xi x )2 fi
n
X
( 2.20)
fi
i =1
Se f1 = f2 = f3 = . . . = fn = 1 ento
n
X
2 =
i =1
(xi x )2
( 2.21)
S2 =
i =1
(xi x )2 fi
n1
( 2.22)
ESTATSTICA E PROBABILIDADE
57
Propriedades da Varincia
1. Somando-se ou subtraindo-se um valor constante a cada elemento de um conjunto de dados, a varincia
no se altera.
2. Multiplicando-se ou dividindo-se por um valor constante cada elemento de um conjunto de dados, a
varincia fica multiplicada ou dividida pelo quadrado dessa constante.
2.1.9
Desvio Padro
n
X
i =1
(xi x )2 fi
n
X
( 2.23)
fi
i =1
Se f1 = f2 = f3 = . . . = fn = 1, ento
n
X
i =1
(xi x )2
( 2.24)
S=
n
X
i =1
(xi x )2 fi
n1
( 2.25)
ER 21. Determine o Desvio Padro populacional para os conjuntos X = {1, 3, 4, 5, 7} e Y = {1, 2, 3, 6, 9, 10, 11}.
Soluo: J sabemos que x =
xi
1
3
4
5
7
Total
(xi x )2
(1 4)2 = 9
(3 4)2 = 1
2
(4 4) = 0
(5 4)2 = 1
(7 4)2 = 9
20
1 + 2 + 3 + 6 + 9 + 10 + 11
1+3+5+7
= 4 e y =
= 6 , logo temos:
5
7
xi
(xi x )2
20
=2
5
1
2
3
6
9
10
11
Total
(1 6)2 = 25
(2 6)2 = 16
(3 6)2 = 9
(6 6)2 = 0
(9 6)2 = 9
(10 6)2 = 16
(11 6)2 = 25
100
100
= 3, 78
7
ER 22. Calcular o desvio padro considerando as notas de Matemtica de 10 alunos de uma determinada
classe como sendo {2, 2, 3, 4, 4, 4, 5, 5, 6, 7}. Lembre-se de que se os dados esto agrupados em intervalos de
58
xi
fi
2
3
4
5
6
7
2
1
3
2
1
1
xi fi
4
3
12
10
6
7
10
(xi x )2
4, 84
1, 44
0, 04
0, 64
3, 24
7, 84
(xi x )2 fi
42
9, 68
1, 44
0, 12
1, 28
3, 24
7, 84
23, 60
0
2
4
6
8
Notas
fi
2
4
4
10
6
8
16
6
10
0
2
4
6
8
mente, 6, 3.
Notas
fi
xi
4
10
16
6
4
1
3
5
7
9
2
4
6
8
10
40
xi fi
4
30
80
42
36
192
di
di2
3, 8
1, 8
0, 2
2, 2
4, 2
14, 44
3, 24
0, 04
4, 84
17, 64
di2 fi
57, 76
32, 4
0, 64
29, 04
70, 56
190, 4
2.1.10
O Desvio Padro possui a mesma unidade de medida original da varivel original, enquanto
que a Varincia apresenta a unidade de medida elevado ao quadrado.
A relao entre as frmulas de Desvio Padro populacional e amostral dada pela equao
r
=S
n1
.
n
( 2.26)
ESTATSTICA E PROBABILIDADE
59
O esforo computacional que a frmula na equao ( 2.23) pode ser diminuda se fizermos a seguinte
simplificao:
n
X
i =1
n
X
(xi x )2
n
X
n
X
i =1
xi2 2
i =1
i =1
n
X
i =1
n
X
6
6 i =1
xi + n 6
6 n
4
i =1
"
7
7
7
5
n
X
n
X
xi2
i =1
n
X
n
X
x 2
i =1
n
X
i =1
xi2 2x
n
X
xi + nx 2
i =1
#2
xi
n
X
n
X
i =1
n
=
xi2
i =1
Na 5 igualdade utilizamos x =
xi +
32
n
X
n
X
Conseqentemente,
xi2 2x
xi 7
i =1
n
2
xi
n
X
xi2 2xi x + x 2
xi2
i =1
n
X
32
xi 7
6
6 i =1 7
7
6
6 n 7 .
4
5
32
xi 7
6
6 i =1 7
6
7 .
6
7
4 n 5
( 2.27)
xi
i =1
2.1.11
n
X
xi2 fi
i =1
n
X
32
Classes
xi fi 7
6
6 i =1
7
7 .
6
6
n 7
4
5
240
260
280
300
320
340
( 2.28)
Exerccio Proposto
260
280
300
320
340
360
fi
F ci
7
20
33
25
11
4
Total
2.1.12
Varincia Relativa
A varincia relativa V R definida pelo quociente entre a varincia e o quadrado da mdia aritmtica de uma
distribuio.
2
.
VR =
x
Seu principal objetivo o de ser utilizado no clculo do coeficiente de variao de Pearson.
2.1.13
CV =
60
ou
CV =
S
.
x
( 2.29)
uma medida relativa de disperso utilizada para comparar o grau de concentrao em torno da mdia de
sries distintas.
Uma distribuio pode ser classificada quanto a sua variabilidade. Dizemos que ela possui pequena variabilidade quando o coeficiente de variabilidade for, no mximo, 10%. A variabilidade mdia quando o coeficiente
de variabilidade estiver entre 10% e 20%. Acima de 20% dizemos que a distribuio possui grande variabilidade.
ER 24. Tomemos os resultados das estaturas e dos pesos de um mesmo
grupo de indivduos, conforme tabela ao lado. Qual das medidas (Estatura ou
Peso) possui maior homogeneidade?
Estaturas
175cm
5, 0cm
Pesos
68kg
2, 0kg
Soluo: Para responder a esta questo devemos calcular o C V da Estatura e o do Peso. Aquele que
apresentar menor valor ser o de maior homogeneidade (menor disperso ou variabilidade).
C Vestatur a
5
= 2, 85%
175
C Vpeso
2
= 2, 94%.
68
2.2
Medidas de Assimetria
Uma distribuio pode ser classificada quanto a assimetria onde observado o grau de afastamento que
uma distribuio possui relativamente a uma unidade de simetria. Uma distribuio simtrica possui os mesmos
valores para a mdia, a moda e a mediana. J as assimetrias podem ser positiva ou direita (Mo < Md < x ),
ou negativa ou esquerda (x < Md < Mo ).
A assimetria da distribuio pode tambm ser constatada se:
(Md Q1 ) < (Q3 Md ) ento a assimetria direita ou positiva;
(Md Q1 ) > (Q3 Md ) ento a assimetria esquerda ou negativa;
(Md Q1 ) = (Q3 Md ) ento a distribuio simtrica.
Podemos tambm classificar uma distribuio quanto a assimetria, atravs de coeficientes. Vejamos algumas relaes que determinam importantes coeficientes de assimetria.
2.2.1
CAS =
x Mo
x Mo
ou AS =
.
( 2.30)
Uma outra relao atribuda tambm a Pearson e que tambm mede o grau de simetria de uma distribuio
dada por
Q1 + Q3 2Md
.
( 2.31)
CAS =
Q3 Q1
Em ambos os casos temos que: se CAS = 0, ento dizemos que a distribuio simtrica;
ESTATSTICA E PROBABILIDADE
61
2.2.2
Exerccio Proposto
2.3
260
280
300
320
340
360
fi
F ci
7
20
33
25
11
4
Total
Medidas de Curtose
Curtose o grau de achatamento de uma distribuio em relao a uma distribuio padro, tambm
denominada curva normal ou Mesocrtica .
Quando a distribuio apresenta: uma curva de freqncia mais fechada que a normal (mais delgada, mais
aguda ou afilada em sua parte superior), ela recebe o nome de Leptocrtica ; uma curva de freqncia mais
aberta que a normal (ou mais achatada em sua parte superior), ela recebe o nome de Platicrtica.
O coeficiente de Curtose ou percentlico
K=
Q3 Q1
2(C90 C10 )
( 2.32)
= 0, 263), Platicrtica
2.3.1
Exerccio Proposto
(c) a varincia;
2.4
Gabarito
2.1 2.2 2.3 (a) 10 e 14, 63 (b) 10 e 14, 5 (c) Amodal e Amodal (d) 6, 5 e 11, 475 (e) 14, 4 e 18, 6 (f) 13, 68 e 17, 62 2.4 (a)
x = 153, 55cm; (b)
Md = 153, 25cm; (c) MoB = 152, 50cm; MoC = 152, 91cm; MoK = 152, 97cm e MoP = 152, 65cm (d) Q1 = 150, 12cm e Q3 = 157, 50cm
(e) D5 = 153, 25cm e D7 = 156, 36cm (f) C60 = 154, 50cm e C88 = 161, 00cm 2.5 2.6 2.7
62
BLOCO 02
TEMA 03
3.1
Probabilidade
Apresentao
Os modelos matemticos consistem em uma simplificao da realidade. So uma idealizao das caractersticas do fenmeno observado. Eles podem ser:
Determinsticos: quando dadas as condies de experimentao pode-se determinar ou predizer o resultado final do experimento.
No-determinsticos (ou probabilsticos ou estocsticos): quando no possvel predizer, com certeza, o
resultado antes da realizao do experimento.
Como exemplos de modelos estocsticos temos:
1. Um mdico investigando o efeito de uma droga administrada em pacientes;
2. O estudo do efeito de um fertilizante qumico em uma parcela de solo;
3. A anlise dos preos mensais de trs bens de consumo;
4. A qualidade da produo de uma mquina de determinado produto industrializado; etc.
A Teoria das Probabilidades, de modo geral, visa definir um modelo matemtico no determinstico (probabilstico ou estocstico) que seja conveniente a descrio e interpretao de fenmenos aleatrios.
3.2
Consideraes Iniciais
3.1 Definio. [Experimento Aleatrio] Um experimento E aleatrio quando est sujeito a influncias de
fatores casuais e, como conseqncia destes, no podemos precisar o seu resultado.
Os experimentos aleatrios so caracterizados por:
- Repeties sob as mesmas condies;
- O conjunto de todos os resultados possveis do experimento pode ser descrito, porm, no podemos afirmar
que resultado em particular ocorrer;
- Quando o experimento for repetido um grande nmero de vezes, ocorrer uma regularidade nos resultados.
Exemplo 3.1. So exemplos de experimentos aleatrios:
1. Lanar uma moeda e observar a face de cima;
ESTATSTICA E PROBABILIDADE
63
3.3 Definio. [Evento] Dado um experimento aleatrio cujo espao amostral S , chamaremos de Evento
qualquer subconjunto do espao amostral S . Denotamos um evento atravs de uma letra maiscula qualquer
do alfabeto.
Se um espao amostral S possui n elementos, ento S possuir 2n subconjuntos e, portanto, 2n eventos.
Em particular, o evento S chamado de evento certo, o conjunto vazio de evento impossvel e o evento que
possui um nico elemento de evento elementar.
ER 27. No lanamento de um dado S = {1, 2, 3, 4, 5, 6}, determine os eventos:
A: ocorrer um nmero par.
3.2.1
Exerccios Propostos
3.3
Os operadores unio e interseo de eventos so utilizados para combinar dois eventos, criando, assim,
outro evento distinto dos originais.
3.4 Definio. [Unio de eventos] Consideremos dois eventos A e B . O evento unio A B um novo evento
3.5 Definio. [Interseo de eventos] Consideremos dois eventos A e B de um espao amostral S . O evento
interseo A B um novo evento e ocorre quando os eventos A e B ocorrerem simultaneamente.
C
.
(d) A
ESTATSTICA E PROBABILIDADE
65
Soluo:
(a) A B = {1, 2, 3, 4, 5, 6} (b) A B =
C
= A C = {5}.
(c) A C = {1, 2, 3, 4, 6}. (d) A
3.7 Definio. [Eventos mutuamente exclusivos] Dois eventos A e B de um espao amostral finito S so
mutuamente exclusivos se eles no ocorrem simultaneamente, isto , quando A B = .
Exemplo 3.3. No lanamento de um dado considere A o evento ocorrer nmero par e B o evento ocorrer
nmero mpar. Verificamos, portanto, que A e B so eventos mutuamente exclusivos, pois, A B = .
3.3.1
Exerccios Propostos
EP 3.4. Sejam A, B e C trs eventos quaisquer. Estabelea uma expresso para os eventos abaixo utilizando
a Teoria dos Conjuntos e construa o Diagrama de Venn correspondente:
(a) A e B ocorrem;
(b) A ou B ocorrem;
(d) A no ocorre;
EP 3.5. Sendo S = {10, 20, 30, 40, 50, 60, 70, 80, 90, 100}, listar cada um dos subconjuntos de S :
(a) A = {a|a exatamente divisvel por 3};
(c) C = A B ;
(d) A B ;
A
;
(e) B
(g) B A;
B
;
(f) A
(h) A B .
(e) A B ;
(f) A B D .
EP 3.7. Uma urna contm 30 bolas numeradas de 1 a 30. Uma bola escolhida e observada o seu nmero.
Descreva os seguintes eventos quando o nmero obtido :
A: par;
C : primo;
E : mltiplo de 2 e 5;
G : mltiplo de 2 ou 6;
B : mpar;
F : mltiplo de 3 ou 8;
H : no mltiplo de 6.
EP 3.8. Dois dados, um azul e outro vermelho, so lanados nesta ordem. Descrever os eventos:
B : ocorrem mesmos nmeros em ambos os dados; E : ocorrem nmeros cuja soma maior que oito;
C : ocorre nmero 5 em ao menos um dado;
A: ocorre cara;
C : ocorre o nmero 3;
B C;
A B;
A C;
C
;;
A
C.
B
66
E1 = {(a, b ) A B ; a = b };
E5 = {(a, b ) A B ; b = a2 + 1};
E2 = {(a, b ) A B ; a > b };
E6 = {(a, b ) A B ; a2 + b 2 = 2a};
E3 = {(a, b ) A B ; a + b = 3};
E7 = {(a, b ) A B ; a2 + b = b 2 };
E4 = {(a, b ) A B ; b = 2};
E8 = {(a, b ) A B ; a = 3}.
EP 3.11. Uma urna 1 contendo duas bolas cinzas e trs bolas pretas e uma urna 2 contendo cinco bolas
cinzas e seis bolas pretas. Uma urna escolhida ao acaso e dela extrada uma bola tambm ao acaso e
observada sua cor. Descreva os eventos:
E1 : a urna escolhida 1;
E5 = E1 E2 ;
E7 = E4 ;
E2 : a urna escolhida 2;
E6 = E1 E3 ;
E8 = E1 E3 .
D = { mltiplos de 4}
3.4
Um Pouco de Histria
3.5
Clculos Probabilsticos
3.5.1
A Probabilidade de um Evento
k
X
i =1
f ri =
n1
n2
nk
n1 + n2 + . . . + nk
N
+
+ ...+
=
=
= 1.
N
N
N
N
N
f rA =
f ri ;
a i A
ESTATSTICA E PROBABILIDADE
67
n
X
pi = 1.
i =1
Os nmeros pi associados probabilidade de um evento elementar definem o que chamamos de uma distribuio de probabilidade sobre o espao amostral S .
Podemos estender o conceito de probabilidade para um evento arbitrrio A de um espao amostral S se
considerarmos a aplicao:
P :S
[0, 1]
8
<
A 7 P (A) =
0
pi
,
,
s i A
se A =
se A 6=
ou seja, a probabilidade P (A) de um evento qualquer A de um espao amostral finito S a soma das probabilidades dos eventos elementares que o constituem.
A priori, quaisquer valores pi satisfazendo as propriedades (1) e (2) constituem uma distribuio de probabilidades sobre o espao amostral S , porm, devemos entender o nmero pi como sendo um valor prximo da
freqncia relativa f ri , quando o experimento aleatrio repetido um grande nmero de vezes.
Em particular, dizemos que uma distribuio de probabilidades sobre S = {s1 , s2 , . . . , sk } equiprovvel se
p1 = p2 = . . . = pk , isto , se todos os ventos elementares de S possuem a mesma probabilidade.
Seja S = {s1 , s2 , . . . , sk } um espao amostral equiprovvel cuja distribuio de probabilidades dada por
r
1
pi = . A probabilidade P (A) de um evento A = {s1 , s2 , . . . , sr } . De fato,
N
N
P (A) =
r
X
pi =
r
X
1
i =1
i =1
r
1 X
r
1= .
N i =1
N
Um evento qualquer pode ser obtido de outros atravs de operaes conhecidas em teoria de conjuntos. A
partir da definio de probabilidade de um evento vamos estender o clculo de probabilidades para a resoluo
de uma srie de problemas que envolvem estes eventos.
3.8 Teorema. Se A e B so eventos mutuamente exclusivos, ento
P (A B ) = P (A) + P (B ).
Prova: Seja o evento A = {a1 , a2 , . . . , ar }, onde ai 6= aj , i , j , e o evento B = {ar +1 , ar +2 , . . . , ar +q }, ento
P (A B ) =
68
r +q
X
i =1
pi =
r
X
i =1
pi +
q
X
k =r +1
pk = P (A) + P (B ).
k
X
pi = 1
i =1
A=S eA
A =
3. Sabemos que A
A) = P (A
) + P (A).
1 = P (S ) = P (A
) = 1 P (A).
Logo, P (A
B ), teremos que
4. Se escrevermos B = A (A
B )) = P (A) + P (A
B ).
P (B ) = P (A (A
B ) 0. Logo, P (B ) P (A).
Portanto, P (B ) P (A) = P (A
5. Sejam A e B dois eventos distintos tais que A B 6= . Observe que:
(
B) =
A (A
)
B = (B A) (B A
Logo,
P (A B ) =
P (B )
))) = P (A (B A
)) = P (A) + P (B A
)
P (A ((B A) (B A
)) = P (B A) + P (B A
).
P ((B A) (B A
P (A B ) = P (A) + P (B ) P (A B ).
ER 30. No lanamento de um dado qual a probabilidade de
(a) obter um nmero maior que 2 e primo?
menor que 4 E2 = {1, 2, 3}; obter um nmero menor que 5 E3 = {1, 2, 3, 4}; obter um nmero primo
E4 = {2, 3, 5}. Portanto,
ESTATSTICA E PROBABILIDADE
69
2
1
= ;
6
3
4
2
= ;
6
3
1
.
3
Exerccios Propostos
EP 3.13. Determinar a probabilidade de cada um dos seguintes eventos:
(a) Aparecer exatamente duas caras em trs lances de uma moeda honesta;
(b) Aparecer pelo menos uma cara em trs lances de uma moeda honesta;
(c) Retirar um dez de paus ao extrairmos uma carta de um baralho completo de 52 cartas;
(d) Aparecer a soma oito no lanamento de dois dados;
(e) Retirar uma carta de paus ou uma figura, numa nica extrao, de um baralho completo de 52 cartas;
(f) Aparecer coroa no prximo lance de uma moeda se de um total de 100 lances 56 foram caras.
EP 3.14. Uma urna contem quatro bolas azuis, trs vermelhas e duas brancas. Calcule a probabilidade de,
se retirarmos uma bola ao acaso:
(a) ser vermelha;
1
3
1
; P (B ) = ; e P (A B ) = , calcule:
2
8
8
B
);
(c) P (A
(a) P (A B );
B
);
(b) P (A
);
(e) P (A B
B );
(d) P (A
).
(f) P (A B
EP 3.16. Um espao amostral e dividido em trs regies mutuamente exclusivas A1 , A2 e A3 . Se P (A1 ) = 1/2,
(c) P (A1 );
(b) P (A1 A2 A3 );
(d) P (A1 A2 ).
) e P (B
), achar P (A B ).
EP 3.17. Se P (A B
EP 3.18. Uma companhia de seguros analisou a freqncia com que 2.000 segurados usaram o hospital,
distribudos segundo a tabela abaixo. Escolhe-se um segurado ao acaso. Sendo definidos os eventos A: o
segurado usou o hospital e B : o segurado homem, determine:
B
);
(a) P (A
B );
(b) P (A
(c) P (A B ).
Homens
Mulheres
Usaram o hospital
100
150
No usaram o hospital
900
850
3.5.2
Probabilidade Condicional
3.10 Definio. Sejam A e B dois eventos de um espao amostral finito S . A probabilidade do evento A,
condicionada ao evento B , denotado por P (A|B ), isto , a probabilidade do evento A visto que B ocorreu, a
probabilidade do evento A adotando-se B como sendo o novo espao amostral ao invs de S .
Dados dois eventos A e B associados a um mesmo espao amostral S , se P (B ) > 0, ento determinamos
a probabilidade de ocorrncia do evento A condicionado a ocorrncia do evento B ou probabilidade de A visto
que B ocorreu, por:
P (A B )
,
P (B ) > 0,
( 3.33)
P (A|B ) =
P (B )
em que P (A B ) e P (B ) so calculados em relao ao espao amostral S .
ER 31. No lanamento de um dado observado o nmero da face superior. Considere os eventos:
Qual a probabilidade de ter sido mpar uma vez que o nmero era maior que um?
Soluo: O espao amostral S = {1, 2, 3, 4, 5, 6} e os eventos so A = {1, 3, 5} e B = {2, 3, 4, 5, 6}.
Observe que A B = {3, 5}. Portanto, #S = 6, #B = 5 e #(A B ) = 2. Logo,
P (A|B ) =
#(A B )
2
P (A B )
=
= .
P (B )
#B
5
ER 32. A tabela a seguir retrata a distribuio do nmero de formandos por curso em uma universidade U
distinguindo-se o sexo.
Engenharia (E)
Direito (D)
Biologia (B)
Masculino (M)
20
50
30
Feminino (F)
10
30
40
(b) ser do sexo feminino, visto que era bilogo? (d) ser do sexo masculino, visto que era advogado?
Soluo: Temos que
E
20
50
30
100
10
30
40
80
30
80
70
3.5.3
(a) P (B |F ) =
40
1
20
1
P (E M )
P (B F )
=
= ; (c) P (E |M ) =
=
= ;
P (F )
80
2
P (M )
100
5
(b) P (F |B ) =
P (B F )
P (M D )
40
4
50
5
=
= ; (d) P (M |D ) =
=
= .
P (B )
70
7
P (D )
80
8
Exerccios Propostos
71
3.5.4
3.11 Teorema. [do Produto] A probabilidade da ocorrncia simultnea de dois eventos A e B de um espao
amostral finito S o produto da probabilidade de um deles pela probabilidade condicional do outro, dado o
primeiro.
Prova: Considerando a definio de probabilidade condicional, imediato que
P (A|B ) =
P (A B )
P (A B ) = P (B ) P (A|B ).
P (B )
ER 33. Uma urna I contm 2 bolas vermelhas e 3 brancas e uma urna I I contm 4 bolas vermelhas e 5
brancas. Uma urna escolhida ao acaso e dela uma bola extrada ao acaso. Qual a probabilidade de
observamos: Urna I e bola vermelha?
Soluo: P (UI V ) = P (UI ) P (V |UI ) =
1 2
1
= .
2 5
5
ER 34. Em um lote de 12 peas, 4 so defeituosas, 2 peas so retiradas uma aps a outra sem reposio.
Qual a probabilidade de que ambas sejam boas?
8 7
14
=
.
12 11
33
3.5.5
5 2 3
1
=
.
10 9 8
24
Independncia de Eventos
3.13 Definio. Um evento A considerado independente de outro B , ambos do mesmo espao amostral S ,
se a ocorrncia de B no afeta a probabilidade do evento A, ou seja, A independe de B se P (A|B ) = P (A).
3.14 Proposio. Considere os eventos A e B de um espao amostral finito. Se A independe de B , ento B
independe de A. Desta forma, diremos que A e B so independentes.
72
Prova: Suponha que A independe de B , ou seja, P (A) = P (A|B ). Utilizando-se do teorema do produto,
temos que:
P (A B )
P (B ) P (A|B )
P (B ) P (A)
P (B |A) =
=
=
= P (B ).
P (A)
P (A)
P (A)
3.15 Definio. Dois eventos so ditos dependentes quando no so independentes.
3.16 Proposio. Se dois eventos A e B de um mesmo espao amostral finito so independentes, ento
P (A B ) = P (A) P (B ).
(
Prova:
P (A B ) =
P (A) P (B |A)
P (B ) P (A|B )
=
=
P (A) P (B )
P (B ) P (A)
ER 36. Uma moeda lanada 3 vezes. Sejam os eventos A: Ocorrer pelo menos duas caras; B : Ocorrer
resultados iguais nos 3 lanamentos. Os eventos so independentes?
Soluo: P (A B ) =
1
4
2
1
, P (A) = e P (B ) = . P (A) P (B ) = . Logo, os eventos so independentes.
8
8
8
8
P (Ai Aj Ak ) = P (Ai ) P (Aj Ak |Ai ) = P (Ai ) P (Aj |Ai ) P (Ak |Ai ) = P (Ai ) P (Aj ) P (Ak ); i , j , k i 6= j 6= k .
Utilizando-se o mesmo raciocnio, podemos concluir que para n eventos independentes Ai , 1 i n,
A1
A2
A8
Como o resultado de um lanamento no influencia os de outros, os eventos Ai , i = {1, 2, . . . , 8}, so independentes. Logo:
1 1
1
... =
6
6
6
|
{z
}
1
6
ESTATSTICA E PROBABILIDADE
73
ER 38. Qual a probabilidade de que a face 5 seja observada pelo menos uma vez em 8 lanamentos de uma
dado?
Soluo: Considere os eventos
A1
A2
A8
Como o resultado de um lanamento no influencia os de outros, os eventos Ai , i = {1, 2, . . . , 8} so independentes, ento a probabilidade de no observamos a face 5 nestes lanamentos dado por:
5
5 5
P (A1 A2 A8 ) = P (A1 ) P (A2 ) . . . P (A8 ) = . . . =
6
6
6
|
{z
}
5
6
Como o evento A: observar a face 5 pelo menos uma vez em 8 lanamentos o evento complementar
do evento B : no observar a face 5 em 8 lanamentos, temos:
) = 1 P (B ) = 1
P (A) = P (B
5
6
, A
e B, A
e B
so tambm
3.18 Proposio. Se A e B so dois eventos independentes, ento A e B
independentes.
independentes, pois a prova dos demais casos anloga.
Prova: Mostremos o caso A e B
Por hiptese P (A|B ) = P (A) e P (B |A) = P (B ).
1 P (B |A)
P (B )
P (B |A)
3.19 Proposio. Se A e B so dois eventos no vazios e mutuamente exclusivos, ento A e B so dependentes.
Prova:
Suponha A e B dois eventos independentes. Logo, pela definio, P (A) = P (B |A). Pela
Exerccios Propostos
EP 3.23. Numa sala existem 5 homens e 12 mulheres. Um aluno sorteado ao acaso para ir a lousa. Qual
a probabilidade que:
(a) seja homem?
A: a carta de espadas;
B : a carta um valete;
EP 3.25. A probabilidade de que um aluno A resolva uma questo de Fsica 0, 6 e de que um aluno B
resolva esta mesma questo 0, 2. Qual a probabilidade de que:
(a) ambos a resolvam?
EP 3.28. A probabilidade de que os pais de Anita, de 15 anos de idade, a deixem sair acompanhada
inversamente proporcional idade do garoto, com mesma idade ou superior dela. Sabendo que as idades de
Alberto, Gabriel e Matheus so, respectivamente, 16, 18 e 20 anos, determine qual a probabilidade de que:
(a) os trs saiam com Anita;
(b) ao menos um saia com Anita; (c) nenhum deles saia com Anita?
(b) 10 caras?
Pergunta-se:
(a) O fato lmpada 1 acesa independente de lmpada 2 acesa?
(b) O fato lmpada 1 apagada independente de lmpada 2 acesa?
Lmpada 2
Lmpada 1
Acesa
Apagada
Acesa
0, 15
0, 45
Apagada
0, 10
0, 30
ESTATSTICA E PROBABILIDADE
75
EP 3.36. Um empreiteiro apresentou oramentos separados para a execuo da parte eltrica e da parte
de encanamento de um edifcio. Ele acha que a probabilidade de ganhar a concorrncia da parte eltrica de
1/2. Caso ele ganhe a parte eltrica, a chance de ganhar a parte de encanamento de 3/4; caso contrrio,
essa probabilidade de 1/3. Qual a probabilidade dele:
(a) ganhar os dois contratos?
EP 3.37. Suponha que numa escola 60% dos alunos sejam homens e 40% sejam mulheres. Sabe-se
que dentre os alunos do sexo masculino 3% so canhotos, enquanto que dentre as mulheres apenas 2% so
canhotas. Escolhe-se um aluno ao acaso. Achar a probabilidade de que seja canhoto.
EP 3.38. A probabilidade de que um time de futebol vena seu oponente estimada em 0, 7, se no chover;
mas s 0, 5, se chover. Se os registros meteorolgicos mostrarem que choveu 40% das vezes na data do jogo,
nos anos passados, qual a probabilidade de que o time vena seu prximo oponente?
EP 3.39. Um processo industrial produz 4% de tens defeituosos. A experincia mostra que 25% dos tens
defeituosos produzidos no so percebidos pelo inspetor de qualidade. Os tens bons sempre passam satisfatoriamente pela inspeo. Qual a probabilidade de que, se voc comprar um desses tens, seja um item
defeituoso?
EP 3.40. Um artigo manufaturado, que no pode ser usado se for defeituoso, deve passar por duas inspees
antes de receber embalagem. A experincia mostra que um dos inspetores deixar passar 5% dos artigos
defeituosos, ao passo que o segundo inspetor deixar passar 4% de tais artigos. Se os artigos sem defeito
sempre passam pela inspeo e se 10% dos artigos processados so defeituosos, que percentagem dos artigos
produzidos que passam pela duas inspees so defeituosos?
EP 3.41. Marque verdadeiro ou falso. Justifique suas respostas.
(a) O espao amostral de um experimento o conjunto de resultados possveis deste experimento;
(b) O evento um resultado possvel do experimento;
(c) Se A e B so eventos independentes, ento P (A|B ) = P (A);
(d) Se A e B so eventos mutuamente exclusivos, ento eles so independentes.
3.5.6
3.20 Definio. [Partio de um Espao Amostral] Um conjunto {A1 , A2 , . . . , An } de eventos forma uma par-
tio para espao amostral S se os seus elementos so no vazios, mutuamente exclusivos e exaustivos (a
unio S ), ou seja:
1. Ai 6= , i ;
76
2. Ai Aj = , para i 6= j ;
3.
n
[
i =1
Ai = S .
3.21 Teorema. [da Probabilidade Total] Sejam A um evento e {A1 , A2 , . . . , An } uma partio de um espao
amostral S . Ento
P (A) =
n
X
i =1
P (Ai ) P (A|Ai ).
Prova: Podemos escrever A = (A1 A) (A2 A) (An A) = ni=1 (Ai A). Sendo {A1 , A2 , . . . , An }
uma partio para S , os n eventos (Ai A) so mutuamente exclusivos. Portanto,
P (A)
=
=
=
Uma probabilidade total sempre calculada como uma soma de probabilidades parciais correspondentes
interseco do acontecimento de interesse com outros mutuamente exclusivos e exaustivos. Este resultado
utilizado quando difcil de se obter diretamente a probabilidade de um evento P (A).
ER 39. Em trs urnas numeradas so distribudas uma determinada quantidade de bolas coloridas conforme a tabela ao lado. Uma urna selecionada
ao acaso e dela retirada uma bola tambm ao acaso. Qual a probabilidade
dela ser
(a) preta?
(b) branca?
Brancas(B )
Pretas (P )
U1
U2
U3
3
X
1
4 2 5
P (Ui ) P (P |Ui ) = P (U1 ) P (P |U1 ) + P (U2 ) P (P |U2 ) + P (U3 ) P (P |U3 ) =
P (P ) =
+ +
3
7 7 9
i =1
89
189
Exerccios Propostos
EP 3.42. Em duas urnas numeradas so distribudas uma determinada quantidade de bolas coloridas conforme tabela ao lado. Uma urna selecionada ao
acaso e dela retirada ao acaso um bola. Qual a probabilidade dela
(a) ser de U1 e branca?
Brancas
Pretas
U1
U2
EP 3.43. Uma urna tem 10 bolas brancas 6 azuis e 8 pretas. Uma bola selecionada ao acaso e sem
reposio desta retirada ao acaso outra bola. Qual a probabilidade de
(a) a primeira ser branca e a segunda azul?
(c) a primeira a segunda serem brancas?
(b) a primeira ser azul e a segunda preta?
EP 3.44. Em Salvador, no ms de Outubro, costuma chover 5 dias. Qual a probabilidade de no chover nos
trs primeiros dias de Outubro?
EP 3.45. Em trs urnas numeradas so distribudas uma determinada quantidade de bolas coloridas conforme tabela ao lado. Uma urna selecionada
ao acaso e dela retirada ao acaso um bola. Qual a probabilidade dela ser: U1
U2
(a) azul?
(b) preta?
(c) branca?
U3
Brancas
Azuis
Pretas
EP 3.46. Numa fbrica de automveis, em um lote A existem 295 peas boas e 5 peas defeituosas. Em
outro lote B desta fbrica, existem 224 peas boas e 16 peas defeituosas e, em outro lote C , existem 471 peas
ESTATSTICA E PROBABILIDADE
77
boas e 9 peas defeituosas. Um dos lotes sorteado ao acaso e dele extrada uma pea ao acaso. Qual a
probabilidade da pea ser: (a) boa?
(b) defeituosa?
Brancas
Azuis
Pretas
U1
U2
U3
3.5.7
O Teorema de Bayes
3.22 Teorema. [Bayes] Sejam B um evento e {A1 , A2 , . . . , An } uma partio de um espao amostral S . Ento
P (Ai |B ) =
P (Ai ) P (B |Ai )
n
X
i =1
P (Ai ) P (B |Ai )
P (Ai |B ) =
P (Ai ) P (B |Ai )
, i.
P (B )
n
X
i =1
P (Ai ) P (B |Ai )
, i.
P (A)
Nota 10. Observe que a regra de Bayes obtida de uma expresso que caracteriza a probabilidade
condicional e muito utilizada pois relaciona as probabilidades a priori P (Ai ), com a posteriori P (Ai |B ).
78
Brancas
Azuis
Pretas
(b) da urna U1 ou U3 ?
Soluo:
1 3
P (U1 ) P (B |U1 )
1
3 10
(a) P (U1 |B ) =
=
= .
1 3
1 4
1 5
P (U1 ) P (B |U1 ) + P (U2 ) P (B |U2 ) + P (U3 ) P (B |U3 )
4
+
+
3 10 3 10 3 10
(b) Temos que os eventos U1 e U3 so mutuamente exclusivos. Portanto, P (U1 U3 |B ) = P (U1 |B ) +
P (U3 |B ). Calculemos
1
P (U3 ) P (B |U3 )
3
=
P (U3 |B ) =
1 3
1
P (U1 ) P (B |U1 ) + P (U2 ) P (B |U2 ) + P (U3 ) P (B |U3 )
+
3 10 3
Logo, P (U1 U3 |B ) =
5
5
10
=
4
1 5
12
+
10 3 10
1
5
2
+
=
4 12
3
Exerccios Propostos
EP 3.51. Uma urna I possui 4 bolas vermelhas e 5 brancas, a urna I I possui 6 bolas vermelhas e 2 brancas.
Uma urna escolhida ao acaso e dela extrada ao acaso uma bola.
(a) Qual a probabilidade de observarmos urna I e bola branca?
(b) Qual a probabilidade de observarmos urna bola branca?
(c) Se a bola observada foi branca, qual a probabilidade de que tenha vindo da urna I ?
EP 3.52. Uma caixa contm 3 moedas M1 , M2 e M3 . A primeira moeda honesta, a segunda tem duas
caras e a terceira viciada de tal modo que caras so quatro vezes mais provveis que coroas. uma moeda
escolhida ao acaso e lanada.
(a) Qual a probabilidade de observarmos moeda M2 e coroa?
(b) Qual a probabilidade de observarmos coroa?
(c) Se o resultado final foi cara, qual a probabilidade de que a moeda lanada tenha sido M1 ?
EP 3.53. Duas mquinas A e B produzem peas idnticas, sendo que a produo da mquina A o triplo
da produo da mquina B . A mquina A produz 80% de peas boas e a mquina B produz 90%. Uma pea
do estoque selecionada ao acaso e verifica-se que boa. Qual a probabilidade de que tenha sido fabricada
pela mquina A?
EP 3.54. Uma clnica especializada trata de trs tipos de doenas: X , Y e Z . 50% dos que procuram a clnica
so portadores de X e 30% de Y . As probabilidades de cura, nessa clnica, so: P (X ) = 0, 8, P (Y ) = 0, 9 e
P (Z ) = 0, 95. Um enfermo saiu curado dessa clnica. Qual a probabilidade de que ele sofria da doena X ? E
das doenas Y e Z ?
EP 3.55. Em uma populao 55% so de mulheres. 5% dos homens so cegos e 2% das mulheres so
cegas. Uma pessoa selecionada ao acaso e verifica-se que ela cega. Qual a probabilidade de que seja
homem?
ESTATSTICA E PROBABILIDADE
79
3.6
Gabarito
80
A descrio matemtica de um fenmeno emprico sempre uma representao idealizada do mundo real.
Este tipo de representao chamado de modelo probabilstico ou estatstico.
4.1
Varivel Aleatria
X :S
s
R
7
X (s )
nmero ocorrido de caras nos dois lanamentos da moeda pode ser definida
pela tabela ao lado.
1
2
3
4
5
6
(C , C )
(C , K ) ou (K , C )
(K , K )
2 3
2
3
4
5
6
7
3
4
5
6
7
8
4
5
6
7
8
9
5 6 7
6 7 8
7 8 9
8 9 10
9 10 11
10 11 12
Exemplo 4.3. Velocidade mdia do vento em um certa estao meteorolgica. Vamos associar a letra Y a
velocidade do vento, logo Y uma varivel aleatria.
4.1.1
Um conjunto X enumervel quando possvel estabelecer uma relao unvoca entre seus elementos e
o conjunto dos nmeros naturais. Se X for finito, podemos dizer quantos elementos o conjunto X (S ) possui.
Podemos classificar uma varivel aleatria X em:
discreta: quando seu conjunto imagem X (S ) enumervel, finito ou infinito.
Exemplo 4.4.
(
0,
1,
se x par
se x mpar
(b) A escolha ao acaso de n indivduos para formar uma comisso. S = {conjunto de indivduos},
X (S ) = {0, 1, 2, . . . , n}
ESTATSTICA E PROBABILIDADE
81
contnua: quando ela assume valores em um conjunto no-enumervel (em nosso estudo, intervalos
reais ou unio de intervalos de nmeros reais).
Exemplo 4.5. Tempo de vida de um determinado ser vivo.
4.2
Funes de Probabilidades
Seja X uma varivel aleatria. Uma caracterizao completa de X dada por uma funo de probabilidade.
Seja E um experimento aleatrio associado a um espao amostral S e X : S R uma varivel aleatria.
A funo de probabilidade f uma funo que associa X probabilidade de que X assuma um determinado
valor y X (S ) (caso a varivel aleatria seja discreta) ou associa X probabilidade de que X pertena a um
intervalo I X (S ) (caso a varivel aleatria seja contnua).
Algumas caractersticas so inerentes a esta definio. Estudaremos estas conforme a varivel aleatria
seja discreta ou contnua.
4.2.1
Distribuio de Probabilidades
uma funo que associa a probabilidade de que uma varivel aleatria discreta X assuma um determinado
valor xi X (S ) e representada por P (X = xi ), ou simplesmente P (xi ), i N. Em outras palavras, a
distribuio de probabilidades o conjunto de pares (xi , P (xi )), i N. Como caracterstica a distribuio de
2.
P (X = xi ) 0, i
P (X = xi ) = 1.
i =1
Por se tratar de pares (xi , P (xi )), a distribuio de probabilidades pode tambm ser representada atravs de
frmulas, tabelas, grficos e diagramas.
Exemplo 4.6. Consideremos novamente o lanamento de duas moedas ( 4.1) e,
uma vez que j sabemos calcular as probabilidades de todos os pontos do espao
amostral, a distribuio de probabilidades dada ao lado.
4.2.2
xi
P (X = xi )
1
4
1
2
1
4
Densidade de Probabilidade
Por se tratar de uma funo que assume valores em um conjunto no-enumervel, uma varivel aleatria
contnua no pode ter cada um de seus valores x X (S ) associado a uma determinada probabilidade P (X =
x ), como no caso da distribuio de probabilidades. Portanto, necessrio a construo de uma outra funo
com as mesmas caractersticas da distribuio de probabilidades.
4.3 Definio. Considere E um experimento aleatrio associado a um espao amostral S e X uma varivel
aleatria contnua. A densidade de probabilidade uma funo f (x ) satisfazendo aos seguintes axiomas:
Z
1.
f (x ) 0, x R;
f (x ) dx = 1.
2.
Alm disso, a probabilidade de que uma varivel aleatria contnua X assuma valor em um determinado intervalo [a, b ] R dado por:
Z
f (x ) dx .
P (a < X < b ) =
a
82
( 4.34)
Por se tratar de uma funo que assume valores em um conjunto no-enumervel, uma densidade de
probabilidade representada atravs de frmulas e grficos e, claramente,
Z
x0
1. P (X = x0 ) = P (x0 ) =
f (x ) dx = 0;
x0
f (x ) =
8
< 8x
:
1
2
1
, x < 0 ou x >
2
, 0x
uma densidade de probabilidade. Caso afirmativo, calcule P (0, 1 < X < 0, 2), P (X < 0, 4) e represente
graficamente.
y
Soluo: Para que f (x ) seja uma densidade de probabilidade, os axiomas relativos a este tipo de funo devem ser satisfeitos. Claramente,
pela definio,
1. f (x ) 0, x R;
Z
f (x ) dx =
2.
1
2
0 dx +
8x dx = 1, e, portanto, o
4.3
1
2
Funo de Repartio
F (x ) = P (X x )
Desta forma,
1. F (x ) =
xi x
2. F (x ) =
F () = 0 e F (+) = 1.
Podemos utilizar a funo de repartio para calcular a probabilidade P (a < X < b ), da seguinte
maneira:
( 4.36)
ESTATSTICA E PROBABILIDADE
83
f (x ) =
kx
, x < 0 ou x 1
, 0x <1
1=
f (x ) dx =
0 dx +
kx
dx +
k
0 dx = x 3
3 0
x <0 ,
F (x ) =
0 dx = 0
Z
0
0x <1 ,
F (x ) =
x 1 ,
F (x ) =
0 dx +
Z
0
Z0
0 dx +
3x 2 dx = x 3
Z
3x 2 dx +
0 dx = 1
1
Exerccios Propostos
EP 4.1. Uma varivel aleatria X tem a seguinte funo densidade de probabilidade:
8
>
<
f (x ) =
>
:
kx , 0 x < 5
k (10 x ) , 5 x < 10
0
, x < 0 ou x 10.
0
x +1
EP 4.2. Dada a funo de repartio: F (X ) =
>
2
:
1
(a) P
4.4
1
1
;
X
2
2
, x < 1
, 1 x < 1 Calcule:
, x 1.
(b) P (X = 0).
Existem experimentos em que o interesse est voltado para duas ou mais caractersticas (variveis), simultaneamente.
Sejam E um experimento aleatrio e S um espao amostral associado a E . Para um mesmo ponto amostral s
podemos obter os valores X (s ) e Y (s ) de duas variveis aleatrias X e Y . Uma varivel aleatria bidimensional
uma funo (X , Y ) que associa s S ao par (X (s ), Y (s )).
Assim como a varivel aleatria unidimensional, a bidimensional pode ser discreta ou contnua. Nosso
enfoque tratar, apenas, da varivel aleatria bidimensional discreta.
84
4.5
A distribuio de probabilidade conjunta uma funo que associa uma varivel aleatria bidimensional
discreta (X , Y ) ao nmero P (X = xi , Y = yj ), i N, ou seja,
P : (X , Y ) [0, 1]
(xi , yj ) 7 P (X = xi , Y = yj )
Esta funo satisfaz aos seguintes axiomas:
1.
2.
P (X = xi , Y = yj ) 0, i , j ;
X
X \Y
P (xi , yj ) = 1.
i =1 j =1
3
4
5
4.6
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
1
36
A funo de repartio conjunta de uma varivel aleatria bidimensional discreta definida por
F (x , y ) = P (X x , Y y ) =
XX
P (xi , yj )..
( 4.37)
xi x yj y
10
12
P (m)
0, 6
0, 4
P (n)
0, 3
0, 5
0, 2
4.7
Seja (X , Y ) uma varivel aleatria bidimensional discreta. Pode-se, a partir da funo distribuio de probabilidade conjunta, achar a distribuio ou densidade de probabilidade de X (distribuio ou densidade marginal
de X ) e de Y (distribuio ou densidade marginal de Y ).
4.8
P (X = xi ) =
P (Y = yj ) =
j =1
P (X = xi , Y = yj )
( 4.38)
P (X = xi , Y = yj )
( 4.39)
i =1
ESTATSTICA E PROBABILIDADE
85
xi \yj
4.9
xi \yj
0, 10
0, 04
0, 06
0, 20
0, 08
0, 12
0, 12
0, 20
0, 08
P (xi )
0, 10
0, 04
0, 06
0, 20
0, 20
0, 08
0, 12
0, 40
0, 12
0, 20
0, 08
0, 40
P (yi )
0, 42
0, 32
0, 26
xi \yj
0, 10
0, 20
0, 20
0, 04
0, 08
0, 08
0, 06
0, 12
0, 12
xi \yj
P (xi )
0, 10
0, 20
0, 20
0, 50
0, 04
0, 08
0, 08
0, 20
0, 06
0, 12
0, 12
0, 30
P (yi )
0, 20
0, 40
0, 40
podemos escrever
(xi , yj )
P (xi , yj )
0, 10
0, 20
0, 20
0, 04
0, 08
0, 08
0, 06
0, 12
0, 12
P (xi )
P (yj )
0, 50
0, 20
0, 50
0, 40
0, 50
0, 40
0, 20
0, 20
0, 20
0, 40
0, 20
0, 40
0, 30
0, 20
0, 30
0, 40
0, 30
0, 40
P (xi ) P (yj )
0, 10
0, 20
0, 20
0, 04
0, 08
0, 08
0, 06
0, 12
0, 12
4.9.1
Exerccios Propostos
xi \yj
EP 4.3. Considere a seguinte distribuio de probabilidade ao lado. Verifique se as variveis aleatrias X e Y so independentes.
0, 10
0, 04
0, 06
0, 20
0, 08
0, 12
0, 12
0, 20
0, 08
xi \yj
0, 1
0, 2
0, 0
0, 3
0, 2
0, 1
0, 1
0, 0
4.10
Probabilidade Condicional
Seja xi um valor da varivel aleatria discreta X , tal que P (xi ) > 0. A probabilidade
P (Y = yj |X = xi ) =
P (xi , yj )
,
P (xi )
( 4.41)
denominada probabilidade condicional de Y = yj dado que X = xi ocorreu. Desta forma, uma vez fixado o
valor xi , os pares (yj , P (Y = yj |X = xi )) definem uma distribuio condicional de Y , dado que X = xi , pois
j =1
P (Y = yj |X = xi ) =
X
P (X = xi , Y = yj )
P (X = xi )
j =1
X
P (X = xi )
j =1
P (X = xi )
xi \yj
( 4.42)
= 1.
0, 10
0, 04
0, 06
0, 20
0, 08
0, 12
0, 12
0, 20
0, 08
Soluo:
P (X = 0|Y = 1) =
P (X = 0, Y = 1)
0, 04
=
= 0, 125;
P (Y = 1)
0, 32
P (X = 2|Y = 1) =
P (X = xi |Y = 1)
xi
P (X = 1, Y = 1)
0, 08
P (X = 1|Y = 1) =
=
= 0, 25;
P (Y = 1)
0, 32
P (X = 2, Y = 1)
0, 20
=
= 0, 625;
P (Y = 1)
0, 32
0, 125
0, 25
0, 625
Total
Medidas de Posio
Da mesma maneira que em Estatstica Descritiva, podemos falar de medidas de tendncia central em uma
distribuio de probabilidade.
4.11
Seja X uma varivel aleatria. A esperana matemtica E (X ) ou, simplesmente esperana, valor esperado,
expectncia ou mdia de uma distribuio de probabilidade, a mdia dos valores da varivel aleatria quando
repetimos o experimento um grande nmero de vezes.
4.11.1
x1
x2
x3
P (X = xi )
P (X = x1 )
P (X = x2 )
P (X = x3 )
E (X ) =
i =1
xn
P (X = xn )
( 4.43)
xi P (X = xi )
87
Soluo: Da tabela
E (X ) =
6
X
i =1
1
6
P (X = xi )
1
6
1
6
xi P (X = xi ) =
1
6
1
6
, temos:
1
6
7
1
(1 + 2 + 3 + 4 + 5 + 6) = .
6
2
ER 47. O tempo T , em minutos, necessrio para um operrio processar certa pea uma varivel aleatria
com a seguinte distribuio de probabilidade exibida abaixo.
(a) Estabelea a funo de repartio conjunta;
(b) Calcule o tempo mdio de processamento.
Soluo:
(a) A funo de repartio conjunta :
8
0
>
>
>
>
0,
1
>
>
>
0, 3
>
>
< 0, 4
>
0, 7
>
>
>
0, 8
>
>
>
>
0, 9
>
:
P (T = ti )
0, 1
0, 2
0, 1
0, 3
0, 1
0, 1
0, 1.
, se t < 1
, se 1 t < 2
7
X
E (T ) =
i =1
, se 2 t < 3
, se 3 t < 4
, se 4 t < 5
, se 5 t < 6
ti P (T = ti )
0, 1 1 + 0, 2 3 + 0, 1 3+
0, 3 4 + 0, 1 5 + 0, 1 6 + 0, 1 7
=
=
, se 6 t < 7
1, 0 , se t 7
4.11.2
0, 1 + 0, 6 + 0, 3 + 1, 2 + 0, 5 + 0, 6 + 0, 7
4.
Seja X uma varivel aleatria contnua com densidade de probabilidade f (x ). De forma anloga ao caso
discreto, o valor esperado de X dado por
Z
E (X ) =
( 4.44)
x f (x ) dx .
ER 48. Uma liga metlica formada ao misturarmos dois metais em estado lquido. A liga resultante contm
uma certa percentagem de chumbo, que pode ser considerada uma varivel aleatria X cuja funo densidade
de probabilidade dada por f (x ) = 0, 3 105 x (100 x ), 0 x 100. Qual o valor esperado para X ?
Soluo: O valor esperado de X
Z
E (X ) =
x 0, 3 10
0, 3 105
100
x (100 x ) dx = 0, 3 10
100
x 3 x 4
3
4 0
= 0, 3 105
100
(100x 2 x 3 ) dx
108 108
3
4
= 0, 3 103
1
= 25
12
4.11.3
Propriedades da Esperana
Sejam k R uma constante, X e Y duas variveis aleatrias com esperanas E (X ) e E (Y ) respectivamente. Ento
88
1. E (k ) = k ;
Prova: Seja X uma varivel aleatria com distribuio de probabilidade P (X = xi ) = P (xi ), i N.
Ento
E (k ) =
i =1
k P (xi ) = k
P (xi ) = k .
i =1
2. E (k + X ) = k + E (X );
Prova: Se X uma varivel aleatria discreta, ento
E (k + X ) =
i =1
(k + xi ) P (xi ) =
i =1
(k P (xi ) + xi P (xi )) = k
P (xi ) +
i =1
i =1
xi P (xi ) = k + E (X )
3. E (k X ) = k E (X );
Prova: Se X uma varivel aleatria discreta, ento
E (k X ) =
i =1
(k xi ) P (xi ) = k
i =1
xi P (xi ) = k E (X )
4. E (X + Y ) = E (X ) + E (Y );
Prova: Se X e Y so duas variveis aleatrias discretas com distribuies de probabilidade, respectivamente,
P (xi ), i N
,
P (yj ), j N
P (X = xi ) =
P (Y = yj ) =
ento
E (X + Y )
=
=
=
i =1 j =1
X
X
i =1 j =1
(xi + yj ) P (xi , yj ) =
xi P (xi , yj ) +
xi P (xi ) +
i =1
i =1 j =1
i =1 j =1
yj P (xi , yj ) =
i =1
xi
P (xi , yj ) +
j =1
yj
j =1
P (xi , yj )
i =1
yj P (yj ) = E (X ) + E (Y )
j =1
E (X Y ) =
=
i =1 j =1
i =1 j =1
(xi yj ) P (xi , yj ) =
xi P (xi ) yj P (yj ) =
i =1
xi P (xi )
j =1
yj P (yj )
E (X ) E (Y )
Em todos estes casos, supondo a presena de variveis aleatrias contnuas, a demonstrao seria
similar.
ESTATSTICA E PROBABILIDADE
89
4.12
Mediana
A mediana de uma distribuio de probabilidades o valor Md da varivel aleatria que divide a distribuio
em duas partes iguais, ou seja
P (Md ) =
1
(varivel aleatria discreta);
2
F (Md ) =
1
(varivel aleatria contnua)
2
f (x ) =
Soluo: Como
4.13
1
= F (x ) =
2
0 , x R \ [0, 1]
.
2x , x [0, 1]
Z
f (x ) dx =
0 dx +
1
2
. Da x =
.
2
2
2x dx = x 2 , ento x 2 =
Moda
A moda de uma distribuio de probabilidades o valor Mo da varivel aleatria que possui a maior probabilidade, se X for discreta, ou maior densidade, se X for contnua
ER 51. Determine a moda, se X uma varivel aleatria com a
seguinte distribuio de probabilidade dada ao lado.
P (X = xi )
0, 2
0, 3
0, 5
f (x ) =
0 , x R \ [0, 1]
2x
, x [0, 1]
Soluo: Claramente que Mo = 1, pois, neste ponto que a funo assume o valor mximo 2, (f (1) = 2).
4.14
Varincia
A varincia de uma varivel aleatria corresponde uma disperso ou variabilidade dos diferentes valores
possveis em torno da esperana.
Seja X uma varivel aleatria. A varincia VAR (X ) ou 2 de X definida por:
( 4.45)
4.14.1
VAR (X ) =
i =1
i =1
( 4.46)
(d) E (X ) e VAR (X ).
Soluo: (a) P (X = xi )
P (X xi )
1
8
1
8
1
2
5
8
3
8
1
1
(b)
1
1
1
5
(c) P (1 < X < 3) = P (X = 2) = , P (1 X 2) = P (X = 1) + P (X = 2) =
+
= ,
2
8
2
8
1 3
7
1
5
P (1 < X 3) = P (X = 2) + P (X = 3) = + = , F (1) = e F (2) =
2 8
8
8
8
1
1
3
9
(d) E (X ) = 1 + 2 + 3 = .
8 2
8
4
11
9 2
9 2
9 2
P (X = 1) + 2
P (X = 2) + 3
P (X = 3) =
Portanto, VAR (X ) = 1
.
4
4
4
8
4.14.2
4.5 Teorema. Sejam X uma varivel aleatria contnua com funo densidade de probabilidade f (x ) e esperana E (X ). Ento
VAR (X ) =
[x E (X )]2 f (x ) dx .
( 4.47)
[x E (X )]2 f (x ) dx .
VAR (X ) = E (X 2 ) [E (X )]2 .
( 4.48)
Prova: Seja X uma varivel aleatria discreta com distribuio de probabilidade P (X = xi ) = P (xi ) e
esperana E (X ). Ento,
VAR (X )
=
=
E [(X E (X ))2 ] =
i =1
xi2
i =1
P (xi ) 2E (X )
i =1
i =1
xi P (xi ) + [E (X )]2
P (xi )
i =1
91
Pode-se demonstrar, analogamente, se considerarmos X uma varivel aleatria contnua com densidade
de probabilidade f (x ) e esperana E (X ).
4.14.3
VAR (kX )
4.15
=
=
Desvio Padro
( 4.49)
VAR (X )
ER 54. Qual o desvio padro de uma distribuio obtida ao lanarmos um dado um grande nmero de vezes?
E (X ) =
P (X = xi )
1
6
1
6
1
6
1
6
1
6
1
6
1
7
1
91
(1 + 2 + 3 + 4 + 5 + 6) =
e E (X 2 ) = (1 + 4 + 9 + 16 + 25 + 36) =
. Logo,
6
2
6
6
VAR (X ) =
Portanto, =
91
7
2
182 147
35
91 49
=
=
.
6
4
12
12
35
1, 71.
12
Nota 11. De modo geral, o desvio padro a mais importante e til medida de variao. O desvio
padro de um conjunto de valores uma medida de variao dos valores em relao mdia aritmtica.
A varincia o quadrado do desvio padro, ou, podemos dizer que o desvio padro igual a raiz quadrada
da varincia. Uma dificuldade com a varincia que ela no expressa nas mesmas unidades dos dados
originais, enquanto que o desvio padro tem a mesma unidade de medida dos dados originais.
ER 55. Para cada pea processada, o operrio ganha um valor fixo de R $10, 00, mas, se ele processa a pea
em menos de 6 minutos, ganha 1% deste valor, por cada minuto poupado. Encontre a distribuio, a mdia e o
desvio padro da varivel aleatria G : quantia em reais ganha por pea.
92
, se t < 1
E (T ) =
, se 1 t < 2
, se 2 t < 3
i =1
ti P (T = ti )
= 0, 1 1 + 0, 2 3 + 0, 1 3+
, se 3 t < 4
>
> 0, 7 , se 4 t < 5
>
>
0, 8
>
>
>
>
0, 9
>
:
7
X
0, 3 4 + 0, 1 5 + 0, 1 6 + 0, 1 7
, se 5 t < 6
, se 6 t < 7
= 0, 1 + 0, 6 + 0, 3 + 1, 2 + 0, 5+
1, 0 , se t 7
0, 6 + 0, 7 = 4.
ER 56. Calcule (X ), se S = [0, 1] e X uma varivel aleatria contnua com densidade de probabilidade
(
f (x ) =
Soluo: E (X ) =
VAR (X )
Z 1
=
=
4.16
x 3x
(x E (X ))2 f (x ) dx =
dx = 3
1
0
3
x4
dx = 3 = .
4 0
4
x
Z
3
4
3x 2 dx
1
9
9
3
3
x2 x +
x 2 dx = 3
x4 x3 + x2
2
16
2
16
0
0
1
x5
1 3
3
3 4
3 3
3
=3
=
3
x + x
+
.
5
4
16 0
5 4 16
80
(X )
, x S
, x S
Z
xf (x ) dx =
0
3x 2
dx
3
.
80
A covarincia uma medida da distribuio conjunta dos valores dos desvios das variveis X e Y em
relao s respectivas mdias, que descreve a dependncia linear entre as variveis.
4.7 Definio. Se X e Y so duas variveis aleatrias, ento a covarincia C OV (X , Y ) entre X e Y definida
por:
( 4.50)
C OV (X , Y ) = E ([X E (X )] [Y E (Y )]).
C OV (X , Y ) =
=
E ([X E (X )] [Y E (Y )]) = E (X Y X E (Y ) + E (X )Y X E (Y ))
E (X Y ) E (X )E (Y ) + E (X )E (Y ) E (X )E (Y ) = E (X Y ) E (X )E (Y ).
Y \X
ER 57. De acordo com a distribuio conjunta de X e Y , ao lado, calcule a covarincia.
0
1
2
3
1
5
0
0
0
0
1
5
2
5
1
5
ESTATSTICA E PROBABILIDADE
93
Soluo:
aleatria.
Y \X
P (yj )
1
5
1
5
1
2
0
0
1
5
2
5
2
5
1
5
3
5
2
5
2
5
P (xi )
E (X )
2
X
i =1
E (Y )
4
X
i =1
E (X Y )
xi P (xi ) = 0
3
3
2
+1 =
5
5
5
yi P (yi ) = 0
2
2
10
1
+10+2 +3 =
=2
5
5
5
5
4
2 X
X
xi yj P (xi , yj )
i =1 j =1
1
1
2
1
7
+010+020+03 +100+110+12 +13 =
5
5
5
5
5
7 3
= E (X Y ) E (X )E (Y ) = 2 = 0, 2
5 5
= 00
C OV (X , Y )
VAR (X + Y ) =
=
=
E X 2 + 2X Y + Y 2 2(X + Y )E (X ) 2(X + Y )E (Y ) +
[E (X )]2 + 2E (X )E (Y ) + [E (Y )]2
E (X 2 ) + 2E (X Y ) + E (Y 2 ) 2E (X )E (X + Y ) 2E (Y )E (X + Y )+
[E (X )]2 + 2E (X )E (Y ) + [E (Y )]2
=
=
E (X 2 ) [E (X )]2 + E (Y 2 ) [E (Y )]2 + 2E (X Y ) 2E (X )E (Y )
VAR (X ) + VAR (Y ) + 2 C OV (X , Y )
Y \X
1
1
0, 10
0, 25
0, 30
0, 00
0, 10
0, 25
Y \X
P (yi )
1
1
0, 10
0, 25
0, 30
0, 00
0, 10
0, 25
0, 50
0, 50
P (xi )
0, 35
0, 30
0, 35
1, 00
Para que duas variveis aleatrias X e Y sejam independentes a condio de independncia tem que
ser verificada para todos os pares de valores possveis de X e Y . Sendo assim, observe que as variveis X
e Y so dependentes, pois, P (X = 1, Y = 1) = 0, 1 e P (X = 1) P (Y = 1) = 0, 35 0, 50 = 0, 175.
Entretanto, C OV (X , Y ) = E (X Y ) E (X )E (Y ) = 0. De fato,
E (X )
E (Y )
E (X Y )
X
i
X
yj P (yj )
j
XX
= 1 0, 50 + 1 0, 50 = 0
xi yj P (xi , yj ) = 0
4.17
xi P (xi ) = 1 0, 35 + 0 0, 3 + 1 0, 35 = 0
Exerccios Propostos
(ii) A = 2Y ;
(iii) Z = X Y .
P (X ) =
(a) Calcule o valor de k ;
k
, para x = 1, 3, 5, 7.
x
(c) VAR (X )
ESTATSTICA E PROBABILIDADE
95
EP 4.7. Seja Z a varivel aleatria correspondente ao nmero de pontos de uma pea de domin.
(a) Construir a distribuio de probabilidades;
(b) Determinar F (Z );
(e) VAR (Z ).
X Y
0, 1
0, 2
0, 3
0, 2
0, 1
0, 1
8
< 3
f (x ) =
(1 x 2 )
0
, x (0, 1)
, x R \ (0, 1)
( x
f (x ) =
(c) VAR (X ).
2
0
, x [0, 2]
, x R \ [0, 2]
EP 4.12. Uma varivel aleatria X tem a seguinte funo densidade de probabilidade abaixo.
8
>
<
f (x ) =
(b) VAR (X ).
>
:
k , 0x <2
k (x 1) , 2 x < 4
0 , x < 0 ou x 4.
(b) Calcule P X
1
;
2
f (x ) =
6x (1 x ) , x (0; 1)
0 , x R \ (0; 1).
4.18
4.18.1
Uma varivel aleatria discreta X tem distribuio, prova ou ensaio de Bernoulli, X B (p ), se um modelo
probabilstico aplicado a variveis aleatrias dicotmicas, isto , se representa um experimento cujo resultado
pode ser um sucesso (se ocorrer o evento de interesse) ou um fracasso (o evento de interesse no ocorre). Por
exemplo:
(a) de um lote contendo um certo nmero de peas, escolher, ao acaso, uma pea defeituosa ou no;
(b) no lanamento de um dado, observar se o resultado foi o lado 2 ou outro lado qualquer;
(c) observar se uma pea produzida por uma empresa perfeita ou defeituosa.
1p
X
P (X = xi )
NOTAO: X Ber noulli (p ). L-se da seguinte forma: X tem distribuio Bernoulli com parmetro p .
ER 59. Qual a funo de probabilidade no lanamento de um dado e a ocorrncia da face 6?
Soluo: Sucesso: ocorrer a face 6. Podemos definir a varivel aleatria X da seguinte forma
face 6
demais faces
P (X = x ) =
1
6
5
6
se x = 1
se x = 0
E (X ) = p e VAR (X ) = p (1 p ).
ESTATSTICA E PROBABILIDADE
97
1p
X
P (X = xi )
Sendo X uma varivel aleatria discreta, temos:
E (X ) =
2
X
i =1
VAR (X )
xi P (X = xi ) = 1 p + 0 (1 p ) = p .
E (X 2 ) [E (X )]2 = p p 2 = p (1 p ).
2
ER 60. Qual a varincia numa distribuio dada ao consideramos o lanamento de um dado e obteno da
face 2?
Soluo: Consideremos o evento E (sucesso): ocorrer a face 2. Podemos definir uma varivel aleatria
X da seguinte forma:
(
1 , se ocorrer a face 2
X =
0 , se ocorrer uma face diferente de2
A distribuio de Bernoulli da varivel aleatria X
P (X = x ) =
8
1
>
>
< 6
>
>
: 5
se x = 1
se x = 0
4.18.2
1
1 5
5
e VAR (X ) = =
.
6
6 6
36
Distribuio Binomial
P (Xi = x ) = P (x ) =
p
1p
,
,
se x = 1
se x = 0
Y : Xn
(X1 , X2 , . . . , Xn ) 7
Y (X ) =
n
X
Xi .
i =1
Nestas condies dizemos que Y tem distribuio binomial com parmetros n e p (Y B (n, p )) e
P (Yi = y ) = P (y ) =
98
n
y
p y (1 p )ny ,
n
x
Lembre-se!
n!
(n x )! x !
ER 61. Uma usina hidreltrica tem 5 geradores que funcionam independentemente, cada um com probabilidade 0, 98 de estar em operao. Qual a probabilidade de que exatamente dois estejam em funcionamento em
determinado instante?
Soluo: Seja Y a varivel aleatria que expressa se o gerador est ou no em funcionamento. A
probabilidade de um gerador estar em funcionamento (a probabilidade de sucesso) p = 0, 98.
Por se tratar de uma distribuio binomial, a probabilidade de 2 geradores estarem em funcionamento
P (X = 2) =
5
0, 982 (1 0, 98)52 = 10 (0, 98)2 (0, 02)3 = 0, 000077.
2
8
0, 32 0, 76 = 0, 29647548.
2
(b )P (X 2) = P
(X = 0) + P (X =
1)
+ P (X = 2)
8
8
8
0
8
=
0, 3 0, 7 +
0, 31 0, 77 +
0, 32 0, 76 = 0, 55177381.
0
1
2
(c) Como a varivel aleatria X assume apenas os valores em {0, 1, 2, 3, 4, 5, 6, 7, 8}, podemos calcular
(a) P (X = 2) =
ER 63. Vinte peas so extradas, ao acaso e com reposio, de um lote contendo 1000 peas. Qual a
probabilidade de que 5 peas, dentre as 20 selecionadas, sejam defeituosas, sabendo-se que 8% das peas do
lote so defeituosas?
Soluo: P (X = 5) =
20
0, 085 0, 9215 = 0, 014544912.
5
E (Y ) = n p e VAR (Y ) = n p (1 p ).
ESTATSTICA E PROBABILIDADE
99
P (Xi = x ) = P (x ) =
p
1p
,
,
se x = 1
se x = 0
VAR (Y ) =
=
=
VAR (X1 + X2 + . . . + Xn )
VAR (X1 ) + VAR (X2 ) + . . . + VAR (Xn )
p q + p q + . . . + p q = n p q.
2
ER 64. Com os dados do exemplo anterior, calcular o nmero esperado, a varincia e o desvio-padro dos
geradores em funcionamento.
Soluo:
E (X ) = n p = 5 0, 98 = 4, 9, VAR (X ) = n p q = 5 0, 98 0, 02 = 0, 098 e (X ) =
0, 098 = 0, 3130.
Exerccios Propostos
EP 4.14. Das variveis abaixo descritas, assinale quais so binomiais, e para estas d os respectivos campos
de definio e distribuio de probabilidades. Quando julgar que a varivel no binomial, aponte as razes
de sua concluso.
(a) De um urna com 10 bolas brancas e 20 pretas, vamos extrair, com reposio, cinco bolas. Seja X o
nmero de bolas brancas nas 5 extraes.
(b) Refaa o problema anterior, mas desta vez as n extraes so sem reposio.
(c) De 5 urnas com bolas pretas e brancas, vamos extrair de cada uma delas uma bola. Suponha que X o
nmero de bolas brancas obtidas no final.
(d) Em uma indstria existem 100 mquinas que fabricam determinada pea. Cada pea classificada como
sendo boa ou defeituosa. Escolhemos ao acaso um instante de tempo, e verificamos uma pea de cada
uma das mquinas. Suponha que X seja o nmero de peas defeituosas.
EP 4.15. Um fabricante de peas de automveis garante que uma caixa de suas peas conter, no mximo,
2 defeituosas. Se a caixa contm 18 peas, e a experincia tem demonstrado que esse processo de fabricao
produz 5% das peas defeituosas, qual a probabilidade de que uma caixa satisfaa a garantia?
EP 4.16. Dez peas so extradas, ao acaso, com reposio de um lote contendo 500 peas, qual a probabilidade de que trs peas, dentre as 10 selecionadas, sejam defeituosas, sabendo-se que 10% das peas do
lote so defeituosas?
EP 4.17. Uma tampa de garrafa lanada 10 vezes para o alto. Calcule a probabilidade da tampa cair virada
para cima:
(a) 9 vezes.
100
EP 4.18. Um dado honesto lanado 5 vezes para cima. Calcule a probabilidade da face 3 aparecer:
(a) 2 vezes.
EP 4.19. Admitindo-se que as chances de sarem cara e coroa sejam iguais em uma moeda no viciada.
Calcular a probabilidade de se obter 6 caras e 2 coroas.
EP 4.20. Um time X tem 1/3 de probabilidade de vitria sempre que joga. Se X jogar 3 partidas, calcule a
probabilidade de:
(a) X vencer exatamente 2 partidas;
EP 4.22. Se 15% das peas produzidas por uma mquina tem algum defeito, determinara probabilidade de
que entre 10 peas escolhidas ao acaso:
(a) Uma ter defeito;
EP 4.23. Qual a probabilidade de uma casa com 6 filhos ter 4 filhos homens e 2 mulheres, sabendo que a
probabilidade de nascer filho homem 75%?
EP 4.24. Num cesto cheio de bombons onde 40% deles esto envenenados, qual a probabilidade de uma
pessoa pegar 2 bombons sem veneno em 4 idas ao cesto?
EP 4.25. Uma moeda no viciada lanada 4 vezes. Encontre a probabilidade de:
(a) Dar 2 caras
4.18.3
Distribuio de Poisson
A distribuio foi descoberta por Simon-Denis Poisson (1.781 1.840) e publicada, conjuntamente com a
sua teoria da probabilidade, em 1.838 no seu trabalho Recherches sur la probabilit des jugements en matires
criminelles et matire civile (Inqurito sobre a probabilidade em julgamentos sobre matrias criminais e civis).
O trabalho focava-se em certas variveis aleatrias N que contavam, entre outras coisas, o nmero de ocorrncias discretas (por vezes chamadas de chegadas) que tinham lugar durante um intervalo de tempo de
determinado comprimento.
Em muitos casos, conhece-se o nmero de sucessos, porm, se torna difcil e, s vezes, sem sentido, determinar o nmero de fracassos ou o nmero total de provas. Por exemplo: automveis que passam numa
esquina. Pode-se num determinado intervalo de tempo anotar o nmero de carros que passaram, porm, o
nmero de carros que deixaram de passar pela esquina no poder ser determinado. Veremos que a distribuio de Poisson se aplica nestes casos.
A distribuio de Poisson largamente usada quando de deseja contar o nmero de eventos de um certo tipo
que ocorrem em um intervalo de tempo, superfcie ou volume. Por exemplo: o nmero de chamadas telefnicas
recebidas por um PABX durante um intervalo pequeno de tempo; o nmero de falhas de um computador em
um dia de operao; o nmero de glbulos sanguneos visveis ao microscpio ou a rea de superfcie visvel
no campo do microscpio sendo dada por unidades quadradas; o nmero de estrelas encontradas em uma
parte da Via-Lctea que tenha o volume V .
ESTATSTICA E PROBABILIDADE
101
P (X = x ) =
e t (t )x
x!
( 4.51)
em que
e base do logaritmo natural (e = 2.71828 . . .).
x o nmero de ocorrncias no intervalo t analisado.
x ! o fatorial de x .
um nmero real, igual ao nmero esperado de ocorrncias que ocorrem num dado intervalo de tempo.
t o intervalo de tempo ou espao que se est analisando o nmero de ocorrncias desejadas.
P (x ) a probabilidade de observarmos as ocorrncias no intervalo t analisado.
ER 65. Numa indstria txtil existem numerosos teares de certo tipo. Depois de muitas observaes, chegouse concluso que o nmero de teares que se avariam em cada ms uma varivel aleatria X com distribuio de Poisson com parmetro = 3. Calcule a probabilidade de que 3 ou mais teares se avariem durante
um ms.
Soluo:
P (X 3) =
=
P (X = 3) + P (X = 4) + . . . = 1 P (X < 3) = 1 [P (X = 0) + P (X = 1) + P (X = 2)]
e 3 30
9
e 3 31
e 3 32
17 3
= 1 e 3 3e 3 e 3 = 1
+
+
e 0, 57681
0!
1!
2!
2
2
E (X ) = VAR (X ) = .
102
E (X ) =
i =1
xi P (xi ) =
X
X e xi
e xi
e xi
=
=
xi
xi !
xi (xi 1)!
(xi 1)!
i =1
i =1
xi
i =1
Fazendo xi 1 = yj , j 0 , tem-se
E (X ) =
n
X
e y +1
y!
i =0
Como
n
X
y
i =1
y!
= e
n
X
y
i =0
y!
E (X 2 ) =
i =1
X
X e xi
e xi
e xi
=
=
.
xi2
xi
xi !
xi (xi 1)!
(xi 1)!
i =1
i =1
xi2
Fazendo xi 1 = yj , j 0, tem-se
E (X 2 ) =
X e yi +1
X e yi +1
e yi +1
=
+
yj
yj !
yj !
yj !
(yj + 1)
j =0
j =0
j =0
X yj
X
X yj
yi
yj 1
+ e
= 2 e
+ e
yj
yj
yj !
y!
yj (yj 1)!
y!
j =0
j =0 j
j =0
j =0 j
2 e e + e e = 2 + .
VAR (X ) = E (X 2 ) [E (X )]2 = 2 + 2 = .
Ateno!
Nota 13. A mdia e a varincia numa distribuio de Poisson so iguais. Portanto, quando se for analisar
a ocorrncia de determinado evento e observarmos que a mdia um valor prximo da varincia,
razovel aproximarmos a ocorrncia deste evento atravs de uma distribuio de Poisson.
ER 66. Um pesquisador est interessado no nmero de ovos depositados por uma espcie de pssaro. Na
primavera, ele procura e acha 80 ninhos. O nmero mdio de ovos por ninho foi 3, 8 e a varincia foi 3, 1. Porque
a varincia aproximadamente igual mdia, ele acha que pode ser razovel descrever o nmero de ovos por
ninho como tendo uma distribuio de Poisson com mdia 3, 8.
(a) Qual a probabilidade de encontrarmos um ninho com 4 ovos, se vamos verificar 2 ninhos?
Soluo: (a) Temos uma mdia de ocorrncia de 3, 8 ovos para cada ninho, ou seja
=
3, 8 ovos
,
1 ninho
neste caso, vamos analisar um espao t de 2 ninhos, ou seja, t = 2 ninhos e x = 4 ovos. Logo, queremos
calcular:
P (4) =
103
3, 8 ovos
(b) Temos =
. Assim, vamos analisar um espao t de 1 ninho, ou seja, t = 1 ninho e x = 0
1 ninho
ovo. Logo, queremos calcular:
P (0) =
ER 67. Uma pizzaria recebe, em mdia, 5 chamadas a cada 1, 4 horas. Qual a probabilidade da pizzaria
receber no mnimo uma chamada em 10 minutos?
5 chamadas
5 chamadas
=
1, 4
horas
84 minutos
10
horas = 10 minutos . Note que para transformarmos horas em minutos basta multiplicarmos por 60,
60
pois uma hora tem 60 minutos, e para transformarmos minutos em hora, basta dividirmos por 60.
Temos que, no mnimo, uma chamada significa termos uma ou mais chamadas, ou seja, x = 1, 2, 3, . . .,
et =
ento desejamos calcular a probabilidade de P (1) + P (2) + P (3) + . . .. Como o espao amostral deste
evento = {0, 1, 2, 3, . . .}, ou seja, o conjunto de todas as possibilidades do nmero de chamadas em 10
minutos dado pelo conjunto . Como a probabilidade do espao amostral igual a 100% = 1, P ( ) =
P (0) + P (1) + P (2) + P (3) + . . . = 1. Segue que,
5
10
e 1,4 60
5 10
1, 4 60
0
=1
e 84 10
5
10
84
Soluo: Seja X o nmero de chamadas telefnicas em duas horas. Ento, = 2 (nmero mdio
chamadas por hora), t = 2h. Logo, = t = 4 (nmero mdio chamadas em duas horas). Portanto,
P (X 3) =
4
X
P (X = xi ) =
i =1
4
X
e 4 4xi
i =1
xi !
= 0, 4331.
2
Seja Y o nmero de chamadas telefnicas em 90 minutos. Ento, t = 90 min, =
(nmero mdio de
60
chamadas por minuto) e = t = 3 (nmero mdio chamadas em 90 minutos).
P (Y = 0) =
e 3 30
= 0, 0498.
0!
4.14 Teorema. A mdia ou valor esperado de sucesso de uma distribuio de Poisson de parmetro e
a varincia por VAR (X ) = .
Prova:
E (X ) =
x =0
=
104
x P (x ) =
x =0
e e =
X
X x 1
e x
x 1
= e
= e
x
x!
x (x 1)!
(x 1)!
x =0
x =0
E (X )
X
X
e x
x 1
x 1
= e
= e
x P (x ) =
x
x2
x
x!
x (x 1)!
(x 1)!
x =0
x =0
x =0
x =0
2
"
= e
= e
X
e 01
x 1
+
x
0
(0 1)! x =1
(x 1)!
X
X
x 1
x 1
x 1
= e
+
(x 1)
(x 1 + 1)
(x 1)!
(x 1)!
(x 1)!
x=
x=
x =1
= e
x=
(x 1)
X
x 1
e x 1
+ e =
+ e e
(x 1)
(x 1)!
(
x
1)!
x=
= [E (x ) + 1] = [ + 1] = 2 +
Logo, V (X ) = E (X 2 ) [E (X )]2 = 2 + 2 = .
4.18.4
4.15 Teorema. Seja X uma varivel aleatria com distribuio binomial com parmetros n e p . Quando o
nmero n de repeties do experimento E cresce e a probabilidade p de sucesso se aproxima de zero, de modo
que n p se aproxima de uma constante , dizemos que a distribuio binomial converge para a distribuio de
Poisson com parmetro . Ento
!
e x
n
p x (1 p)nx =
x!
x
lim
n
p 0
np
A distribuio de Poisson pode ser usada como uma aproximao da distribuio Binomial quando n
grande e p pequeno (np 7).
n
e x
, onde = np .
p x (1 p )nx
x!
x
P (X = x ) =
X B (50.000; 1/20.000),
e que calcular a probabilidade de 5 pessoas comprarem este refrigerante por uma distribuio binomial uma
tarefa bastante extensa devido aos elevados nmeros utilizados, como indicado a seguir
P (X = 5) =
50.000
0, 000055 0, 9999549.995 = 0, 066800108.
5
Entretanto, sendo n = 50.000, um nmero muito grande, e p = 0, 00005, bem prximo a zero, as condies
para a aproximao entre as distribuies Binomial e de Poisson esto satisfeitas. Sendo assim, X converge
para uma distribuio de Poisson com parmetro = np = 50.000 0, 00005 = 2, 5 e cuja esperana
E (X ) = = 2, 5.
ESTATSTICA E PROBABILIDADE
105
P (X = 5) =
e 2,5 2, 55
e x
=
0, 066800942.
x!
5!
ER 70. Consideremos 1.000 ensaios independentes de Bernoulli cada um com probabilidade p = 0, 0001 de
sucesso. Determine a probabilidade de observarmos exatamente 2 sucessos.
Soluo: P (X = 2)
e 0,1 0, 12
= 0, 0045.
2!
ER 71. Determinado tipo de foto-receptor vendido em caixas com 5.000 peas. uma caracterstica da
fabricao produzir 0, 03% de defeituosos. Determine a probabilidade de que em uma caixa haja mais de dois
defeituosos.
Soluo: n = 5.000 e p = 0, 0003, assim = np = 1, 5. P (X > 2) = 1 P (X 2) = 1 [P (X =
0) + P (X = 1) + P (X = 2)] = 0, 1912
Poisson
4.18.5
Exerccios Propostos
EP 4.27. Uma fbrica produz tecidos com mdia de 2, 2 defeitos por jarda quadrada. Determine as seguintes
probabilidades:
(a) no mais de 4 defeitos numa jarda quadrada;
(b) nenhum defeito em duas jardas quadradas;
(c) duas jardas quadradas cada uma com dois defeitos.
EP 4.28. O nmero de petroleiros que chegam a uma refinaria em cada dia ocorre segundo uma distribuio
de Poisson, com = 2. As atuais instalaes podem atender, no mximo, a 3 petroleiros por dia. Se mais de 3
aportarem num dia, o excesso enviado a outro porto.
(a) Em um dia, qual a probabilidade de se enviar petroleiros para outro porto?
(b) De quanto devero ser aumentadas as instalaes para permitir atender a todos os navios que chegarem
pelo menos em 95% dos dias?
(c) Qual o nmero mdio de petroleiros que chegam por dia?
106
EP 4.29. Uma agncia recebe em mdia 4 ligaes por minuto. Calcule a probabilidade de:
(a) Receber no mximo 2 ligaes por minuto.
EP 4.30. Em uma avenida passam em mdia 5 carros por segundo. Calcule a probabilidade de passar:
(a) Exatamente 2 carros em 1 segundo.
EP 4.31. Uma montadora de carros constatou que ao testar os carros, em mdia, um defeito a cada 3.000km
rodados.
(a) Qual a probabilidade de que num teste de 2.500km haja no mximo um defeito?
(b) Qual a probabilidade de que um carro ande 5.000km sem que haja defeito?
EP 4.32. A mdia de chamadas telefnicas numa hora 2. Qual a probabilidade de:
(a) Receber exatamente 2 chamadas numa hora.
EP 4.33. Um advogado atende em mdia 4 clientes por hora. Calcule a probabilidade de se atendes
exatamente 4 clientes.
EP 4.34. Para este mesmo advogado, calcule a probabilidade de:
(a) atender apenas dois clientes em uma hora;
EP 4.35. Se a probabilidade de um aparelho telefnico ser instado possuindo algum tipo de defeito 0, 002,
determinar a probabilidade de entre 5000 aparelhos instalados:
(a) exatamente 5 serem defeituosos;
EP 4.36. Na pintura de parede aparecem defeitos em mdia na proporo de 2 defeitos por metro quadrado.
Qual a probabilidade de aparecerem 5 defeitos numa parede de 3 2 m?
EP 4.37. Um call-center recebe em mdia 6 chamadas por hora. Qual a probabilidade de:
(a) Receber 10 chamadas em 1 hora.
EP 4.38. Uma loja atende em mdia 4 clientes por hora calcular a probabilidade de atender:
(a) atender 1 cliente
4.19
4.19.1
Uma varivel aleatria X uniformemente distribuda num intervalo [a, b ] se sua densidade de probabilidade
dada pela funo:
8
1
<
, ax b
ba
f (x ) =
( 4.52)
:
0 , x 6 [a, b ]
y
De fato, para uma varivel aleatria X uniformemente distribuda em [a, b ]
Z
f (x )
1
Assim, (b a) f (x ) = 1, ou seja, f (x ) =
, para a x b .
ba
ESTATSTICA E PROBABILIDADE
107
x <a
x a
,
F (x ) =
>
: ba
1,
4.19.2
( 4.53)
ax <b
x b
4.16 Teorema. A esperana matemtica e a varincia de uma varivel aleatria uniforme so, respectivaa+b
(b a)2
mente, E [X ] =
e VAR [X ] = 2 =
.
2
12
Prova: Para a esperana, temos:
Z
E (X )
1
x
dx =
ba
a
a b a
(b a)(b + a)
1
a+b
=
ba
2
2
x f (x )dx =
=
=
xdx =
a
1
1 x 2
=
ba 2 a
ba
b 2 a2
2
E (X )
=
a
x 2 f (x )dx =
b 3 a3
3(b a)
Portanto, VAR (X ) = E (X 2 ) E (X )2 =
1
x2
dx =
ba
ba
b 3 a3
3(b a)
a+b
2
x 2 dx =
1 x 3
1
=
b a 3 a
(b a)
b 3 a3
3
(b a)2
.
12
4.19.3
(c) Varincia.
x 2
e o que queremos calcular
6
(b) Mdia.
1 1
1
52 42
= = .
6
6
2 3
6
2+8
(8 2)2
= 5 e (c) a varincia por VAR [X ] =
= 3.
2
12
Exerccios Propostos
EP 4.40. Dada uma determinada distribuio uniforme, um intervalo [2, 5], calcule pelas frmulas conhecidas
a mdia e a varincia.
EP 4.41. Um ponto escolhido ao acaso em um segmento de reta [5, 10]. Calcular:
(a) Probabilidade de encontrar um ponto entre 6 e 8.
(b) Mdia.
(c) Varincia.
EP 4.45. Supondo que X seja uniformemente distribudo entre [, ], onde > 0. Calcule de modo que
P (X > 1) = 1/3.
EP 4.46. Um ponto escolhido ao acaso num segmento de reta [0, 3], calcule a probabilidade de que este
ponto esteja entre 1/2 e 2, sabendo-se que a f (x ) dada por (b 2 a)/18.
EP 4.47. A probabilidade de um animal selvagem ir para um zoolgico e permanecer vivo l de 0, 25.
Determine a probabilidade de entre 10 animais.
(a) nenhum sobreviver;
EP 4.49. Um ponto escolhido ao acaso no segmento de reta [1, 10]. Qual a probabilidade de:
(a) o ponto estar entre 7 e 9;
(b) o ponto estar entre 1, 5 e 3; (c) o ponto ser maior que 10.
EP 4.50. Dois pontos so escolhidos independentemente no intervalo [0, 1], cada um de acordo com uma
distribuio uniforme. Calcule o valor esperado:
(a) do quadrado da distncia entre eles.
EP 4.51. Um nmero X escolhido de acordo com uma distribuio uniforme em [a, b ]. Sem conhecer o
nmero escolhido, voc deve escolher um segundo nmero c e pagar uma quantia igual a (X c )2 . Como
voc deve escolher c para minimizar o valor esperado desta quantia? Generalize para o caso em que X uma
varivel integrvel qualquer.
4.19.4
Distribuio Normal
A Normal uma das distribuies de probabilidade mais importantes na anlise de fenmenos reais e de
grande utilidade na Inferncia Estatstica e em Amostragem. Esta distribuio tambm conhecida com os
nomes de Curva de Gauss, Distribuio de Laplace ou ainda como Distribuio de Laplace-Gauss.
O conhecimento desta distribuio de probabilidades se deve a Abraham de Moivre (1.667 1.754) que,
em 1.733, apresentou a funo que a representa. Tratava-se at ento de um exerccio terico, sem aplicao
prtica. J. Bernoulli (1.654 1.705) acreditava que poderia haver aplicao na rea da economia, no entanto,
o uso desses conhecimentos na prtica se deve a Pierre-Simon Laplace (1.749 1.827) na Frana e a Johan
K. F. Gauss (1.777 1.855) na Alemanha. O nome Curva de Gauss se deve suposio que Gauss tivesse
sido a primeira pessoa a fazer uso de suas propriedades; no entanto, em 1.924, Karl Pearson reafirmou o papel
fundamental de Abraham de Moivre.
4.17 Definio. Uma varivel aleatria X segue uma distribuio Normal se a sua funo de densidade
definida por
(x)2
1
f (x) = e 22 ,
2
( 4.54)
109
4.19.5
y
N (,2 )
Mo ==Md
Principais Caractersticas
68.3%
+ 2
95.5%
+ 3
99.7%
Este resultado usado da seguinte maneira. Suponha que os comprimentos de um particular tipo de peixe
podem ser descritos por uma distribuio normal, com mdia 140mm e desvio padro 15mm. Podemos calcular
a proporo dos peixes que tm comprimentos entre 110 e 170mm, por exemplo, como a proporo da rea
sob a curva entre 110 e 170mm. Ento, cerca de 95% dos peixes tem comprimentos entre 110mm e 170mm.
A figura a seguir mostra como a curva (grfico da funo f ) afetada pelos valores numricos de e .
Nota 14. A aplicao da distribuio
normal na anlise de dados na rea
y
N (3, 0.25)
N (0, 1)
N (3, 1)
N (3, 4)
x
Como se trata de distribuio de probabilidade contnua, a rea que fica entre a curva e o eixo das abscissas
representa a probabilidade.
A probabilidade de ocorrer um evento entre os pontos a e b calculada pela integral definida da funo
avaliada neste intervalo, i.e.
Z b
(x )2
1
e 22 dx .
P (a X b ) =
a 2
A probabilidade representada pela medida de rea da regio hachurada no grfico seguinte.
Z =
X
.
Como a curva normal simtrica, somente necessrio apresentar as probabilidades da metade direita
da curva. A probabilidade de um intervalo qualquer da metade esquerda igual probabilidade do intervalo
equivalente na metade direita.
Na normal reduzida P (0, z ) = p enquanto P (Z z ) = 0, 5 p .
N (0, 1)
1p
ESTATSTICA E PROBABILIDADE
111
A tabela a seguir apresenta em cada clula o valor das rea limitada pelo grfico da curva e o eixo horizontal,
no intervalo [0, z ].
z
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,00
0,0000
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0,10
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,20
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,30
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,40
0,1554
0,1591
0,1628
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,50
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,60
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,70
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,80
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,90
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
1,00
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1,10
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
1,20
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
1,30
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
1,40
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,50
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
1,60
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
1,70
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
1,80
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
1,90
0,4713
0,4719
0,4726
0,4732
0,4738
0,4744
0,4750
0,4756
0,4761
0,4767
2,00
0,4772
0,4778
0,4783
0,4788
0,4793
0,4798
0,4803
0,4808
0,4812
0,4817
2,10
0,4821
0,4826
0,4830
0,4834
0,4838
0,4842
0,4846
0,4850
0,4854
0,4857
2,20
0,4861
0,4864
0,4868
0,4871
0,4875
0,4878
0,4881
0,4884
0,4887
0,4890
2,30
0,4893
0,4896
0,4898
0,4901
0,4904
0,4906
0,4909
0,4911
0,4913
0,4916
2,40
0,4918
0,4920
0,4922
0,4925
0,4927
0,4929
0,4931
0,4932
0,4934
0,4936
2,50
0,4938
0,4940
0,4941
0,4943
0,4945
0,4946
0,4948
0,4949
0,4951
0,4952
2,60
0,4953
0,4955
0,4956
0,4957
0,4959
0,4960
0,4961
0,4962
0,4963
0,4964
2,70
0,4965
0,4966
0,4967
0,4968
0,4969
0,4970
0,4971
0,4972
0,4973
0,4974
2,80
0,4974
0,4975
0,4976
0,4977
0,4977
0,4978
0,4979
0,4979
0,4980
0,4981
2,90
0,4981
0,4982
0,4982
0,4983
0,4984
0,4984
0,4985
0,4985
0,4986
0,4986
3,00
0,4987
0,4987
0,4987
0,4988
0,4988
0,4989
0,4989
0,4989
0,4990
0,4990
ER 73. Determine:
(a) P (0 < z < 1, 32);
10 8
1.5
Portanto, espera-se que a gua liberada pela fbrica exceda os limites regulatrios cerca de 9% do tempo.
112
Exerccios Propostos
EP 4.52. A concentrao de cdmio em cinzas de um certo lixo radioativo tem distribuio N (1, 0.72). Quais
so as chances de que uma amostra aleatria das cinzas tenha uma concentrao de cdmio entre 0.5 e
1.75ppm?
EP 4.53. Uma fbrica de pneus verificou que o desgaste de seus pneus tem uma mdia de 48.000km e
desvio-padro de 2.000km. Calcule a probabilidade de um pneu:
(a) Durar mais que 50.000km.
EP 4.54. Uma televiso dura em mdia 10 anos e tem um desvio-padro de 1 ano. Calcule a probabilidade
de durar:
(a) Acima de 12 anos.
EP 4.55. As alturas dos alunos de determinada escola so distribudas com mdia 1, 65m e desvio-padro
0, 35m. Encontre a probabilidade de um aluno medir entre 1, 55m e 1, 85m.
EP 4.56. Considerando a distribuio de alunos onde a mdia 1, 55m e o desvio-padro 0, 42m. Qual
deve ser o menor nmero para que possamos escolher os 10% maiores nmeros.
EP 4.57. A mdia dos dimetros de uma amostra de 100 argolas para correntes produzidas por uma mquina
de 1, 500 polegadas e o desvio padro 0, 003 polegadas. Sendo fabricadas para tal finalidade, permite
a tolerncia de 1, 495 polegadas a 1, 505 polegadas, se isso no se verificar as argolas sero consideradas
defeituosas. Determine a percentagem de argolas defeituosas.
EP 4.58. As alturas das portas de um determinado prdio so em mdia 2, 50m e o desvio padro de
0, 20m. Encontre a probabilidade de uma porta medir:
(a) entre 2, 30 e 2, 80;
EP 4.59. Numa empresa a mdia salarial de R $1.500, 00 o desvio padro de R $200, 00. Calcule a
probabilidade de um funcionrio receber entre R $1.350, 00 e R $1.600, 00.
EP 4.60. Uma concessionria vende em mdia 6 carros por dia e o desvio-padro de 3 carros. Qual a
probabilidade de se vender mais de 7 carros em um dia?
EP 4.61. A durao de um certo componente eletrnico tem mdia de 800 dias e desvio-padro 40 dias.
Calcular a probabilidade desse componente durar:
(a) entre 700 e 800 dias;
EP 4.62. Um produto pesa em mdia, 20g , com desvio-padro de 4g . embalado em caixas com 100
unidades. Sabe-se que as caixas vazias pesam 1000g , com desvio-padro de 50g . Admitindo-se uma distribuio normal nos pesos dos produtos e independncia entre as variveis dos pesos do produto e da caixa.
Calcular a probabilidade de uma caixa cheia pesar mais que 3100g .
Regresso e Correlao
Nas pesquisas estatsticas, um dos objetivos estabelecer relaes que possibilitem predizer uma ou mais
variveis em termos de outra. Podemos citar o estudo das vendas futuras de um produto em funo do seu
preo, ou a perda de peso de uma pessoa em decorrncia do nmero de semanas que se submete a uma
dieta de 500 calorias por dia, ou a despesa de uma famlia com a educao dos filhos em funo da idade dos
mesmos, etc.
ESTATSTICA E PROBABILIDADE
113
O ideal seria a predio de uma quantidade exata em termos de outra, mas isso raramente possvel. Na
maioria dos casos podemos obter a predio de mdias ou valores esperados. Por exemplo, no podemos
predizer exatamente quanto ganhar um engenheiro nos cinco anos subseqentes a sua formatura, mas, com
base em dados adequados, possvel predizer o ganho mdio de todos os engenheiros nos cinco anos subseqentes s formaturas. A predio do valor mdio de uma varivel em termos dos valores conhecidos de
outras variveis constitui o problema anlise de regresso.
Portanto, a regresso e a correlao so tcnicas estreitamente relacionadas que envolvem uma forma de
estimao. A regresso nos d uma equao matemtica, que descreve o relacionamento entre as variveis e
a correlao mede a fora, ou grau, de relacionamento entre duas variveis.
4.20
Ajustamento de Curvas
O ajustamento de curvas um processo pelo qual procura-se adequar uma curva que melhor se ajusta ao
conjunto de dados que lhe foram apresentados.
Inicialmente, estudaremos o ajuste linear: mtodo utilizado para definir dentre as retas dadas, a de melhor
ajuste, considerando um conjunto de dados. Este mtodo exige que a reta de melhor ajuste aos dados tenha
como resultado o menor valor para a soma dos quadrados das distncias verticais dos pontos dados reta.
A Regresso linear simples constitui uma tentativa de se estabelecer uma equao matemtica (modelo)
linear (linha reta) que descreva o relacionamento entre duas variveis.
O objetivo principal da Anlise de Regresso Linear Simples (objeto de estudo nesta disciplina) predizer
o valor de uma varivel (varivel dependente), dado que seja conhecido o valor de uma varivel associada
(varivel independente).
A equao de regresso uma expresso algbrica pela qual se prev o valor da varivel dependente.
Desta forma, a expresso anlise de regresso simples indica que a predio da varivel dependente feita
atravs de uma varivel independente, enquanto que a anlise de regresso mltipla diz respeito predio
da varivel dependente atravs de duas ou mais variveis independentes.
Para um melhor entendimento consideremos o seguinte exemplo.
ER 75. Considerando os dados o lado, qual das duas retas y = 5 ou y = 1 + x ,
a de melhor ajuste?
Soluo:
r : y =5
x
1
4
6
9
(yp yr )
2
(2 5) = 9
2
(6 5) = 1
(2 5)2 = 9
(10 5)2 = 25
10 2
p : y =1+x
x
1
4
6
9
(xp yr )2
(2 2)2 = 0
(6 5)2 = 1
(2 7)2 = 25
(10 10)2 = 0
Conclumos, observando o mtodo, que a reta de melhor ajuste para estes dados y = x + 1, pois,
comparando a soma dos quadrados das distncias obtivemos 26 < 44. Perceba na ilustrao grfica abaixo.
114
y
b
10
r
b
Considerando os mesmos dados anteriores, verifique se a reta 14x 17y + 15 = 0 de melhor ajuste que
as apresentadas.
Naturalmente uma questo levantada: a partir dos dados coletados e sabendo que a curva de melhor
ajuste uma reta (y = ax + b ), como determinar esta reta, ou melhor, como achar os coeficientes angular a e
o linear b ?
Na prxima seo desenvolveremos a teoria que poder responder essa pergunta.
4.21
n
X
yi
n
X
i =1
+ nb
xi
i =1
>
n
>
X
>
>
xi yi
:
n
X
i =1
xi2
+b
i =1
n
X
( 4.55)
xi
i =1
(yi y )2 =
10
13
15
20
28
0, 9
1, 7
1, 3
2, 0
1, 9
2, 7
115
x2
xy
4
10
0, 9
1, 7
16
100
3, 6
17
13
15
1, 3
2, 0
169
225
16, 9
30
20
28
1, 9
2, 7
400
784
38
75, 6
90
y = 0, 07x + 0, 73.
4.21.1
Processo Alternativo
Para se ganhar tempo na resoluo do sistema, obteve-se um processo alternativo para a determinao
dos valores dos coeficientes da equao de predio.
Sxy
Sxx
y ax
onde,
X
x =
xi
, Sxx =
X
i
xi2
!2
xi
e Sxx =
X
i
xi yi
xi
X
i
yi
.
Soluo:
Sxx = 1694
902
90 10, 5
23, 6
10, 5 0, 07 90
= 344; Sxy = 181, 1
= 23, 6; a =
= 0, 07 e b =
= 0, 73.
6
6
344
6
6
y = 0, 07(2) + 0, 73 = 0, 87.
ER 78. Considerando os dados abaixo (nmeros de anos que certos candidatos ao servio diplomtico
estudaram alemo no curso secundrio ou na faculdade e as notas por eles obtidas em um teste de proficincia
naquele idioma). Achar a equao de predio. Qual a nota no teste de proficincia do candidato que estudou
116
N de anos
Nota no teste
48
58
3
4
3
3
63
57
5
6
3
4
75
78
7
8
4
4
72
73
9
10
5
5
89
84
35
697
Candidato
N de anos
x
Nota no teste
y
x2
y2
xy
1
2
2
2
48
58
4
4
2.304
3.364
96
116
63
3.969
189
4
5
3
3
57
75
9
9
3.249
5.625
171
225
6
7
4
4
78
72
16
16
6.084
5.184
312
288
8
9
4
5
73
89
16
25
5.329
7.921
292
445
10
84
25
7.056
420
35
697
133
50.085
Candidato
35a + 10b
133a + 35b
Resolvendo essas duas equaes, obtm-se como resultados a = 10, 9 e b = 31, 55. Logo, a equao de
predio dada por:
117
4.21.2
Exerccio Proposto
EP 4.63. A tabela a seguir mostra o nmero de horas que um atleta correu em cada dia x durante 8 semanas
consecutivas e o seu tempo correspondente de corrida para uma milha y .
13
15
18
20
19
17
21
16
5, 2
5, 1
4, 9
4, 6
4, 7
4, 8
4, 6
4, 9
Responda:
(a) Qual a equao de predio que permite estabelecer a relao entre o nmero de horas corrida e o seu
tempo para uma milha?
(b) Utilize a equao obtida no item (a) para predizer o tempo de corrida de uma milha a partir de 14 horas de
corrida numa determinada semana.
4.22
Correlao
O coeficiente de correlao mede o grau de associao linear entre duas variveis aleatrias. um valor
adimensional, no dependendo, portanto, de nenhuma unidade de medida.
Podemos entender o termo correlao (co-relacionamento) como a indicao de at que ponto os valores
de uma varivel esto relacionados com os valores de outra varivel. Existem muitos casos em que pode existir
um relacionamento entre duas variveis. Por exemplo:
o esforo fsico e o risco de parada cardaca;
a escolaridade e a classe social;
o sucesso em um emprego pode ser predito com base no resultado de testes;
a temperatura e a quantidade de doenas de pele em uma determinada populao ou amostra.
4.22.1
O Coeficiente de Correlao
C OV (X , Y )
E (X Y ) E (X )E (Y )
=
(X ) (Y )
VAR (X ) VAR (Y )
( 4.56)
4.18 Teorema. O coeficiente de correlao entre duas variveis aleatrias est definido no intervalo [1; 1],
ou seja, 1 1.
4.19 Teorema. Se X e Y so variveis aleatrias independentes, ento o coeficiente de correlao zero.
A recproca deste teorema no verdadeira. Observe que, no exemplo anterior verificamos que, embora
X e Y no sejam variveis aleatrias independentes, a C OV (X , Y ) = 0. Conseqentemente, o coeficiente de
correlao tambm zero.
4.22.2
Interpretao Grfica
Peso Real (X )
Peso Aparente (Y )
18
10
2
3
30
42
23
33
4
5
62
73
60
93
96
98
120
159
X E (X )
Y E (Y )
(X E (X )) (Y E (Y ))
[X E (X )]2
[Y E (Y )]2
18
10
2.025
3.364
23
58
2.610
30
45
1.089
2.025
33
441
1.225
60
35
735
62
21
45
1.485
42
64
73
93
8
25
250
100
625
96
98
33
30
990
1.089
900
120
159
57
91
5.187
3.249
8.281
441
476
11.265
7.994
16.484
33
1
10
ESTATSTICA E PROBABILIDADE
119
441
476
11.265
= 63, E (Y ) =
= 68, C OV (X , Y ) =
= 1.609, 3, (X ) =
7
7
7
1.609, 3
7.994
16.484
33, 8, (Y ) =
48, 5 e
0, 98.
7
7
33, 8 48, 5
Portanto, temos que E (X ) =
EP 4.64. A tabela abaixo apresenta valores que mostram como o comprimento de uma barra de ao varia
conforme a temperatura:
Temperatura (X )
Comprimento (Y )
1
2
10
15
1, 003
1, 005
3
4
20
25
1, 010
1, 011
30
1, 014
Determine:
(a) O coeficiente de correlao;
(b) O valor estimado do comprimento da barra para a temperatura de 18 C ;
(c) O valor estimado do comprimento da barra para a temperatura de 35 C .
4.23
Erro Padro
O erro padro de uma estimativa, denotado por Se , significa determinar o intervalo de variao dos valores
calculados para a e b na equao de predio e tem por objetivo determinar o grau de certeza dos resultados
obtidos. O seu valor dado por:
X
i
Se =
(yi y )
n2
( 4.57)
Se =
Syy aSxy
.
n2
( 4.58)
ER 80. Com base nos dados do exerccio anterior, qual o erro-padro estimado?
Soluo:
X
Syy
X
ri
Se
4.24
yi2
!2
yi
Syy aSxy
=
n2
= 50.085
6972
= 1.504, 1
10
Os intervalos de confiana para os coeficientes de regresso a e b tem por objetivo determinar os intervalos
tb
tb
que contm os coeficientes a e b e so definidos atravs do valor mdio da dupla desigualdade
<t< ,
2
2
120
Se
b t 2 Se
a t 2
Sxx
1
x 2
+
n Sxx
( 4.59)
onde o grau de confiana igual a (1 )100% e o valor de t 2 encontrado na tabela da distribuio t -student
cruzando o valor de 2 (coluna) pelo valor de n 2 (linha) chamado de grau de liberdade.
ER 81. Baseados nos dados a seguir (tempo mdio semanais, em horas, que seis estudantes gastaram em
seus trabalhos para casa e os ndices de pontuao para os cursos que fizeram em determinado semestre),
construa os intervalos de 95% de confiana para a e b .
Horas gastas em
ndice de
deveres de casa X
pontuao Y
15
28
2, 0
2, 7
13
20
1, 3
1, 9
4
10
0, 9
1, 7
x = 90; y = 10, 5;
x 2 = 1.694; n = 6;
Da,
Sxx
Syy
Sxy
xy = 181, 1;
y 2 = 20, 29
902
= 344
6
10, 52
20, 29
= 1, 915
6
90 10, 5
= 23, 6
181, 1
6
1.694
10, 5 0, 686 90
= 8, 54 e n 2 = 4 (grau de liberdade). Ento, t 0, 025 = 2, 776. Portanto, os
6
limites de confiana para a e b so: b : 0, 06860, 0407 e a : 8, 540, 684
Logo, a, b =
Ou seja, o intervalo de 95% de confiana para b e a so: 0, 028 < b < 0, l 09 e 9, 224 < a < 7, 856.
Esses intervalos de confiana so bastante amplos, e isso se deve a dois fatores, ao tamanho da amostra
e variao medida por Se, ou seja, a variao entre os ndices de pontuao de estudantes sujeitos
mesma quantidade de trabalho para casa.
ESTATSTICA E PROBABILIDADE
121
4.25
Gabarito
N
4.1 4.2 43
4.6 (a) k =
M
5
10
12
1
0, 18
0, 30
0, 12
3
0, 12
0, 2
0, 08
105
21
; (b)
; (c) 3, 85.
176
176
z <0
0
(b)
X
P (x )
1
0, 6
2
0, 4
Z
P (z )
4.7 (a)
4
0, 1
5
0, 3
4.5
(b) No.
10
11
12
2
49
3
49
4
49
5
49
6
49
1
7
6
49
5
49
4
49
3
49
2
49
1
49
0z <1
1z <2
2z <3
3z <4
4z <5
5z <6
6z<7
7z <8
1
49
3
49
6
49
10
49
15
49
21
49
28
49
34
49
9 z < 10
10 z < 11
11 z < 12
z 12
39
49
43
49
46
49
48
49
49
49
3, 83 (b)
1
0, 3
1
49
8z <9
4.8 (a)
2
0, 3
Y
P (y )
2, 81
4.9
4.10 (a) FX (x )
8
<
8
<
(c)
18
49 ;
(d)
0
x3
3x
2
2
1
34
49 ;
(e) 8, 04;
x 0
x 1
19
.
320
4.11 (a) FX (x )
0
, x <0
2
1
1
1
1
x2
3x
4.12 (a) k =
(b) 4.13 (b) ; (c) E (X ) =
e VAR (X ) =
4.14 (a)
122
Referncias Bibliogrficas
[1] BUSSAB, WILTON O.& MORETTINI, PEDRO A.; Estatstica Bsica. 4a edio. So Paulo: Atual Editora,
2.001.
[2] MORETTIN, Pedro A.& Introduo Estatstica para Cincias Exatas. 1a edio. So Paulo: Atual
Editora, 1.981.
[3] FONSECA, J. S.& MARTINS, G. A.; Curso de Estatstica. 6a edio. So Paulo: Atlas, 1.998.
[4] HOEL, PORT STONE& Introduo Teoria da Probabilidade. 1a edio. Rio de Janeiro: Intercincia,
1.978.
[5] MEYER, Paul L.& Probabilidade, Aplicaes Estatstica. 2a edio. So Paulo: LTC, 1.969.
[6] SPIEGEL, M.& Probabilidade e Estatstica. 2a edio. So Paulo: McGraw-Hill, 1.978.
[7] MAGALHES, M. N.& LIMA, A. C. P.; Noes de Probabilidade e Estatstica. 3a edio. So Paulo:
IME/USP, 2.001.
[8] ROSS, S.& , 5a edio. Prentice Hall, 1.998.
[9] NEUFELD, J. L.& Estatstica Aplicada Administrao Usando Excel. 1a edio. So Paulo: Makron
Books, 2.003.
[10] SMAILES, J.& MAGRANE, A.; Estatstica Aplicada Administrao com Excel. 1a edio. So Paulo:
Atlas, 2.003.
[11] COSTA, Srgio Francisco& Introduo Ilustrada Estatstica. 1a edio. So Paulo: Harbra Ltda, 1.998.
[12] MORETTIN, Luiz Gonzaga& Estatstica Bsica: probabilidade. 7a edio. So Paulo: Makron Books,
1.999.
[13] KASMIER, L. J.& Estatstica Aplicada Economia e Administrao. 1a edio. So Paulo: Atlas, 1.982.
[14] SILVER, M.& Estatstica para Administrao. 1a edio. So Paulo: Atlas, 2.000.
[15] BRAULE, R.& Estatstica Aplicada com Excel para Cursos de Administrao e Economia. 1a edio.
So Paulo: Campus, 2.001.
[16] LIPSCHUTZ, Seymour& Probabilidade. 3a edio. So Paulo: McGraw-Hill, 1.972.
[17] KARMEL, P. H.& POLASEK, M.; Estatstica Geral e Aplicada para economistas. 2a edio. So Paulo:
Atlas, 1.974.
[18] HOEL, Paul G.& Estatstica Geral e Aplicada para economistas. 1a edio. So Paulo: Atlas, 1.977.
[19] BLACKWELL, David.& Estatstica Bsica. 1a edio. So Paulo: McGraw-Hill, 1.973.
ESTATSTICA E PROBABILIDADE
123
FTC-E A D
Faculdade de Tecnologia e Cincias Educao a Distncia
Democratizando a educao.
www.ead.ftc.br
www.ead.ftc.br