Sunteți pe pagina 1din 118

PROBABILIDADE

E ESTATSTICA

Prof Rosangela A. B. Assumpo

Toledo - 2015

PARTE I

Introduo Estatstica
A estatstica um processo que permite a anlise e a interpretao de dados
provenientes de uma ou mais amostras, com o objetivo de inferir caractersticas de
populaes. Sendo aplicvel a qualquer ramo do conhecimento onde se manipulam
dados experimentais.
1. O Crescimento e o Desenvolvimento da Estatstica Moderna
Historicamente, o crescimento e o desenvolvimento da estatstica moderna podem
ser relacionados a trs fenmenos isolados a necessidade do governo de coletar dados
sobre os cidades, o desenvolvimento da teoria da probabilidade e o advento da
informtica.
Dados tm sido coletados atravs de toda a histria. Nas civilizaes Egpcias,
Grega e Romana, dados primrios eram coletados com propsito de taxaes e
finalidades militares. Na idade Mdia, igrejas registram dados e informaes sobre
nascimentos, mortes e casamentos. Nos Estados Unidos, a Constituio de 1790
determinava a realizao de censo a cada 10 anos. Atualmente, informaes numricas
so necessrias para cidades e organizaes de qualquer natureza, e de qualquer parte
do globo.
2. Estatstica Descritiva versus Inferncia Estatstica
A estatstica pode ser dividida em duas partes:
2.1 - Estatstica Descritiva
Ocupa-se da organizao, sumarizao e descrio de um conjunto de dados.
Esta anlise serve como um primeiro guia ao pesquisador, fornecendo informaes
sobre a qualidade de seus dados e indicando algumas tendncias (se existirem) e, em
geral, no tem um fim em si prpria, exceto o caso do censo.
2.2 - Estatstica Inferencial
uma etapa da estatstica que cuida da coleta, reduo, anlise, modelagem e
interpretao dos dados.
O objetivo da estatstica inferencial (ou indutiva) o de tirar concluses com
base nos resultados observados em amostras extradas dessas populaes.
O prprio termo indutiva decorre da existncia de um processo de induo,
isto , um processo de raciocnio e que partindo-se do conhecimento de uma parte,
procura-se tirar concluses sobre a realidade no todo.
3. Pesquisa Estatstica
Pesquisa um conjunto de atividades orientadas para a busca de um
determinado conhecimento. Para merecer qualificativo de cientfica a pesquisa deve ser
feita de modo sistematizada, utilizando para isto mtodos prprios e tcnicas especfica.
A pesquisa cientfica se distingue de outras modalidades quaisquer de pesquisa pelo
mtodo, pela tcnica, por estar voltada para a realidade emprica e pela forma de
comunicar o conhecimento.

3.1 Finalidade da Pesquisa


Descobrir respostas para questes, mediante a aplicaes de mtodos cientficos;
2

Tentar conhecer e explicar fenmenos que ocorrem no mundo existente.


3.2 Tipos de Pesquisas
3.2.1 Pesquisa de Reconhecimento ou Survery
estudo de opinio, mercado e diagnstico
3.2.2 Pesquisa Bibliogrfica
Procura material j elaborado
3.2.3 Pesquisa documental
Coleta de informaes a partir de documentos quantitativos tais como
arquivos pblicos e privados, imprensa, revistas, etc.
3.2.4 Pesquisa Experimental
Experincias realizadas em laboratrios, fbricas, parcelas de terras.
utilizado o Delineamento de Experimento e Controle de Qualidade.

3.3 Etapas de uma Pesquisa Estatstica


Determinar
os Objetivos:
Para que?

populao

amostra

Tratamento
dos dados

inferncia
Cada uma essas passagens merece um estudo aprofundado e tem caractersticas
prprias.
3.3.1 - Populao
o conjunto de interesse final para a pesquisa. Em geral o conjunto do qual a
amostra retirada.
3.3.2 - Amostra
Chamaremos de amostra qualquer subconjunto da populao de interesse, quer
os dados tenham sido coletados de um estudo observacional, quer sejam provenientes de
um experimento realizado sob certas condies de controle.
3.3.3 - Tratamento dos Dados
Conjunto de tcnicas usadas para descrever os dados observados.
3.3.4 - Inferncia
Conjunto de mtodos que permitem inferir o comportamento de uma populao
a partir do conhecimento da amostra
3.3.5 - Clculo de Probabilidade
Teoria matemtica que deduz a partir de um modelo, as propriedades de um
fenmeno aleatrio.

Terminologia Estatstica
Populao

Amostra

Unidade experimental

4.1 - Unidade experimental ou de Anlise


o objeto ou indivduo que ser estudado na populao, e sobre os quais obtmse os dados.
4.2 - Dados
o valor ou resposta que toma a varivel em cada unidade experimental.
o resultado de uma observao.
a matria prima da estatstica.
4.3 - Varivel
uma caracterstica observvel, susceptvel de adotar distintos valores ou ser
expresso em vrias categorias.
Variveis:
Idades;
Sexo;
Srie;
Horas de estudo;
Horas de treino; etc...
4.4 Informao
o resultado dos dados processados (ou organizados) de acordo com certos
objetivos.
4.5 - Estatstica
qualquer funo dos dados empricos* que usada com fins descritivos ou
analticos.
uma medida resumo dos dados.
*Dados Empricos: baseado apenas na experincia, e no no estudo.
4.6 - Parmetros
So as caractersticas mais importantes da populao.
Comumente so desconhecidas.

Classificao Das Variveis

Quantitativa
s

Qualitativas

Nominais

Ordinais

Discretas

Contnua

5.1 - Variveis qualitativas


So caractersticas cujos dados no so numricos, isto , so apresentados como
uma qualidade ou atributo. Ex: Sexo, estado civil, nvel de escolaridade.
5.1.1 - Nominal
No existe nenhuma ordenao ou hierarquia nos possveis resultados. Ex: sexo,
estado civil, regio de procedncia.
5.1.2 - Ordinal
Existe uma certa ordem ou hierarquia nos possveis resultados. Ex: Nvel de
escolaridade, nvel de satisfao.
5.2 - Variveis Quantitativas
uma caracterstica em estudo cujos resultados se referem a quantidades, isto ,
so medidas numa escala numrica. Ex: idade, salrio, nmero de filhos, etc.
5.2.1 - Discretas
Cujos resultados se referem a dados que podem assumir valores inteiros (IN).
Ex: idade, nmero de pessoas, nmero de filhos por famlia, etc.
5.2.2 - Contnuas
So dados que podem assumir qualquer valor de um conjunto de nmeros reais
(IR). Ex: peso, altura, consumo mensal de energia, etc.

PARTE II

Tcnicas De Amostragem
POPULAO
Erro!

1. Amostra Aleatria
N o nmero de indivduos da populao (N conhecido ou desconhecido)
Os problemas de amostragem so:
1) Como coletar a amostra?
2) Quanto vale n?
3) Tcnica de amostragem a ser utilizada?
O elemento fundamental em Estatstica a estimativa. Isto , em uma
pesquisa muitas vezes h a necessidade de se fazer previses: Luis Incio Lula da Silva,
vai ganhar a eleio com uma margem de 2,5% de erro; a inflao do ms que vem deve
chegar aos 17%. Em quase todos os casos, a estimativa est associada a uma pesquisa
ou a uma verificao de caractersticas, que devido custos acessveis com resultados
satisfatrios, no realizada sobre todos os elementos da populao, mas sim sobre uma
parte dela, chamada de amostra. Assim, um dos objetivos da estatstica tirar
concluses sobre o todo (populao) a partir das informaes fornecidas por parte
representativa do todo (amostra). Assim, realizadas as fases de descrio dos dados.
(estatstica descritiva), feita uma anlise dos resultados, obtidos atravs dos mtodos
da Estatstica Inferencial ou Indutiva, que tem por base a induo, inferncia de dados
com induo da preciso, obtida por meio da teoria da probabilidade.
Quanto mais se conhecer sobre a populao, melhores sero as informaes
colhidas pela observao de uma amostra. Por exemplo, uma cozinheira para verificar
se o ensopado que ela est preparando tem ou no uma quantidade de sal desejada,
experimenta apenas uma colher de ensopado, pois se sabe que a distribuio do sal em
todo o ensopado homognea, e de qualquer lugar que se tivesse retirado a amostra do
ensopado, ela seria representativa. Mas nem sempre a escolha de uma amostra
representativa imediata. A maneira de se escolher os elementos para compor uma
amostra denominada Amostragem.

Como as concluses relativas populao vo estar baseadas nos resultados


obtidos nas amostras dessa populao, vemos o quo importante a fase de coleta dos
dados (amostragem), pois se erros forem cometidos no momento de selecionarmos os
elementos da amostra o trabalho fica comprometido e os resultados finais sero
provavelmente incorretos. Devemos, portanto, tomar cuidados especiais quanto aos
critrios que sero utilizados na seleo da amostra.
O que necessrio garantir, em suma que a amostra seja representativa
da populao. Isto significa que, a menos de certas discrepncias inerentes
aleatoriedade sempre presente, em maior ou menor grau, no processo de amostragem, a
amostra deve possuir as mesmas caractersticas bsicas da populao no que diz respeito
(s) varivel(eis) que desejamos pesquisar.

2. Vantagens De Um Levantamento Por Amostragem


1)
2)
3)
4)

Menor custo;
Menor tempo;
Maior amplitude do universo;
Menor erro da medida.

3. Tipo De Amostragem Probabilstica


3.1 - Amostragem simples aleatria (m.s.a.)
a amostragem em que se pressupe que todo o elemento da populao tem a
mesma probabilidade de ser includo na amostra extrada. Uma das formas pelas quais
se pode executar este tipo de amostragem atribuindo a cada elemento da populao um
nmero distinto e efetuando sucessivos sorteios ate completar o tamanho da amostra.
Esta seleo dos elementos ainda pode ser feita atravs de tabelas de nmeros
aleatrios, programas computacionais ou de calculadoras cientficas que possuam a
funo RANDOM (ALEATORIZAO).
RESUMO:
equivalente a um sorteio de loteria;
Considera a populao homognea;
Cada elemento da populao (umidade experimental), tem a mesma
oportunidade de ser escolhida;
Utilizam-se nmeros aleatrios, programas, computacionais, calculadoras,
bolinhas numeradas, etc.
MTODOS DE ESCOLHA
1) Enumeramos a populao 1, 2, ...., N;
2) Determinamos o tamanho da amostra N;
3) Escolhemos a amostra.
ELEMENTO ESCOLHIDO = N * (Ran) + 1
UTILIZANDO A CALCULADORA

Exerccio:
N = 20 alunos de uma turma da FAG
n = 7 alunos escolhidos aleatoriamente (amostra)
1 2 3 4 5 6 7 Amostra 1

Amostra 2

3.2 - Amostragem Estratificada


Muitas vezes a populao se divide, em sub-populaes ou estratos, sendo
razovel supor que, de estrato para estrato, a varivel de interesse apresente um
comportamento substancialmente diverso, tendo, entretanto, comportamento
razoavelmente homogneo dentro de cada estrato. Em tais casos, se o sorteio dos
elementos da amostra for realizado sem se levar em considerao a existncia dos
estratos, pode acontecer que os diversos estratos no sejam convenientemente
representados na amostra, a qual seria mais influenciada pelas caractersticas da varivel
nos estratos mais favorecidos pelo sorteio. Evidentemente a tendncia ocorrncia de
tal fato ser tanto maior quanto menor o tamanho da amostra. Para evitar isso, pode-se
adotar uma amostragem estratificada.
A amostragem estratificada consiste em especificar quantos elementos da
amostra sero retirados em cada estrato. costume considerar trs tipos de amostragem
estratificada: uniforme, proporcional e tima. Na amostragem estratificada uniforme:
sorteia-se igualmente o nmero de elementos em cada estrato. Na proporcional o
nmero de elementos sorteados em cada estrato proporcional ao nmero de elementos
existentes no estrato. Evidentemente a amostragem estratificada uniforme ser em geral,
recomendvel se os estratos da populao forem pelo menos aproximadamente do
mesmo tamanho, caso contrario, ser em geral prefervel a estratificao proporcional
por fornecer uma amostra mais representativa da populao. A Amostragem
estratificada tima por sua vez toma em cada estrato, um nmero de elementos
proporcional ao nmero de elementos do estrato e tambm a variao da varivel de
interesse no estrato, medida pelo seu desvio padro. Pretende-se assim otimizar a
obteno de informaes sobre a populao, com base no principio de que, onde a
variao menor, menos elementos so necessrios para bem caracterizar o
comportamento da varivel. Dessa forma, com um menor nmero total de elementos na
amostra, conseguir-se-ia uma quantidade de informao equivalente a obtidos nos
demais casos. As principais dificuldades para a utilizao desse tipo de amostragem
residem nas complicaes tericas relacionadas com a anlise dos dados e em que,

muitas vezes no podemos avaliar de antemo o desvio padro da varivel nos diversos
estratos.
RESUMO:
utilizada quando existir diferenas (populao heterognea) entre diversas partes
da populao.
Essas diferenas denominaro os estratos.
MTODOS DE ESCOLHA
1) Determinamos o tamanho da populao N;
2) Definimos:
We = Ne
N
Onde:
N o tamanho da populao;
Ne tamanho do estrato;
We a proporo de cada estrato.
Para e = 1, 2, .. e
ne = n*We

Tal que Ne = N
E =1

Onde:
n o tamanho da amostra;
ne tamanho da amostra por estrato;
We a proporo da populao por estrato.
Exemplo:
SOLTEIROS
50
OUTROS
40

N = 300 pessoas
n = 60 pessoas amostra total

CASADOS
210

N1 = 50 solteiros;
N2 = 210 casados;
N3 = 40 outros
N = 300

W1 = N1 = 50
N 300

proporo de solteiros

W2 = N2 = 210

proporo de casados

300

W3 = N3 = 40
proporo de outros
N
300
Logo a amostra por estrato ser:
n1 = nW1 = 60 (50/300)

= 10

n2 = nW2 = 60 (210/300)

= 42

n3 = nW3 = 60 (40/300)

= 8
n = 60 total

10
Solteiros
escolhidos por
m.s.a.
8 Outros
escolhido
por m .s.a.
42 casados
escolhidos
por m.s.a.

Solteiros (10)
Elementos = 50 (Ram) +1 =
Escolhido =
Casados (42)
Elementos = 210 (Ram) +1 =
Escolhido =
Outros (8)
Elementos = 40 (Ram) +1 =
Escolhido =
3.3 - Amostragem sistemtica
Quando os elementos da populao se apresentam ordenados e a retirada dos
elementos da amostra feita periodicamente, temos uma amostragem sistemtica.
Assim por exemplo em uma linha de produo, podemos a cada dez itens produzidos,
retirar um para pertencer a uma amostra da produo diria.
A principal vantagem da amostragem sistemtica est na grande facilidade na
determinao dos elementos da amostra. O perigo em adot-la est na possibilidade da
existncia de ciclos de variao da varivel de interesse, especialmente se o perodo
desses ciclos coincidir com o perodo de retirada dos elementos da amostra.

10

Por outro lado, se a ordem dos elementos na populao no tiver qualquer


relacionamento com a varivel de interesse, ento a amostragem sistemtica ter efeitos
equivalentes a casual simples, podendo ser utilizada sem restries.
RESUMO:
utilizada quando a populao encontra-se cadastrado ou enumerado.
Vantagens: Fcil escolha da amostra;
Mais preciso que o m.s.a;
to preciso quanto amostragem estratificado.
MTODO DE ESCOLHA DA AMOSTRA
1) Define-se o tamanho da populao e o tamanho da amostra
N
tamanho da populao
n
tamanho da amostra
2) Determina-se a proporo entre populao e amostra:
K=N
n
3) Escolhe-se um nmero aleatoriamente menor ou igual a K, suponhamos a > 0.
Logo a amostra sistemtica ser:
a, a+k, a+2k, ....., a+(n-1)k
Exemplo:
Suponhamos que desejamos estudar o estado de conservao da rodovia
BR277 com 190 Km.
Para o qual estudaremos uma amostra aleatria de 30 Km (isto n = 30).

0km
1km
Cascavel

190km
Foz

N = 190
n = 30 (foi determinado)
R = 190 = 6,33 6
30
a=4

escolhido aleatoriamente

As amostras so: a, a+2k


4, 10, 16, 22, 28, 34, 40 46, 52, 58, 64, 70, 76, 82,......,178
3.4 - Amostragem por Conglomerados

Quando a populao apresenta uma subdiviso em pequenos grupos,


chamado de conglomerados possvel e muitas vezes conveniente fazer11

se a amostragem por meio de conglomerado, a qual consiste em sortear um


nmero suficiente de conglomerados, cujos elementos constituiro a
amostra. Ou seja, as unidades de amostragem, sobre as quais feito o
sorteio, passam a ser os conglomerados e no mais os elementos
individuais da populao. Esse tipo de amostragem s vezes adotado por
motivos de ordem prtica e econmica.
RESUMO:
utilizada quando a populao pode ser dividida em pequenos grupos, chamados de
conglomerados.
Fcil escolha da amostra;

4. Tipo De Amostragem No - Probabilstica


4.1 - Amostragem Intencional
uma amostragem no probabilstica e consiste em selecionar um subgrupo de
populao que, com base nas informaes disponveis, possa ser considerado
representativo, de toda a populao. A principal vantagem da amostragem intencional
esta nos baixos custos de sua seleo. A amostragem intencional no considerada um
bom mtodo, pois os dados podem ser facilmente manipulados, direcionados aos
interesses do pesquisador ou de quem encomendou a pesquisa.
4.6 - Amostragem a Esmo
a amostragem em que o amostrador, para simplificar o processo, procura ser
aleatrio sem, no entanto realizar propriamente o sorteio usando algum dispositivo
aleatrio confivel. Por exemplo, se desejarmos retirar uma amostra de 100 parafusos de
uma caixa contendo 1000 evidentemente no faremos uma amostragem casual simples,
pois seria extremamente trabalhosa, mas procederemos a retirada simplesmente a esmo.
Os resultados da amostragem a esmo so em geral equivalentes aos de uma
amostragem probabilstica se a populao homognea e se no existe a possibilidade
de o amostrador ser inconscientemente influenciado por alguma caracterstica dos
elementos da populao.

12

EXERCCIOS
1. Os associados de uma cooperativa esto organizados em um arquivo, por ordem
alfabtica. Qual a maneira mais rpida de amostra 1/3 do total de fichas de
associados?
2. Um pesquisador tem dez gaiolas que contm, cada uma, seis ratos. Como o
pesquisador pode selecionar dez ratos para uma amostra?
3. Para levantar dados sobre o nmero de filhos por casal, em uma comunidade, um
pesquisador organizou um questionrio que enviou, pelo correio, a todas as
residncias. A resposta ao questionrio era facultativa, pois o pesquisador no tinha
condies de exigir a resposta. Nesse questionrio perguntava-se o nmero de filhos
por casal morador na residncia. Voc acha que os dados assim obtidos tm algum tipo
de tendenciosidade? Justifique.
4. Um pesquisador pretende levantar dados sobre o nmero de moradores por
domiclio, usando a tcnica de amostragem simples sistemtica. Para isso, o
pesquisador visitar cada domiclio selecionado. Se nenhuma pessoa estiver presente
na ocasio da visita, o pesquisador exclura o domiclio da amostra. Esta ltima
determinao introduz tendenciosidade. Por qu?
5. Dada uma populao de 40 alunos, descreva uma forma de obter uma amostra
casual simples de 6 alunos.
6. Organize uma lista com 10 nomes de pessoas em ordem alfabtica. Depois
descreva uma forma de obter uma amostra sistemtica de 5 indivduos.
7. Em uma pesquisa de mercado para servios odontolgicos tomou-se a lista
telefnica, onde os nomes dos assinantes esto organizados em ordem alfabtica do
ltimo sobrenome, e se amostrou o dcimo de cada 10 assinantes. Critique esse
procedimento.
8. Por que os estatsticos estudam amostra e no populaes?
9. Como podemos dizer que uma determinada amostra representa adequadamente a
populao?
10. Para as questes a seguir imagine um experimento em que se dividam os elementos
em dois grupos: Um grupo experimental e um grupo de controle.
a) Por que os grupos devem ser to semelhante quanto possvel?
b) As pessoas devem saber em que grupo esto?
c) Qual o melhor sistema de dividir os indivduos pelos dois grupos
11. Diferencie Estatstica Descritiva de Estatstica Inferencial.
12. Defina e diferencie com suas palavras Variveis Quantitativas de Variveis
Qualitativas com suas respectivas subdivises.

13

13. Fale sobre as etapas de uma pesquisa.


14. Fale sobre os tipos de amostragem Probabilstica, suas caractersticas, suas
aplicaes e restries. Cite exemplos de seu cotidiano para cada caso.
15. Fale amostragem no Probabilstica, suas caractersticas, suas aplicaes e
restries. Cite exemplos.

14

PARTE III

Anlise Exploratria Dos Dados ou


Estatstica Descritiva
1. Introduo
A Estatstica Descritiva a fase na qual os dados de um experimento ou
pesquisa, so organizados, resumidos, descritos, apresentados e interpretados. Esta fase
de grande importncia para uma pesquisa, pois nela, podemos perceber as tendncias
do nosso conjunto de dados.
Aps a coleta dos dados experimentais, devemos organiz-los e apresent-los; esta
apresentao, pode ser feita atravs de tabelas e grficos.

2. Tabelas de distribuio de freqncias


As apresentaes atravs de tabelas devero ser realizadas em uma pesquisa,
mediante alguma conveno ou norma, dependendo de qual instituio, congresso ou
rgo, esta tabela ser apresentada. Mas alguns princpios bsicos podem ser utilizados,
segundo as normas do IBGE (Instituto Brasileiro de Geografia e Estatstica):
- Ttulo: aonde dada uma noo inicial ao leitor sobre o que a tabela;
- Cabealho: para que sejam identificados os contedos referentes a cada coluna da
tabela. O cabealho deve conter o suficiente para responder as questes: o que est
sendo representado? onde ocorreu ? Quando ocorreu?
- Coluna Indicadora: que especifica as diferentes categorias da varivel;
- Corpo: representado por colunas e subcolunas dos quais so registrados os dados
numricos e informaes.
- Rodap ou p: onde identificada a fonte original dos dados, ou alguma nota
referente a tabela.

Exemplo:
Tabela 01: Casos registrados de intoxicao humana segundo a causa
determinante. Brasil, 1993
Causa
Freqncia
Acidente
29.601
Abuso
2.604
Suicdio
7.965
Profissional
3.735
Outras
1.959
Ignorada
1.103
Fonte: Mensrio Estatstico 259/260

Observao: No h linhas laterais, ponto final em cada linha e linhas horizontais no


corpo da tabela separando as linhas.

15

2.1 - Tabela de distribuio de freqncias


Uma tabela de distribuio de freqncias composta, alm dos itens citados acima:
-

Freqncia absoluta ( fi ): o nmero de vezes em que cada elemento aparece na


amostra ou populao. Na tabela acima, esta freqncia absoluta est sendo expressa
pela empresas fiscalizadas.

Freqncia Absoluta Acumulada (Fi): a soma das freqncias dos dados


anteriores.

Freqncia Relativa (hi): a razo entre o valor de cada freqncia e o nmero


f
total de dados existentes na observao. Ou seja: hi = i
n

Freqncia Relativa Acumulada (Hi): a soma das freqncias relativas dos


dados anteriores.

As tabelas de distribuio de freqncias so vlidas para variveis quantitativas e


qualitativas. Mas quando h um nmero grande de dados para a distribuio de
freqncias, ou quando a varivel de interesse quantitativa contnua, convm
utilizarmos intervalos (ou classes); estes intervalos podem ser de igual tamanho, ou de
tamanho diferentes. Ou ainda, os intervalos podem ser abertos ou fechados.
Segundo Bussab e Morettin, a escolha dos intervalos depender da familiaridade do
pesquisador com os dados. Mas, vale assinalar que, com um pequeno nmero de
intervalos pode-se perder informaes, e com um grande nmero de intervalos pode-se
prejudicar o resumo dos dados.
Entretanto, segundo Fonseca, h duas aparentes solues para a definio do nmero de
intervalos:
a) Se o nmero de elementos (n) for menor que 25 ento o nmero de classes (k)
igual a 5; se n for maior que 25, ento o nmero de classes aproximadamente a
raiz quadrada positiva de n. Ou seja:
Para n 25, k = 5
Para n > 25, K = n
b) Frmula de Sturges: k 1 + 3,33 log n.
- Amplitude total ou range (R ): a diferena entre o maior e o menor valor
observados no conjunto de dados.
- Amplitude dos intervalos ou das classes (h): o maior inteiro da diviso da
amplitude total (R) pelo nmero de intervalos (k).
R
Ou seja: h
k

16

2.1 Tabela de distribuio de freqncias bidimensional


Muitas vezes, estamos interessados em analisar o comportamento conjunto de
duas ou mais variveis. Assim, vamos estudar como organizamos e resumimos os dados
para uma distribuio conjunta de duas variveis em forma de tabelas. Essas tabelas
podem apresentar freqncias relativas as quais servem para apresentar estimativas de
riscos, ou seja, do estimativas das probabilidades de dano.
O exemplo mostrado abaixo apresenta o nmero de nascidos vivos registrados,
classificados segundo dois fatores: o ano de registro e o sexo.
Tabela 02: Nascidos vivos registrados segundo o ano de registro e o sexo.
Ano de registro
sexo
Total
Masculino
Feminino
1984
1.307.758
1.251.280
2.559.038
1985
1.339.059
1.280.545
2.619.604
1986

1.418.050

1.361.203

2.779.253

Fonte: IBGE (1988)


Nota: Nascimentos ocorridos no ano de registro

ATIVIDADE DESENVOLVIDA EM SALA DE AULA


1. Os dados a seguir determinam a produo de peas em determinada fbrica.
67
65
68
67
67
64
69
66
66
66
68

71

67

67

70

65

65

66

70

64

67

68

66

68

64

65

67

66

69

68

65

69

68

67

68

67

67

67

66

66

Organize os dados e construa uma tabela de distribuio de freqncia e o histograma


da produo.
2. Os dados a seguir representam a idade 50 funcionrios selecionados
aleatoriamente da populao de uma agroindstria X.
Tabela 02-Idades de 50 funcionrios(colocados em ordem crescente)
18
20
20
21
22
24
25
25
26
27
29

29

30

30

31

31

32

33

34

35

36

36

37

37

37

37

38

38

38

40

41

43

44

44

45

45

45

46

47

48

49

50

51

53

54

54

56

58

62

65

Organize os dados e construa uma tabela de distribuio de freqncia e o histograma


da produo.

17

2.2 Representao Grfica para Variveis Qualitativas e Quantitativas


A apresentao dos dados atravs de grficos, nos fornece uma excelente idia dos
resultados obtidos e de como se relacionam os dados. Todo grfico ou diagrama deve
ser auto-explicativo e de fcil compreenso, devem ter trs requisitos bsicos:
simplicidade, clareza e veracidade. Mas algumas sugestes devem ser seguidas na sua
construo:
- O tamanho do grfico deve ser adequado sua publicao;
- Todo grfico dever ter sempre um ttulo e uma escala, sendo que, esta escala deve
ser adequada para que no desfigure os fatos.
2.2.1

Representao grfica de variveis qualitativas

Para a representao grfica de variveis qualitativas, os tipos de grficos mais


usados so: grficos de ordenadas, grfico em barras, grfico em colunas, pictograma,
dot plot, grfico de setores.

Grfico de Ordenadas
Para a sua construo traada uma reta horizontal (ou vertical) que servir de base;
a partir de pontos com a mesma distncia nesta reta, constroem-se traos
perpendiculares, cujo comprimento seja proporcional a frequncia.

Grfico em Barras
O grfico em barras a representao em que sobre o eixo vertical constroem-se
retngulos para as diferentes categorias da nossa varivel, com largura apropriada e
altura proporcional as respectivas freqncias de cada categoria. As barras no so
justapostas ou ligadas, pois na maioria das vezes as categorias das variveis qualitativas
no apresentam relao de continuidade.

Grfico em Colunas
A construo do grfico em colunas semelhante ao em barras, com uma nica
diferena, os retngulos sero sustentados no eixo horizontal.

Grfico de Setores Circulares


Geralmente este grfico usado para evidenciar a distribuio percentual de uma
populao ou amostra. Para a construo deste tipo de grfico, divide-se a rea total de
um crculo em subreas (setores) proporcionais s respectivas freqncias absoluta ou
relativa.

Pictograma
O grfico pictograma semelhante ao grfico em colunas, com a diferena que no
lugar de retngulos sero figuras que representaram as distribuies de freqncia.
Dot Plot
o grfico onde, no eixo horizontal marca-se com espaamentos iguais cada
categorias da varivel e verticalmente a estas, desenha-se pontos, sendo que, a
quantidade de pontos em cada categoria igual ao valor da freqncia absoluta desta.
Este grfico no usual e recomendado apenas, quando as freqncias so pequenas.

18

2.2.2

Representao grfica de variveis quantitativas

Alguns tipos de grficos que construmos anteriormente: grfico em colunas, em


barras, dot plot, de setores circulares tambm so usados para representar a distribuio
de variveis quantitativas.

Histograma
Este um grfico usado para apresentar dados organizados em intervalos, utilizado
principalmente para representar a distribuio de variveis contnuas.
-

Histograma para classes com amplitudes iguais


Para a sua construo, trace o sistema de eixo cartesiano; marque os extremos das
classes no eixo horizontal (das abscissas); no eixo vertical (das ordenadas) marque as
freqncias absolutas ou freqncias relativas; e para cada classe, trace um retngulo
com base igual ao intervalo de classe e altura igual a freqncia.
-

Histograma para classes com amplitude diferentes


Para a sua construo, calcule a densidade de freqncia absoluta ou relativa.
di =

fi
h

ou

di =

hi
h

Trace um sistema de eixo cartesianos; marque os extremos de classes no eixo


horizontal; no eixo vertical marque a densidade e para cada classe, trace um retngulo
com base igual ao intervalo da classe e altura igual a densidade de freqncia.

Polgono de freqncias
a representao grfica de uma distribuio de freqncias por meio de um
polgono.
Para a sua construo, trace o sistema de eixo cartesianos; marque os pontos
mdios de cada classe no eixo horizontal (ponto mdio de um intervalo a soma dos
extremos do intervalo dividido por dois); no eixo vertical coloque as freqncias; faa
pontos na interseco do ponto mdio de cada intervalo com sua respectiva freqncia;
una todos estes pontos por segmentos de reta.
Ogiva
o grfico que representa a distribuio da freqncia absoluta acumulada. Sua
construo semelhante ao do polgono de freqncias, com a diferena que
consideraremos a freqncia absoluta acumulada.

EXERCCIOS
1.

A WW Indstria e Comrcio, desejando melhorar o nvel de sues funcionrios


em cargos de chefia, montou um curso experimental e indicou 25 funcionrios
para a primeira turma. Os dados referentes seo a que pertencem, sexo, idade,
notas e graus obtidos no curso esto na tabela a seguir:
19

Tabela 01 Informaes sobre a seo, sexo, idade e aproveitamento dos funcionrios


da indstria PW, nas disciplinas oferecidas durante o curso experimental.
Funcio seo sexo idad Adminis direit reda estats ingl metod poltic econo
nrio
e
trao
o
o
tica
s
ologia
a
mia
1
P
M
25
8
9
8,0
9
A
A
9,0
8,5
2
P
M
45
8
9
7,5
9
A
B
8,5
8,0
3
P
M
43
8
9
9,5
9
A
A
9,5
8,5
4
P
M
32
6
9
5,0
6
B
B
7,0
7,0
5
P
F
30
9
9
10,0
10
A
B
7,5
8,0
6
P
F
29
9
9
10,0
10
A
B
9,0
9,5
7
P
F
40
9
9
10,0
9
B
A
9,5
7,5
8
T
F
35
10
9
10,0
9
A
A
1,0
9,5
9
T
M
20
6
9
7,0
8
C
C
6,0
6,0
10
T
M
23
6
9
7,5
5
D
C
4,0
5,0
11
T
F
21
6
9
6,5
9
C
C
5,0
5,0
12
T
F
25
9
9
10,0
10
A
A
9,5
9,5
13
T
F
39
10
9
9,5
10
A
A
9,5
9,5
14
T
M
37
7
9
8,0
7
B
B
9,0
8,0
15
V
M
40
7
9
8,0
7
B
A
9,0
8,5
16
V
M
27
7
9
8,0
7
A
A
8,5
9,5
17
V
F
35
8
9
8,5
8
B
A
9,5
9,5
18
V
F
34
8
9
8,5
8
B
B
7,0
7,5
19
V
F
37
8
9
7,0
8
A
B
8,0
8,0
20
V
M
29
10
9
10,0
9
A
A
9,5
8,5
21
V
M
30
10
9
10,0
10
A
A
9,5
9,5
22
V
M
42
8
9
9,5
8
A
A
8,5
8,0
23
V
F
24
6
9
6,0
5
D
C
5,0
5,0
24
V
F
26
9
9
9,0
9
A
A
9,5
9,5
25
V
M
32
6
9
5,0
5
D
C
5,0
5,0
Observaes:
Seo: P= Seo Pessoal, T= Seo Tcnica e V= Seo de Vendas.
Sexo: M= Masculina, F= Feminino.
Como havia dvidas quanto adoo de um nico critrio de avaliao, cada professor
adotou seu prprio sistema de aferio. Usando os dados da tabela, responda as
questes:
a) Aps observar atentamente cada varivel, e com intuito de resumi-las, como que
voc identificaria (qualitativa ordinal ou nominal e quantitativa discreta ou contnua)
cada uma das 11 variveis listadas?
b) Compare e indique as diferenas existentes entre as distribuies das variveis
Direito, Poltica e Estatsticas.
c) Construa o histograma para as notas da varivel Redao. Interprete os resultados.
d) Construa a distribuio, de freqncia da varivel Metodologia e faa um grfico
(poder ser de setor, barras, colunas de sua preferncia) para indicar essa
distribuio. Interprete os resultados.
e) Construir a distribuio de freqncia conjunta para as variveis Sexo e Idade.
Interprete os resultados.

20

PARTE IV

Medidas de Posio
1. Introduo
Atravs de tabelas e grficos construdos anteriormente, vimos como resumir e
apresentar um conjunto de dados. Contudo, podemos resumir ainda mais este conjunto,
apresentando um ou alguns valores que representam todo o conjunto. Esses valores
so chamados de medidas de posio.
2. Medidas de Tendncia Central
So valores estabelecidos num ponto central em torno do qual os dados se
distribuem. As medidas de tendncia central que iremos estudar so: mdia aritmtica,
mediana e moda.
2.1 - Mdia Aritmtica
a soma de todos os elementos em nosso conjunto de dados dividido pelo total
de elementos. Isto ,
n

x
x=

i =1

n
Onde n o total de elementos no conjunto de dados.
A mdia aritmtica um valor que pode substituir todos os valores da varivel, isto
, o valor que a varivel teria se em vez de varivel ela fosse constante.
2.1.1

Propriedades da Mdia Aritmtica


A soma algbrica dos desvios de um conjunto de valores em relao ao
mdia aritmtica zero;
A soma algbrica dos quadrados dos desvios de um conjunto de valores em
relao a mdia aritmtica mnima;
Somando ou subtraindo uma constante a todos os valores de uma varivel,
a mdia ficar acrescida ou subtrada a essa constante;
Multiplicando ou dividindo todos os valores de uma varivel por uma
constante, a mdia ficar multiplicada ou dividida por essa constante.

2.1.2

Vantagens do emprego da mdia


Como faz uso de todos os dados para seu clculo, pode ser determinada
com preciso matemtica;
Pode ser determinada quando somente o valor total e o nmero de
elementos forem conhecidos.

2.1.3

Desvantagens do emprego da mdia aritmtica


No pode ser empregada para dados qualitativos;
influenciada por valores extremos, podendo, em alguns casos, no
representar a srie.

21

2.2 - Mediana (Md)


o valor que ocupa a posio central de um conjunto de dados ordenados. Ou
seja, o valor que tiver o mesmo nmero de elementos no seu lado esquerdo e direito.
Sejam os nmeros a seguir, as cinco observaes de uma varivel qualquer:
5 6 7 8 8
A mediana para este conjunto 7, correspondente 3a observao que ocupa a
posio central.
Assim, se o nmero de elementos for mpar, a mediana o elemento cuja ordem
da posio central :
Md ( x) = x n +1

Onde n o nmero de elementos no conjunto de dados.


Sejam as seguintes observaes: 5,0 5,5 7,0 8,0 8,5 10,0
Como o nmero de elementos par, a mediana a mdia aritmtica dos dois elementos
centrais, cuja ordem:

x n + x n + 2
Md ( x) =

Neste exemplo: X1 = 6/2 = 3 (3O termo) e X2 = (6+2)/2 = 4 (4O termo), logo a mediana
:
Md =

7+8
= 7,5
2

Observe que este um valor terico, pois no figura entre os dados originais.
2.2.1 Vantagens do emprego da mediana
A mediana no influenciada por valores extremos.
2.2.2 Desvantagens do emprego da mediana
A mediana uma medida que exige uma ordenao de categorias, da mais
alta a mais baixa, assim ela s pode ser obtida para variveis qualitativas
ordinais ou para as quantitativas, jamais para variveis qualitativas
nominais;
No inclui todos os valores da distribuio;

2.3 - Moda (Mo)


o valor que ocorre com maior freqncia em um conjunto de dados.
Exemplo: Conjunto de dados: 7 8 5 7 7 7 5 8 9 7
Moda = Mo = 7

22

Em um conjunto de dados podemos ter duas modas ou nenhuma; a distribuio


que possui duas modas chamamos de distribuio bimodal e mais de duas modas,
multimodais. Existem ainda distribuies que no apresentam nenhuma moda: so
chamadas de amodais.
2.3.1 Vantagens do emprego da moda
A moda uma medida que requer apenas o conhecimento da freqncia
absoluta e pode ser utilizada para qualquer tipo de variveis, tanto
qualitativas, quanto quantitativas;
de uso prtico. Exemplificando: os empregadores geralmente adotam a
referncia modal de salrio. Tambm carros e roupas so produzidos
tomando como referncia o tamanho modal
2.3.2 Desvantagens do emprego da moda
No inclui todos os valores da distribuio;
Mostra-se ineficiente quando a distribuio amplamente dispersa.

3. Outras Medidas de Posio, as SEPARATRIZ


3.1 - Quartis (Q1 e Q3)
So medidas de posio que dividem um conjunto de dados ordenados em
quatro partes iguais.

Mn.

Q1

Md

Q3

Mx.

Onde:
- O 1O Quartil (Q1) significa que 25% dos dados so inferiores a Q1, ou que 75% dos
dados so superiores a Q1.
- O 3O Quartil (Q3) significa que 75% dos dados so inferiores a Q3, ou que 25% dos
dados so superiores a Q3.
Em geral Q1 < Me < Q3.

Q1 =

X n +1 + 0.75 X n +1 X n +1
+1

4
4
4

Q3 =

X ( n +1) + 0.25 X ( n +1) X ( n +1)


3. 4 +1
3.

3.

4
4

23

3.2 - Box plot ou desenho esquemtico


um tipo de representao grfica, em que se realam algumas caractersticas
da amostra, fornecendo uma idia da posio central, disperso, assimetria, cauda e
dados discrepantes. O conjunto dos valores da amostra compreendidos entre o 1 e o 3
QUARTIS, que vamos representar por Q1 e Q3 representado por um retngulo (caixa)
com a MEDIANA indicada por uma barra vertical. A largura do retngulo no d
qualquer informao. Consideram-se seguidamente duas linhas que unem os meios dos
lados do retngulo com os extremos da amostra. Para obter esta representao, comea
por se recolher da amostra, informaes sobre 5 nmeros, que so: os 2 extremos
(mnimo e mximo), a mediana e o 1 e 3 quartis. A posio central dos valores dada
pela mediana e a disperso
d = Q3 - Q1. As posies relativas Q1, Me e Q3 do
uma noo da simetria da distribuio. Os comprimentos das caudas so dados pelas
linhas que vo do retngulo aos valores mais afastados que no sejam outliers e pelos
prprios outliers. A representao do diagrama de extremos e quartis tem o seguinte
aspecto:

Existem fundamentalmente 3 caractersticas, que nos do idia da simetria ou


enviesamento e da sua maior ou menor concentrao: distncia entre a linha indicadora
da mediana e os lados do retngulo; comprimento das linhas que saem dos lados dos
retngulos e o comprimento da caixa. Apresentamos a seguir 3 exemplos de boxplot,
correspondentes a tipos diferentes de distribuio de dados.

3.2 Decis: So medidas de posio que dividem um conjunto de dados


ordenados em dez partes iguais.

3.3 Percentis: So medidas de posio que dividem um conjunto de dados


ordenados em cem partes iguais.
Ex: O P92 (92o percentil) indica que h 92% de dados inferiores.
Calcule:

*n
100
24

** L: posio do percentil desejado no conjunto de dados ordenado;


** k: percentil desejado;
** n: nmero de valores.
L um nmero inteiro?
Se Sim
O k-zimo percentil est a meio caminho do L-zimo valor.

Se No
Modificar L, arredondando seus valores para o inteiro mais prximo.

25

PARTE IV

Medidas de Disperso ou Medidas de Variabilidade


1. Introduo
As informaes fornecidas pelas medidas de posio necessitam em geral ser
complementada pelas medidas de disperso. Estas servem para indicar o quanto os
dados se apresentam dispersos em torno da regio central. Caracterizam, portanto, o
grau de variao ou oscilaes existente no conjunto de valores.
Exemplo:
Seja os quatro conjuntos abaixo, as notas de quatro turmas:
Turma A: 4 4 5 6 6
Turma B: 5 5 5 5 5
Turma C: 2 3 6 6 8
Turma D: 0 0 5 10 10
Os conjuntos so iguais?
Em qual das turmas h maior variao ou disperso dos dados em relao mdia?
Para calcularmos esta disperso em relao mdia, utilizaremos algumas medidas:
1.1 Amplitude: a diferena entre o maior e o menor dado observado. Como utiliza
apenas dois valores, contm pouca informao sobre a disperso. utilizada em
amostra muito pequenas.
R= Xmaior - Xmenor

1.2.Varincia amostral: A varincia mede o quanto os valores em uma amostragem


variam. uma medida que avalia o grau de disperso dos valores da varivel em torno
da mdia. Quanto menor a varincia, maior o grau de concentrao dos dados em
torno da mdia. Podemos representar o clculo dos dados da seguinte forma:
n

S2 =

(x
i =1

x) 2 . fi

n 1

(para dados de uma amostra agrupados)

n
x

i
1 n 2 i =1
2
S =
xi n (para dados amostrais)
n 1 i =1

1.3.Desvio Padro amostral: A varincia um quadrado, e muitas vezes o resultado


torna-se artificial.Por exemplo: a altura mdia de um grupo de pessoas 1,70m e a
varincia 25cm2. Fica um tanto esquisito cm2 em altura.
Para contornamos este problema definindo Desvio Padro como sendo a raiz
quadrada positiva de sua Varincia.

S = S 2 (para dados amostrais)


26

Usando a tabela de distribuio normal, vemos que no intervalo de:


De ( X S ) a ( X + S ) o grau de concentrao de probabilidades em torno da
mdia de 68%;
De ( X 2 S ) a ( X + 2 S ) , o grau de concentrao de probabilidades em torno da
mdia de 95%;
De ( X 3S ) a ( X + 3S ) , o grau de concentrao de probabilidades em torno da
mdia de 99,7%.
Exemplificando, se dissermos que a altura mdia X do homem brasileiro
adulto de 1,70m e desvio Padro (S) 5cm, estaremos dizendo que entre;
1,65m e 1,75m encontramos 68% da populao masculina adulta brasileira.
1,60m e 1,80m encontramos 95% da populao masculina adulta brasileira.
1,55m e 1,85m encontramos 99,7% da populao masculina adulta brasileir.a

( )

OBSERVAO:
O desvio Padro representa a maneira mais comum de se medir a variao
de um conjunto de observaes. Para duas amostras, a que apresentar um desvio
padro maior acusar uma maior disperso.
Quanto menor o desvio padro, mais os valores da varivel se aproximam
de sua mdia.
Quanto maior a varincia e desvio padro, maiores so os indcios de
heterogeneidade entre os elementos do conjunto.

1.4.Coeficiente de Variao de PEARSON: O coeficiente de variao mede a


homogeneidade dos dados em conjunto em relao mdia, sua frmula expressa por:
S
CV = 100
x
O valor obtido ser dado em porcentagem.
Acima de 30% o conjunto de dados considerado heterogneo
Abaixo de 30% o conjunto considerado homogneo.
Em algumas regras empricas para interpretaes do coeficiente de variao:
Se CV <15%
tem-se baixa disperso
Se 15%<CV<30%
tem-se mdia disperso
Se CV30%
tem-se elevada disperso
1.5 Medida de Assimetria: H um momento em que o pesquisador far a seguinte
pergunta: Qual a medida de tendncia central que representa melhor o conjunto de
dados em estudo?Assim, no caso das variveis quantitativas, quando o valor da
Mediana muito diferente da Mdia, aconselhvel considerar sempre a Mediana como
valor de referncia mais importante.
Quando a distribuio dos dados considerada "normal", ento a melhor medida de
localizao do centro, a mdia, fato que justifica a grande utilizao da mdia.
Esquematicamente podemos posicionar a mdia da forma seguinte, tendo em conta a
representao grfica na forma de histograma.

27

X < Md < Mo
assimetria negativa ou a esquerda

Mo < Md < X
assimetria positiva ou a direita

X = Md = Mo
distribuio simtrica
Para determinar o grau de assimetria, uma regra muito utilizada :
COEFICIENTE DE ASSIMETRIA DE PEARSON
X MO
1o Caso: AS =

2o Caso: AS =

3 Caso: AS =

Q1 + Q3 2 Md
Q3 Q1
3( x x% )

Desse modo, pode-se concluir que:


Se As > 0, a distribuio assimtrica positiva ( direita);
Se As < 0, a distribuio assimtrica negativa ( esquerda);
Se As = 0, a distribuio simtrica.

28

1.6 - Curtose
Denomina-se curtose o grau de achatamento da distribuio em relao a curva normal.
Uma distribuio nem chata, nem delgada, chama-se : mesocrtica

Uma distribuio achatada denomina-se: platicrtica

Uma distribuio delgada chama-se: leptocrtica

Para medir o grau de curtose utiliza-se o coeficiente:

Se K = 0,263, diz-se que a curva correspondente distribuio de freqncia


mesocrtica.
Se K > 0,263, diz-se que a curva correspondente distribuio de freqncia
platicrtica.
Se K < 0,263, diz-se que a curva correspondente distribuio de freqncia
leptocrtica

1.7 Erro Padro mdio


O erro padro uma medida da preciso da mdia amostral calculada. Quando uma
investigao cientfica realizada atravs de amostra, a mdia aritmtica teria outros
afastamentos (erros) em relao mdia populacional ou real. Para se determinar a mdia
destes afastamentos utilizaremos o erro padro da mdia, cujo clculo expresso pela
frmula:
s
Ep =
n
importante ressaltar que quanto menos o valor do erro-padro da mdia,
maispreciso ser os resultados em relao estimativa da mdia, anlise da
varinciaentre outras anlises, baseadas na estimativa de dados.
29

EXERCCIOS
1. Uma amostra de 50 estudantes apontou o seguinte rol de notas de Estatstica
(avaliao de 0 a 100).
30 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97
a) Qual a amplitude total desta amostra? vivel construir uma distribuio por
intervalos de classe?
b) Em quantas classes poderemos agrupar esse conjunto de dados?
c) Qual ser o tamanho dos intervalos de classe?
d) Construa a tabela de distribuio de freqncia por classes. Inicie a primeira
classe com 30.
e) Construa os histogramas de freqncias absolutas e relativas.
f) Quantos alunos obtiveram notas maiores ou iguais a 70?
g) Analisando a tabela e os grficos, redija um breve relatrio sobre as notas desta
turma de estudantes.
h) Calcule a mdia amostral e interprete.
i) Calcule e interprete a moda.
j) Calcule e interprete a mediana.
k) Determine os quartis. Represente os resultado usando o BOX-PLOT.
l) Determine a Varincia, Desvio Padro e Coeficiente de Variao. Interprete.
m) A Distribuio Simtrica? Justifique calculando o grau de assimetria e
interprete o BOX-PLOT.
n) Faa um comentrio final utilizando todos as informaes obtidas nos itens
acima e faa suas consideraes finais.
2. Para se estudar o desempenho de duas companhias corretoras de aes,
selecionou-se de cada uma delas amostras aleatrias das aes negociadas. Para
cada ao selecionada, computou-se a porcentagem de lucro apresentada durante
um perodo fixado de tempo. Os dados esto a seguir:
Quadro 1. Porcentagem de lucro de aes negociadas de duas corretoras
Corretora A
Corretora B
45 54 62 61 54 64
57 58 58 50 51 49
70 48 64 55 65 65
52 59 59 55 61 65
59 51 55 60 62 63
65 59 48 55 60 70
60 55 40 55 66 65
55 69 58 63 64 75
Determine:
a) A mdia, mediana, moda e quartis de cada corretora. Interprete os resultados;
b) Que corretora tem as aes menos dispersas?
c) Que corretora tem as aes mais homogneas?

30

3. Conhecidos os valores das importaes dos pases da Amrica Latina, durante o


perodo 1972 1981
Ano
72
73
74
75
76
77
78
79
80
81
Importaes
38.47 37.22 44.05 44.08 42.79 46.11 67.16 72.56 81.45 82.38
(milhes de dlares)
a) Fazer o grfico da srie cronolgica, calcular a mdia, desvio padro e coeficiente
de variao das importaes no perodo 1972 1981;
b) Calcular as importaes mdia, desvio padro e coeficiente de variao dos anos
1972 a 1976. Interprete os resultados;
c) Calcule as importaes mdia, desvio padro e coeficiente de variao dos anos
1977 a 1981. Interprete os resultados e compare com b).
4. Considere o conjunto das seguintes observaes:
11

14

16

21

12

13

15

12

a) Calcule a mdia, mediana, varincia e desvio padro dos dados.


b) Some duas unidades a cada observao e repita o item a). Compare com as respostas
obtidas com as do item a) e comente.
c) Multiplique cada observao original por 4 e repita o item a). compare as resposta
obtidas com as do item a) e comente.
d) Se nos dados originais voc soma ou subtrai qualquer nmero o que acontece com
as respostas dos dados originais (item a)?
e) Se voc multiplica ou divide qualquer nmero (exceto o zero) o que acontece com
as respostas dos dados originais (item a)?
f) Que concluso podemos obter de a), d) e e)?
5. Um laboratrio clnico precisa decidir comprar um dentre trs aparelhos
(A,B,C) para dosagem no sangue. Para isto o responsvel pela anlise preparou
uma substncia de concentrao conhecida (10mg/ml) e extraiu vrias amostras
para serem dosadas pelos trs aparelhos. Os resultados obtidos em cada um deles
foi o seguinte:
A
10
9
10
9
11
8
9
7
8
9
B
5
10
7
15
16
12
4
8
10
13
C
10
11
9
10
9
11
12
8
10
10
Em medidas clnicas trs termos so utilizados freqentemente:
PRECISO: Refere-se disperso dos resultados;
NO VICIADO: Refere-se tendncia de um conjunto de medidas produzir um
resultado igual ao verdadeiro valor(em nosso exemplo o verdadeiro valor 10mg/ml).
EXATO: refere-se ao instrumento PRECISO e NO VICIADO.
a) Descreva os trs instrumentos em termos das definies acima.
b) Qual instrumento lhe parece recomendvel? Justifique
6. Uma amostra de chapas produzidas por uma mquina forneceu as seguintes
espessuras, em milmetros, para os itens examinados:
6,34
6,38
6,40
6,36
6,38
6,30
6,38
6,20
6,42
6,28
6,38
H razes para afirmar que a distribuio das espessuras seja assimtrica?

31

7. Trinta embalagens plsticas de mel foram pesadas com preciso de decigramas.


Os pesos, aps convenientemente agrupados, forneceram a seguinte distribuio
de freqncias (em gramas).
Xi
fi
31,5
1
32,5
5
33,5
11
34,5
8
35,5
3
36,5
2
Determine a mdia, mediana, varincia, desvio padro e coeficiente de variao.
Podemos afirmar que as embalagens plsticas tem formato homogneo?
H razes para afirmar que a distribuio das espessuras seja simtrica?
8. Uma indstria metalrgica recentemente passou a produzir um tipo especial de
ao para atender um novo cliente. Estas peas so produzidas com um ao de
baixa-liga e aps serem usinadas so submetidas ao processo de resfriamento.
Para satisfazer s especificaes do novo cliente, o item de dureza, medida no
centro das peas de ao deve estar na faixa de 32 a 38 Rockwell C(unidade de
dureza). Os dados apresentados na Tabela 1 representa o nvel de dureza do ao
utilizando trs tratamentos (gua, leo A, leo B).
Tabela 01: Valores da Dureza, medida no centro das Peas do Tipo Especial, Aps os
tratamentos de resfriamento.
Resfriamento em
Observao
gua
leo A
leo B
1
36,7
36,0
35,3
2
38,9
36,4
35,0
3
38,7
35,3
34,3
4
38,8
36,8
35,7
5
37,6
36,9
35,2
6
37,2
37,5
34,2
7
38,8
35,3
36,5
8
38,0
36,0
35,6
9
37,2
35,7
35,5
10
37,8
36,1
35,5
11
38,0
37,0
35,4
12
38,8
Determine:
a) A mdia, Mediana, Desvio Padro, Coeficiente de Variao, Quartis, Valor
Mnimo e Valor Mximo de cada tratamento. Interprete os resultados.
b) Construa os grficos Dot-plot e Box-plot para cada tratamento. Interprete os
resultados.
c) Que tratamento tem nvel de dureza com menos variabilidade com respeito a sua
mdia e mais homogneo?
d) Qual dos trs tratamentos de resfriamento cumpre as especificaes do cliente?

32

9. Uma amostra de oitenta peas retiradas de um grande lote forneceu a seguinte


distribuio de comprimentos:
classes
fi
50 60
1
60 70
3
70 80
6
80 90
15
90 100 25
100 110 20
110 120 7
120 130 3
A especificao para esse tipo de material exige que o comprimento mdio das
peas esteja compreendido entre 92 e 96mm, que o coeficiente de variao seja
inferior a 20% e que a distribuio dos comprimentos seja assimtrica. Quais dessas
exigncias parecem no estar satisfeitas no presente caso?

33

PARTE VI

1. Trabalhando com dados agrupados


1.1- Mdia para dados agrupados
Quando os dados so apresentados em uma distribuio de frequncias, todos os
valores includos num certo intervalo de classe so considerados coincidentes com o
ponto mdio do intervalo. Desta maneira:
n

x=

x f
i =1

onde:
fi a frequncia de cada classe;
xi o ponto mdio de cada classe.
Exemplo 1: Calcular a mdia dos dados da distribuio do salrio mdio de 36
funcionrios de uma empresa.
Salrio
fi
4 | 8

10

8 |12

12

12 | 16

16 | 20

20 | 24

Total

36

a. Mediana para dados agrupados


No caso de dados agrupados em classes de frequncias, a mediana pode ser
calculada pela expresso (deduzida a partir do histograma de frequncias).
P ' Fa
X% = Li +
h
f me
onde:
Li o limite inferior da classe mediana ( em uma distribuio de frequncias chama-se
classe mediana classe que contm a mediana)
P = n/2 a posio da classe mediana;
' Fa a frequncia acumulada da classe vizinha anterior classe mediana;
f me a frequncia da classe mediana;
h a amplitude do intervalo da classe mediana;

34

b. Moda para dados agrupados


No caso de dados agrupados em classes de frequncia, a moda pode ser
calculada pela expresso (deduzida a partir do histograma de frequncia)
f'
M o = Li + '
h
f + f'
onde:
Li o limite inferior da classe modal (em uma distribuio de frequncia chama-se de
classe modal classe de maior frequncia);
'
f a frequncia de classe imediatamente inferior classe modal;
f ' a frequncia de classe imediatamente posterior classe modal;
h a amplitude de intervalo de classe modal.

c. Quartis para dados agrupados


No caso de dados agrupados em classes de frequncia, os quartis podem ser
calculados pela expresso (deduzida a partir do histograma de frequncia).

Quartil 1
n

' Fa
4
h
Q1 = Liq1 +
f q1
onde:
Liq1 o limite inferior da classe do 1 quartil (em uma distribuio de frequncia chamase de classe do 1 quartil classe que possui 25% dos elementos abaixo de seu valor);
' Fa a frequncia acumulada da classe vizinha anterior classe quartilitica;
n o tamanho da amostra;
f q1 a frequncia de classe do 1 quartil;
h a amplitude do intervalo de classe do 1 quartil.

Quartil 3
3n

' Fa
4
h
Q3 = Liq 3 +
fq3
onde:
Liq3 o limite inferior da classe do 3 quartil (em uma distribuio de frequncia chamase de classe do 1 quartil classe que possui 75% dos elementos abaixo de seu valor);
' Fa a frequncia acumulada da classe vizinha anterior classe quartilitica;
n o tamanho da amostra;
f q 3' a frequncia de classe do 3 quartil;
h a amplitude do intervalo de classe do 3 quartil.

35

d. Percentil para dados agrupados


No caso de dados agrupados em classes de frequncia, os Percentis podem ser
calculados pela expresso (deduzida a partir do histograma de frequncia).
in

' Fa

100
h
Pi = LPi +
f Pi
onde:
LPi o limite inferior da classe do Percentil Pi , em que i = 1, 2, 3, . . . 99;
' Fa a frequncia acumulada da classe vizinha anterior classe do percentil;
n o tamanho da amostra;
f Pi a frequncia de classe do Percentil;
h a amplitude do intervalo de classe do Percentil.

e. Varincia para dados agrupados


No caso de dados agrupados em classes de frequncia, a Varincia pode ser calculada
pela expresso (deduzida a partir do histograma de frequncia)
n

S2 =

(x
i =1

x) 2 . fi

n 1
Onde:
x a mdia amostral
xi representa cada dado amostral (ou intervalo de classe amostral)
f i a frequncia de cada classe

f. Detectando outliers
Um boxplot pode ser formado para indicar explicitamente a presena de outliers.

Definio: Qualquer observao distante mais do que 1,5(Q3 Q1) do quarto mais
prximo um outlier. Um outlier extremo se estiver a mais de 3.(Q3 Q1) do quarto
mais prximo. Caso contrrio moderado.

36

EXERCCIOS
1) Na empresa Mercury Ltda foi observada a distribuio de funcionrios do setor de servios
gerais com relao ao salrio semanal, conforme mostra a distribuio de frequncia:

Pede-se:
(a) salrio mdio semanal dos funcionrios.
(b) desvio padro, o coeficiente de variao e a moda dos salrios semanais dos funcionrios.
(c) Se o empresrio divide os funcionrios em trs categorias, com relao ao salrio, de sorte
que: Os 25% menos produtivos sejam da categoria A; Os 25% seguintes sejam da categoria B e
Os 25% seguintes, sejam da categoria C;
Pede-se determinar os limites dos salrios das categorias A;B e C
(d) Esboce o box-plot da distribuio e comente-o.
2) Uma distribuio simtrica unimodal apresenta mediana igual a 36dm e coeficiente de
variao em torno de 20%. Determine a varincia dessa distribuio.
3) Lanado um dado 50 vezes, obteve-se a seguinte distribuio:
xi
fi
1
6
2
11
3
6
4
7
5
9
6
11
a) Determinar a mdia, mediana, moda e quartis da distribuio;
b) Determinar a varincia, desvio padro e valor do coeficiente de variao.
c) A distribuio Homognea? simtrica?
d) A distribuio mesocurtca?
e) Podemos dizer que a distribuio tem um comportamento normal? Por qu?
4) Num teste aplicado a 30 alunos, obteve-se a seguinte distribuio de pontos:
Pontos
35|45
45|55
55|65
65|75
75|85
N de alunos
1
3
8
3
3
a) Determinar a mdia, mediana, moda e quartis da distribuio;
b) Determinar a varincia, desvio padro e valor do coeficiente de variao.
c) A distribuio Homognea? simtrica?
d) Calcule o coeficiente de curtose.
e) O que Podemos dizer a respeito da distribuio? Interprete os resultados.

85|95
2

SUGESTO: Resolvam tambm os exerccios:


** Captulo 5 ( Pg 101 at a 166) do livro Curso de Estatstica dos autores Jairo Simon da
Fonseca e Gilberto de Andrade Martins, 6 edio.
** Captulo 1 ( Pg 1 at a 46) do livro Probabilidade e Estatstica para Engenharis e
Cinciasdo autor Jay L. Devore

37

PARTE VII

Probabilidade
1. Introduo
A maneira mais comum de medirmos as incertezas relacionadas com eventos
(por exemplo, resultado de um pleito eleitoral, resultados obtidos com a ingesto de um
novo medicamento) consiste em atribuir-lhes probabilidades ou especificar as chances
de ocorrncia do evento.
Dentre os diversos conceitos de probabilidade, o de maior aplicao a
interpretao frequencial: A probabilidade de um evento a proporo do nmero de
vezes que eventos do mesmo tipo ocorrem a longo prazo.

1.1 Experimento aleatrio


Um experimento dito ser aleatrio quando satisfaz s seguintes condies:
1. pode ser repetido indefinidamente;
2. somos capazes de descrever todos os possveis resultados do experimento, embora
no sejamos capazes de predizer, com certeza, qual ocorrer;
3. obedece regularidade estatstica, ou seja, quando o experimento for repetido um
grande nmero de vezes, surgir uma configurao definida;

1.2 Espao amostral


Definio: o conjunto S de todos os resultados possveis de um experimento
aleatrio. Cada resultado do experimento aleatrio denominado ponto amostral.
Exemplo: Lanar um dado honesto e observar o resultado obtido; Contar o nmero de
dias que choveu durante certo ms em certa cidade. O nmero de mensagens que so
transmitidas corretamente por dia em uma rede de computadores.
O espao amostral pode ser:
1. Finito: formado por um nmero limitado de resultados possveis.
2. Infinito enumervel: formado por um nmero infinito de resultados, os quais podem
ser listados.
1. Infinito: formado por intervalos de nmeros reais.

Definio: Um espao amostral dito discreto quando for finito ou infinito


enumervel; dito contnuo quando for infinito, formado por intervalos de nmeros
reais.
1.3 Evento
Definio: Qualquer subconjunto dos resultados contidos no espao amostral
denominado evento. Se este subconjunto possuir apenas um elemento, o denominamos
evento elementar.

38

Por exemplo, no lanamento de um dado, o nosso espao amostral seria:


U = {1, 2, 3, 4, 5, 6}.
Exemplos de eventos no espao amostral U:
A: sair nmero maior do que 4: A = {5, 6}
B: sair um nmero primo e par: B = {2}
C: sair um nmero mpar: C = {1, 3, 5}
Nota: O espao amostral tambm denominado espao de prova.

Trataremos aqui dos espaos amostrais equiprovveis, ou seja, aqueles onde os


eventos elementares possuem a mesma chance de ocorrerem.
Por exemplo, no lanamento do dado acima, supe-se que sendo o dado
perfeito, as chances de sair qualquer nmero de 1 a 6 so iguais. Temos
ento um espao equiprovvel.

Em oposio aos fenmenos aleatrios, existem os fenmenos


determinsticos, que so aqueles cujos resultados so previsveis, ou seja, temos certeza
dos resultados a serem obtidos.
Como um evento um subconjunto do espao amostral, ento todos os
conceitos da teoria de conjuntos podem ser aplicados a eventos. Considerando A e B
eventos quaisquer, veja as principais operaes no quadro a seguir:
Unio

A B

Rene os elementos de ambos os


conjuntos

Interseco

A B

Complementar

Formado somente pelos elementos


que esto em A e B
Formado pelos elementos que no
esto em A

Ocorre quando o elemento


aparece em pelo menos um dos
eventos
Ocorre quando o elemento
aparecer em ambos os eventos
Ocorre quando o elemento no
aparece no evento A

Exemplo:
Seja o experimento: lanamento de um dado e os eventos:
A= nmero par no dado;
B= nmero maior que 2 no dado;
C= nmero 6;
1. D os eventos complementares;

2. D as reunies;

3. D as interseces;

39

2. Definio axiomtica de probabilidade


A probabilidade um nmero associado a um evento, destinado a medir sua
possibilidade de ocorrncia.
Seja S o espao amostral E um evento associado a ele, P(E) a probabilidade
de ocorrncia de E:
a. Axioma 1: 0 P(E) 1;
Ou seja, a probabilidade de um evento qualquer um nmero real situado no intervalo
real [0, 1].
b. Axioma 2: P(S) = 1;
Ou seja, a probabilidade do evento certo igual unidade.
Com efeito, P(S) = n(S)/n(S) = 1
Por exemplo, se numa urna s existem bolas vermelhas, a probabilidade de se retirar
uma bola vermelha (evento certo, neste caso) igual a 1
c. Axioma 3: Se A;B; . . . ,K so eventos mutuamente exclusivos,
P ( A B K ) = P ( A) + P ( B ) + P ( K )
Destes axiomas surgem as propriedades:
1. P ( ) = 0;
Ou seja, a probabilidade do evento impossvel nula.
Com efeito, sendo o evento impossvel o conjunto vazio (), teremos:
P() = n ()/n (U) = 0 /n (U) = 0
Por exemplo, se numa urna s existem bolas brancas, a probabilidade de se retirar uma
bola verde (evento impossvel, neste caso) nula.
2. P ( A ) = 1 P ( A);
Ou seja, a soma das probabilidades de um evento e do seu evento complementar igual
a unidade.
Seja o evento A e o seu complementar A . Sabemos que A U A = S.
n(A U A ) = n(S) e, portanto, n(A) + n( A ) = n(S).
Dividindo ambos os membros por n(S), vem:
n(A)/n(S) + n( A )/n(S) = n(S)/n(S), de onde se conclui:
P(A) + P( A ) = 1

3. P ( A B ) = P( A) + P( B) P( A B).
Seja S um espao amostral finito e equiprovvel e A um determinado evento, ou
seja, um subconjunto de S. A probabilidade P(A) de ocorrncia do evento A ser
calculada pela frmula:
n( A)
n( S )
onde: n (A) = nmero de elementos de A e n (S) = nmero de elementos do espao de
prova S.
P ( A) =

40

2.1 - Considere o lanamento de um dado. Calcule a probabilidade de:


a) sair o nmero 3.
b) sair um nmero par.
c) sair um mltiplo de 3.
d) sair um nmero menor do que 3.
e) sair um quadrado perfeito.
f) sair um nmero 8.
g) sair um nmero menor que 7.

2.2 - Considere o lanamento de dois dados. Calcule a probabilidade de:


a) Sair a soma 8.
b)Sair a soma 12.

2.3 Uma urna possui 6 bolas azuis, 10 bolas vermelhas e 4 bolas amarelas. Tirandose uma bola com reposio, calcule as probabilidades seguintes:
a) sair bola azul.

b) sair bola vermelha.

c) sair bola amarela

Vemos no exemplo acima, que as probabilidades podem ser expressas como


porcentagem. Esta forma conveniente, pois permite a estimativa do nmero de
ocorrncias para um nmero elevado de experimentos.
Por exemplo, se o experimento acima for repetido diversas vezes, podemos
afirmar que em aproximadamente 30% dos casos, sair bola azul, 50% dos casos sair
bola vermelha e 20% dos casos sair bola amarela. Quanto maior a quantidade de
experimentos, tanto mais a distribuio do nmero de ocorrncias se aproximar dos
percentuais indicados.
Exemplo:
Em uma certa comunidade existem dois jornais J e P. Sabe-se que 5000 pessoas so
assinantes do jornal J, 4000 so assinantes de P, 1200 so assinantes de ambos e 800
no lem jornal. Qual a probabilidade de que uma pessoa escolhida ao acaso seja
assinante de ambos os jornais?

41

3. Probabilidade condicional e independente


Considere que desejamos calcular a probabilidade da ocorrncia de um evento
A, sabendo-se de antemo que ocorreu um certo evento B. Pela definio de
probabilidade vista anteriormente, sabemos que a probabilidade de A dever ser
calculada, dividindo-se o nmero de elementos de elementos de A que tambm
pertencem a B, pelo nmero de elementos de B. A probabilidade de ocorrer A, sabendose que j ocorreu B, denominada Probabilidade condicional e indicada por P (A / B)
probabilidade de ocorrer A sabendo-se que j ocorreu B da, o nome de
probabilidade condicional.

Teremos ento:

P ( A / B) = n ( A B) / n (B)
onde AB = interseo dos conjuntos A e B.
Esta frmula importante, mas pode ser melhorada.
Vejamos:
Ora, a expresso acima, pode ser escrita sem nenhum prejuzo da elegncia, nem do
rigor, como:
P(A/B) = [n(AB)/n(S)] . [n(S)/n(B)]
P(A/B) = P(AB) . 1/P(B)
Vem, ento: P(A / B) = P (AB) /P (B), de onde conclumos finalmente:

P(A B) = P ( A / B ) .P ( B )
Esta frmula denominada Lei das Probabilidades Compostas.
Esta importante frmula, permite calcular a probabilidade da ocorrncia simultnea dos
eventos
A
e
B,
sabendo-se
que
j
ocorreu
o
evento
B.
Se a ocorrncia do evento B, no mudar a probabilidade da ocorrncia do evento A,
ento P(A/B) = P(A) e, neste caso, os eventos so ditos independentes, e a frmula
acima fica:

P(AB) = P(A) . P(B)


Podemos ento afirmar, que a probabilidade de ocorrncia simultnea de eventos
independentes, igual ao produto das probabilidades dos eventos considerados.
Para trs eventos, A; B e C a regra do produto pode ser escrita como:
P ( A B C ) = P ( A) P ( B / A) P (C / A B )

Exemplo:
1) Uma urna possui cinco bolas vermelhas e duas bolas brancas. Calcule as
probabilidades de:

42

a) em duas retiradas, sem reposio da primeira bola retirada, sair uma bola vermelha
(V) e depois uma bola branca (B).
b) em duas retiradas, com reposio da primeira bola retirada, sair uma bola vermelha e
depois uma bola branca.

Dois ou mais eventos so independentes quando a ocorrncia de um dos eventos


no influencia a probabilidade de ocorrncia dos outros.
Se dois eventos A e B so independentes, ento:
P ( A / B ) = P ( A) ,

P ( B / A) = P ( B )

Como consequncia, a regra do produto pode ser simplificada da seguinte forma:


P ( A B ) = P ( A) P ( B / A) = P ( A) P ( B )
Essa relao usada para definir formalmente eventos independentes, ou seja:
A e B so independentes P ( A B ) = P ( A) P ( B )
A definio de independncia ainda pode ser ampliada para mais eventos, como segue:
E1, E2, . . ., En so independentes P ( E1 E 2 En ) = P ( E1 ) P ( E2 ) P ( En )

5. Teorema Bayes
um processo usado para calcular a probabilidade a posteriori.
Definio: Sejam E1, E2, E3, . . . , Ek eventos mutuamente exclusivos, tais que:
P(E1) + P(E2) + P(E3) + . . . + P(Ek) = 1.
Seja A um evento qualquer, que se sabe ocorrer em conjunto com, ou em
conseqncia de, um dos eventos Ei. Ento a probabilidade de ocorrncia de um evento
Ei dada a ocorrncia de A, dada por:

P( Ei / A) =

P( Ei A)
P( Ei ) P( A / Ei )
=
P( A)
P( E1 ) P( A / E1 ) + P( E 2 ) P( A / E 2 ) + .... + P( E k ) P( A / E k )

Esse resultado relaciona probabilidades a priori P(Ei) com probabilidades a


posteriori P(Ei/A) = Probabilidade de Ei depois da ocorrncia de A.

43

EXERCCIOS
1. Determine a probabilidade de cada evento:
a) Um nmero par aparecer no lanamento de um dado no viciado;
b)Um rei aparecer, ao extrair-se uma carta de um baralho;
c) Pelo menos uma cara aparecer no lanamento de trs moedas;
d) Pelo menos uma cara aparecer no lanamento de n moedas;
e) Duas copas aparecerem, ao retirarem-se duas cartas de um baralho;
f) Uma carta de copas e uma de ouros aparecerem ao extrarem-se duas cartas de um
baralho.
R:
a) 1/2
b) 1/13
c) 7/8
d) (2n 1)/2n
e) 1/17
f) 13/204
2. Um nmero escolhido entre 20 inteiros ao acaso, de 1 a 20. Qual a
probabilidade de o nmero escolhido:
a) ser par?
b) Ser mpar?
c) Ser primo?
d) Quadrado perfeito?
R:
a) 1/5
b) 1/10
c) 3/10
d) 6/25
3. Uma urna contm 20 bolas numerads de 1 a 20. seja o experimento retirada de
uma bola, e considere os eventos:
A = { a bola retirada possui um mltiplo de 2}
B = {a bola retirada possui um mltiplo de 5}
Determine a probabilidade do evento AB
R:
3/5
4. Dois dados, um verde e um vermelho, so lanados e observados os nmeros das
faces de cima:
a) Qual a probabilidade de ocorrerem nmeros iguais?
b) Qual a probabilidde de ocorrerem nmeros diferentes?
c) Qual a probabilidade de a soma dos nmeros ser 7?
d) Qual a probabilidade de a soma dos nmeros ser 12?
e) Qual a probabilidade de a soma dos nmeros ser menor ou igual a 12?
f) Qual a probabilidade de aparecer um nmero 3 em ao menos um dado?
R:
a) 1/6
b) 5/6
c) 1/6
d) 1/36
e) 1
f) 11/36

b)
c)
d)
R:

5. Um dado lanado e o nmero da face de cima observado.


a) se o resultado obtido for par, qual a probabilidade de ele ser maior ou igual a
cinco?
Se o nmero obtido for maior ou igual a cinco, qual a probabilidade de ele ser par?
Se o resultado obtido for mpar, qual a probabilidade de ele ser menor que 3?
Se o resultado for menor que 3, qual a probabilidade de ele ser mpar?
a) 1/3
b)
c) 1/3
d)

44

6. Um nmero escolhido aleatoriamente dentre os nmeros 1, 2, 3, 4, 5, . . . , 50.


Qual a probabilidade de :
a) O nmero ser divisvel por 5?
b) O nmero terminar em 3?
c) O nmero ser primo?
d) O nmero ser divisvel por 6 ou por 8?
R:
a) 1/5
b) 1/10
c) 3/10
d) 6/25
7. Qual a probabilidade de sair um Rei ou uma carta de Copas, quando retiramos
uma carta de um baralho?
R:
4/13
8. Dois dados so lanados simultaneamente. Qual a probabilidade de:
a) A soma ser menor que 4?
b) A soma ser 9?
c) O primeiro resultado ser maior do que o segundo?
R:
a) 1/12
b) 1/9
c) 5/12
9. Numa urna, so misturadas 10 bolas numerada de 1 a 10. Duas bolas so
retiradas (a, b) sem reposio. Qual a probabilidade de a + b =10?
R: 4/45
10. Em uma indstria h 10 pessoas que ganham mais de 20 salrios mnimos(s.m.),
20 que ganham entre 10 e 20 s.m. e 70 que ganham menos de 10 s.m.. Trs
pessoas desta indstria so selecionadas. Determinar a probabilidade de que pelo
menos uma ganhe menos de 10 s.m.
R:
97,3%
11. Um lote formado por 10 peas boas, quatro com defeitos e duas com defeitos
graves. Uma pea escolhida ao acaso. Calcule a probabilidade de que:
a) Ela no tenha defeitos graves;
b) Ela no tenha defeitos;
c) Ela seja boa, ou tenha defeitos graves;
R:
a) 7/8
b) 5/8
c)
12. Considere o mesmo lote anterior. Retiram-se duas peas ao acaso. Qual a
probabilidade de que;
a) Ambas sejam perfeitas?
b) Pelo menos uma seja perfeita?
c) Nenhuma tenha defeito grave?
d) Nenhuma seja perfeita?
R:
3/8
b) 7/8
c) 91/120
d) 1/8
13. Um lote de 120 peas entregue ao controle de qualidade de uma firma. O
responsvel pelo setor seleciona 5 peas. O lote aceito se forem observadas 0
ou 1 defeitos. H 20 peas defeituosas no lote.
a) Qual a probabilidade do lote ser aceito?
b) Admitindo que o lote seja aceito, qual a probabilidade de ter sido
observado s um defeito?
R:
a)80,38%
b) 50%

45

14. Uma urna contm cinco bolas brancas e seis pretas. Trs bolas so retiradas.
Calcular a probabilidade de:
a) Serem todas pretas;
b) Ser exatamente uma branca;
c) Ser ao menos uma preta.
R:
a)4/33
b) 5/11
c) 31/33
15. Em uma classe, existem cinco alunos do 4 ano, quatro do 2 ano e trs do 3
ano. Qual a probabilidade de serem sorteados dois alunos de 2 ano, trs do 4
e dois do 3?
R:
5/22
16. A e B jogam 120 partidas de xadrez, das quais A ganha 60, B ganha 40 e 20
terminam empatadas. A e B concordam em jogar 3 partidas. Determinar a
probabilidade de:
a) A ganhar todas as trs;
b) Duas partidas terminarem empatadas;
c) A e B ganharem alternadamente.
R:
a) 1/8
b) 5/72
c) 5/36
17. A probabilidade de trs jogadores marcarem um pnalti so respectivamente:
2 4 7
, e
3 5 10
Se cada um cobrar uma nica vez, qual a probabilidade de:
a) Todos acertarem?
b) Apenas uma acertar?
c) Todos errarem?
R:
a) 28/75
b) 1/6
c) 1/50
18. Numa bolsa temos cinco moedas de R$ 1,00 e quatro de R$ 0,50. Qual a
probabilidade de, ao retirarmos duas moedas, obtermos R$ 1,50?
R:
5/9
3
e de seu
19. A probabilidade de uma mulher estar viva daqui 30 anos de
4
3
marido, . Calcular a probabilidade de:
5
a) Apenas o homem estar vivo;
b) Somente a mulher estar viva;
c) Ambos estarem vivos.
R:
a) 3/20
b) 3/10
c) 9/20
20. Uma caixa A contm oito peas, das quais trs so defeituosas, e uma caixa B
contm cinco peas, das quais duas so defeituosas. Uma pea retirada
aleatoriamente de cada caixa.
a) Qual a probabilidade p de que ambas as peas no sejam defeituosas?
b) Qual a probabilidade p de que uma pea seja defeituosa e a outra no?
c) Se uma pea defeituosa e a outra no, qual a probabilidade p de que a
pea defeituosa venha da caixa A?
R:
a) 3/8
b) 19/40
c) 9/19

46

21. Temos duas caixas: na primeira h trs bolas brancas e sete pretas; e na segunda,
uma bola branca e cinco pretas. De uma caixa escolhida ao acaso, seleciona-se
uma bola e verifica-se que preta. Qual a probabilidade de que a caixa onde
for extrada a bola seja a primeira? E a segunda?
R:
21/46
25/46
22. A probabilidade de um indivduo de classe A comprar uma carro de

R:

3
, de B
4

1
1
e de C
. A probabilidade de o indivduo de classe A comprar um carro
5
20
1
3
3
da marca D
; de B comprar da marca D
e de C
. Em certa loja
10
5
10
comprou-se um carro da marca D. qual a probabilidade de que o indivduo da
classe B o tenha comprado?
4/7

23. Em certo colgio, 5% dos homens e 2% das mulheres tem mais do que 1,80m de
altura. Por outro lado, 60% dos estudantes so homens. Se um estudante
escolhido ao acaso e tem mais de 1,80m de altura qual a probabilidade de que
o estudante seja mulher?
R:
4/19
24. Trs mquinas, A, B e c, produzem respectivamente 40%, 50% e 10% total de
peas de uma fbrica. As porcentagens de peas defeituosas nas respectivas
mquinas so 3%, 5% e 2%. Uma pea sorteada ao acaso e verifica-se que
defeituosa. Qual a probabilidade de que a pea tenha vindo da mquina B?
R:
25/39
25. A industria Alpha Ltda., fabricante de esferas metlicas, possui trs mquinas,
M1, M2 e M3, responsveis por 25%, 40% e 35%, respectivamente, de sua
produo diria. Por sua vez, as respectivas taxas de unidades defeituosas so de
1%, 2% e 3%. Tendo um item sido retirado, ao acaso, da produo diria de
600.000 unidades, e se verificando que apresenta defeito, pede-se a
probabilidade de ser proveniente de Mi (i = 1, 2, 3).
R:
M1 = 11,9%
M2 = 38,10%
M3 = 50%
26. A circulao da estrada que liga a cidade Alpha cidade Betha cortada por trs
sinais luminosos, no sincronizados, cuja distancia entre si de 2,5km. Os sinais
tm ciclo de um minuto, com durao para o sinal verde de 30, 30 e 40
segundos, respectivamente. Se um carro percorre a estrada, velocidade de
60km/h, observando a todos os sinais, qual a probabilidade de no ser parado
por nenhum deles?
R:
1/6
27. A caixa A tem 9 cartas numeradas de 1 a 9. A caixa B tem 5 cartas numeradas
de 1 a 5. Uma carta escolhida ao acaso e uma carta retirada. Se o nmero
par, qual a probabilidade de que a carta sorteada tenha vindo de A?
R:
10/19

47

28. Uma caixa tem 3 moedas: uma no viciada, outra com 2 caras e uma terceira
1
viciada, de modo que a probabilidade de ocorrer cara nesta moeda de . Uma
5
moeda selecionada ao acaso da caixa. Saiu cara. Qual a probabilidade de que a
3 moeda tenha sido selecionada?
R:
2/17
29. Um certo programa pode ser usado com uma entre duas sub-rotinas A e B,
dependendo do problema. A experincia tem mostrado que a sub-rotina A
usada 40% das vezes e B usada 60% das vezes. Se A usada, existe 75%
de chance que o programa chegue a um resultado dentro do limite de tempo. Se
B usada, a chance de 50%. Se o programa foi realizado dentro do limite de
tempo, qual a probabilidade de que a sub-rotina A tenha sido escolhida?
R:
50%
30. A probabilidade de que um atleta A ultrapasse 17,30m num nico salto triplo
de 0,7. O atleta d 4 altos. Qual a probabilidade de que pelo menos num dos
saltos ultrapasse 17,30m?
R:
99,19%

48

PARTE VIII

Distribuio de Probabilidade de Variveis


1. Variveis Aleatrias
Seja E um evento aleatrio e U o espao Amostral associado ao experimento.
Uma funo X que associe cada elemento u U um nmero real X(u) denominada
varivel aleatria.
Exemplo:
Lanam-se trs moedas. Seja X: nmero de ocorrncia de face cara. Determinar a
distribuio de probabilidade de X.

1.1

Varivel Aleatria Discreta

Seja X uma varivel aleatria. Se o nmero de valores possveis de X for finito


ou infinito numervel, denominaremos X de Varivel Aleatria Discreta.
Exemplos:
X: O nmero de Caras obtidas em um lanamento de duas moedas no viciadas.
X: O nmero de Clientes que vo ao banco no horrio das 10:00h as 12:00h.
X: Chamadas telefnicas por unidade de tempo.
X: Nmero de partculas emitidas por uma fonte de material radioativo por unidade
de tempo.

1.2

Varivel Aleatria Contnua

Seja X uma varivel aleatria. Se o contradomnio de X um intervalo, ou uma


coleo de intervalos, denominamos X de Varivel Aleatria Contnua.
Exemplos:
X: Altura acima do solo que um dardo atinge o painel.
X: O intervalo de tempo de vida de uma lmpada.
X: Tempo de vida til de uma bateria de automvel.
X: Tempo de vida de uma pessoa.

2. Funo Distribuio de Probabilidade Discreta


a funo que associa a cada valor assumido pela varivel aleatria a
probabilidade do evento correspondente, isto :
P( X = xi ) = P( Ai ), i = 1,2 ,3,..., n
Para o resultado p( xi ) = P( X = xi ) , temos:
a) p( xi ) 0 para todo xi

b)

p( xi ) = 1

i =1

49

2.1. Funo de Distribuio Acumulada


Se X for uma varivel aleatria discreta, define-se Funo de Distribuio
Acumulada em um ponto x como a soma das probabilidades dos valores x,
menores ou iguais a x. Isto :
F( x ) =

p( xi )

xi x

Parmetros de uma Varivel Aleatria Discreta


3. Esperana matemtica ou mdia de uma Varivel Aleatria Discreta
Seja X uma varivel aleatria discreta, com valores X1, X2, . . . , Xn, o valor esperado
de X (ou esperana matemtica de X) ou simplesmente mdia de X definida como

( x ) = x = E( x ) =

xi . p( xi )

i =1

propriedades da mdia
i ) E (k ) = k , com k constante;
ii ) E (kX ) = kE ( X );
iii ) E ( X Y ) = E ( X ) E (Y );

n
n
iv) E X i = { E ( X i )};
i =1 i =1
v) E (aX b) = aE ( X ) b, com a e b constantes;
vi ) E ( X ) = E ( X ) E ( ) = = 0;

50

4. Varincia e Desvio Padro de uma varivel aleatria discreta


4.1 Varincia
O fato de conhecermos a mdia de uma distribuio de probabilidades j nos
ajuda bastante, porm no temos uma medida que nos d o grau de disperso de
probabilidade em torno dessa mdia.
A varincia uma media de disperso que avalia o grau de disperso dos valores
da varivel em torno da mdia. Quanto menor a varincia maior o grau de concentrao
de probabilidade em torno da mdia e vice-versa; quanto maior a varincia, maior o
grau de disperso da probabilidade em torno da media.

Definimos ento varincia como:

Var( x ) = 2 ( x ) = { E( x 2 ) [ E( x )2 ]}
onde:

E( x 2 ) =

[( xi 2 ). p( xi ) ]

i =1

E( x ) =

[( xi ). p( xi ) ]

i =1

Notao:

Var( x ), V ( x ), 2 , x2 , 2

propriedades da mdia

51

4.2 Desvio Padro


A varincia um quadrado, e muitas vezes o resultado torna-se artificial. Por
exemplo: a altura mdia de um grupo de pessoas 1,70m e a varincia 25cm2. Fica um
tanto esquisito cm2 em altura.
Contornamos este problema definindo Desvio Padro.
Desvio Padro da varivel X a raiz quadrada da varincia de X, isto ;
DP( x ) = Var( x )
ou

( x ) = 2( x )
Usando a tabela de distribuio normal, vemos que no intervalo de ( ) a
( + ) o grau de concentrao de probabilidades em torno da mdia de 68%; no
intervalo de ( 2 ) a ( + 2 ) , o grau de concentrao de probabilidades em torno
da mdia de 95% e essa concentrao de 99,7% no intervalo de ( 3 ) a
( + 3 ) .
Exemplificando, se dissermos que a altura mdia ( ) do homem brasileiro
adulto de 1,70m e desvio Padro ( ) 5cm, estaremos dizendo que entre;
1,65m e 1,75m encontramos 68% da populao masculina adulta brasileira
1,60m e 1,80m encontramos 95% da populao masculina adulta brasileira
1,55m e 1,85m encontramos 99,7% da populao masculina adulta brasileira

Distribuio Conjunta de Duas Variveis Aleatrias Discreta


5. Funo de Probabilidade conjunta
A funo de probabilidade conjunta associa a cada par ( xi , yi ) , i=1, ..., m e j=1, ...,
n a probabilidade P(X=xi, Y=yj) = p(xi; yj).
Damos o nome de distribuio conjunta de duas varveis aleatrias (X, Y), ao
conjunto:
{ ( xi , yi ) , i=1, ..., m e j=1, ..., n}
Observamos que:
m

i =1 j =1

p( X = xi ,Y = yi ) = 1

6. Distribuies marginais de Probabilidades

52

6.1 Distribuio Marginal de X


Definio:
P( X = xi ) =

P( X

j =1

= xi ,Y = y j ), i = 1, 2 ,..., m

e
m

i =1

j =1

P( X = x ) =
i =1

p ( xi , y j ) = 1

6.2 Distribuio Marginal de Y


Definio:
m

P (Y = y j ) = P ( X = xi , Y = y j ), j = 1, 2,..., n
i =1

e
n

j =1

j =1

P(Y = yi ) =

i =1

p( xi , y i ) = 1

7. Distribuies Condicionais
Definio:
P( X = xi ;Y = y j )
P( X = xi / Y = y j ) =
,
P( Y = y j )

j = fixo

i = 1, 2 ,..., m

i = fixo

j = 1, 2,..., n

p( y = y j ) 0

Definio:

P( Y = y j / X = xi ) =

P( X = xi ;Y = y j )
P( X = xi )

p( X = xi ) 0
Definio:
m

p ( xi ; y j )

i =1

i =1

p( y j )

p( xi ; y j )

j =1

j=1

p ( xi )

P( X / Y = y j ) = xi .p(x i /y i ) = x i

j = fixo

i = 1, 2,..., n

Definio:
P (Y / X = xi ) = yi .p(y i /x i ) = y j

i = fixo

j = 1, 2,..., m

8. Variveis Aleatrias Independentes


X = x1 , x 2 ,..., x m e P( X = xi ) = p( xi ), i = 1,2,..., m
Sejam
Y = y1 , y 2 ,..., y n e P(Y = y j ) = p( y j ), j = 1,2,..., n
Definio:

53

As variveis aleatrias X e Y so
P( X = xi , Y = y j ) = P ( X = xi ).P (Y = y j ) ,

independentes

se

somente se
par

( xi , y j ), i = 1,2,..., m e j = 1,2,..., n

9. Funes de Variveis Aleatrias


9.1 E ( X Y ) = E ( X ) E (Y )
9.2 Se X e Y so independentes, ento E ( X Y ) = E ( X ) E (Y )
9.3 Se X e Y so independentes, ento Var ( X Y ) = Var ( X ) Var (Y )
9.4 Covarincia entre X e Y
A covarincia mede o grau de dependncia entre as duas variveis X e Y. A mesma
definida por:
Cov( X , Y ) = E ( X Y ) E ( X ) E (Y ) .
Se X e Y so independentes, ento Cov( X , Y ) = 0
A recproca no verdadeira

9.5 Coeficiente de Correlao () entre X e Y


Se estivermos estudando a dependncia entre as variveis X: altura do pai em cm e
Y: a altura do 1o filho em cm, ao calcularmos a covarincia, teremos uma medida ao
quadrado (cm2). Alm disso, o campo de variao muito amplo, isto ,
< cov( X , Y ) < + .
Para solucionarmos este problema, utilizamos o conceito de coeficiente de
correlao ( ) entre X e Y.
DEFINIO:

cov( X , Y )
x y

Tambm:

x, y
x y

1 1 +1
a) Quando > 0, cov( X , Y ) > 0. O diagrama de disperso : ( +1)
y

b) Quando < 0, cov( X , Y ) < 0. O diagrama de disperso : ( 1)

54

c) Quando = 0, cov( X , Y ) = 0. O diagrama de disperso : ( 0)


y

Observamos que quando > 0 e < 0 , as nuvensde pontos dos diagramas de


disperso (a) e (b) apresentam uma tendncialinear. Quanto mais prximo for de
+1 e de -1, maior o grau de dependncia entre as variveis e maior a confiabilidade de
se escrever uma varivel em funo da outra.

EXERCCIOS
1. Uma urna tem 4 bolas brancas e 3 pretas. Retiram-se 3 bolas sem reposio. Seja
X: nmero de bolas brancas, determinar a distribuio de probabilidade de X.

2. As probabilidades de que haja 1, 2, 3, 4 ou 5 pessoas em cada carro que v ao


litoral num sbado so, respectivamente: 0,05; 0,20; 0,40; 0,25; e 0,10. Qual o
nmero mdio de pessoas por carro? Se chegam no litoral 4000 carros por hora,
qual o nmero esperado de pessoas, em 10 horas?
R: 3,15 pessoas; 126.000pessoas
3. Na produo de uma pea so empregadas duas mquinas. A primeira utilizada
para efetivamente produzir as peas, e o custo de produo de R$ 50,00 por
unidade. Das peas produzidas nessa mquina, 90% so perfeitas. As peas
defeituosas produzidas na primeira maquina so colocadas na segunda mquina
para tentativa de recuperao (torn-las perfeitas). Nessa segunda mquina o
custo por pea de R$ 25,00, mas apenas 60% das peas so de fato
recuperadas. Sabendo que cada pea perfeita vendida por R$ 90,00, e que cada
pea defeituosa vendida por R$ 20,00, calcule o lucro esperado pelo
fabricante.
R: O lucro esperado, por pea, de R$ 34,7
4. Um supermecado faz a seguinte promoo: o cliente, ao passar pelo caixa, lana
um dado. Se sair face 6 tem um desconto de 30% sobre o total de sua conta. Se
sair 5 o desconto de 20%. Se ocorrer face 4 de 10%, e se ocorrerem faces 1, 2
ou 3 o desconto de 5%.

55

R:

a) Calcular a probabilidade de que num grupo de 5 clientes, pelo menos um


consiga um desconto maior que 10%.
b) Calcular a probabilidade de que o 4o Cliente seja o primeiro a conseguir
30%.
c) Calcular o desconto mdio.
a) 86,83%
b) 9,65%
c) 12,5%
5. Um banco pretende aumentar a eficincia de seus caixas. Oferece um prmio de
R$150,00 para cada cliente atendido alm de 42 clientes por dia. O banco tem
um ganho operacional de R$ 100,00 para cada atendimento alm de 41. As
probabilidades de atendimento so:
N de clientes
At 41 42
43
44
45
46
Probabilidade
0,88
0,06
0,04
0,01
0,006
0,004
Qual a esperana de ganho do banco se o sistema for implantado?
R: R$7,30
6. Sabe-se que uma moeda mostra a face cara quatro vezes mais do que a face
coroa, quando lanada (MOEDA VICIADA). Esta moeda lanada quatro
vezes. Seja X: o nmero de caras que aparece, determine:
R: E(X)=3,20
a) E(X)
R: VAR(X)= 0,64
b) Desvio Padro de (X)
c) P(X2)
R: 0,9728
d) P(1 X <3)
R: 0,1792

7. Sejam X: anos de experincia em vendas


Y: unidades dirias vendidas
Y
1
2
3
X
2
0,14
0,04
0,02
4
0,04
0,18
0,08
6
0,02
0,26
0,12
8
0
0,02
0,08
Dada a tabela da distribuio conjunta de X e Y, calcular cov(X, Y) e o coeficiente de
R: 0,68
e
0,53
correlao ()
8. Num posto de vistoria de carros foram examinados 10 veculos, sendo que o
numero de irregularidades nos itens de segurana (X) e o nmero de
irregularidades nos documentos (Y) so dados no quadro a seguir. Calcule o
coeficiente de correlao () entre as Variveis X e Y.
Veculos
1
2
3
4
5
6
7
8
9
10
X
0
1
2
0
1
2
0
2
1
2
Y
0
1
0
1
1
1
0
2
2
2
R:
0,4694
9. Seja X: renda familiar em R$1000,00
Y: nmeros de carros na famlia. Considere o quadro a seguir:
X
2
3
4
2
3
3
4
2
2
Y
1
2
2
2
1
3
3
1
2
Calcular:
a) E(2X-3Y)
R: 0,1

3
2

56

b) COV(X, Y)
c) coeficiente de correlao ()

R: 0,28
R: 0,533

57

PARTE IX

Distribuio Tericas De Probabilidade De


Variveis Aleatrias Discretas
DISTRIBUIO BINOMIAL
Trata-se de um modelo que d a probabilidade do nmero de sucessos quando
so realizadas n provas do mesmo tipo.
Cada experimento admite dois resultados:
Sucesso com probabilidade p
Fracasso com probabilidade 1 p = q
Hipteses:
So realizadas n provas do mesmo tipo (Idnticas);
Cada prova admite dois resultados possveis: Sucesso ou Fracasso;
Os resultados das provas so independentes;
A varivel X tem distribuio binomial, com parmetros n e p, e indicaremos
pela notao X = B( n , p )
Frmula:
P(X = x) = p x .q n x .C n , x
Onde:
n = nmero de provas ou repeties;
x=nmero de Sucessos;
n-x = nmero de Fracassos;
p = probabilidade de sucesso em cada prova;
q = 1-p a probabilidade de Fracasso em cada prova;
C n , x = nmero de combinaes de n elementos tomados x a x
Parmetros da distribuio Binomial
Esperana:
E(x) = (x) = n . p
Varincia
Var(x) = 2(x) = n . p . q

DISTRIBUIO GEOMTRICA
Seja X nmero de tentativas necessrias ao aparecimento do primeiro sucesso.
Assim a varivel x tem distribuio geomtrica:
Frmula:
P(X = x) = q x 1 . p
Onde:
x= nmero de tentativas necessrias ao aparecimento do primeiro sucesso;
p = probabilidade de sucesso;
q = a probabilidade de Fracasso;
Parmetros da distribuio Geomtrica.
1
Esperana:
E(x) = (x) =
p

58

Varincia

Var(x) = 2 (x) =

q
p2

DISTRIBUIO DE PASCAL
Suponha que um experimento aleatrio repetido independentemente at que um
evento A ocorra pela r-sima vez.
Seja X: nmero de repeties necessrias para que A ocorra pela r-sima vez.
Assim a varivel x tem distribuio de Pascal:
P(X = x) = p r .q x r .C x 1

Frmula:

r 1

Onde:

x = nmero de repeties;
r = nmero de sucessos;
p = probabilidade de sucesso;
q = a probabilidade de Fracasso;
Parmetros da distribuio de Pascal
r
Esperana:
E(x) = (x) =
p
rq
Varincia:
Var(x) = 2 (x) = 2
p

DISTRIBUIO HIPERGEOMTRICA
Consideremos uma populao com N elementos das quais r tm uma
determinada caracterstica. Retiramos dessa populao, sem reposio, uma amostra de
tamanho n.
Seja X: nmero de sucessos na amostra
Assim a varivel x tem distribuio Hipergeomtrica:
Combinaes sucessos

Cr ,x .C N r
Frmula:

P(X = x) =

Combinaes fracassos

n x , 0 x n e
C N ,n

xr

Combinaes da Amostra

Onde:

x = nmero de sucessos da amostra;


r = caracterstica da populao;
N = tamanho da populao;
n = tamanho da amostra;
Parmetros da distribuio Hipergeomtrica
Esperana:
E(x) = (x) = n.p
( N n)
Varincia:
Var(x) = 2 (x) = n. p (1 p )
( N 1)

Onde: p =

r
n

59

DISTRIBUIO DE POISSON
Consideremos a probabilidade de ocorrncia de sucessos em um determinado
intervalo.
Hipteses:
H1: A probabilidade de uma ocorrncia em um intervalo t ( S, ou...) constante e
proporcional ao tamanho do intervalo. Isto :

P( X = 1,t ) = t

H2: A probabilidade de mais de uma ocorrncia em um intervalo t ( S, ou...) igual


a zero. Isto :

P( X > 1,t ) = 0

H3: O nmero de ocorrncias constituem varivel aleatrias independentes.


Seja X: nmero de sucessos no intervalo, ento:
x .e
Frmula:
P(X = x) =

x!

Onde:

= coeficiente de proporcionalidade, ou taxa de freqncia por unidade de


tempo, rea, etc.
t = tempo, rea;
e = base dos logaritmos naturais;
x = nmero de ocorrncias (sucessos)
= .t

Parmetros da distribuio de Poisson


Esperana:
E(x) = (x) = .t
Varincia:
Var(x) = 2 (x) = .t

EXERCCIOS
1. Uma moeda jogada 10 vezes. Calcule as seguintes probabilidades:
a) de dar pelo menos duas caras;
R: 98,93%
b) de ocorrer seis caras;
R: 20,51%
c) de no dar nenhuma coroa;
R: 0,098%
d) de dar pelo menos uma coroa;
R: 99,90%
e) de no dar 5 caras e 5 coroas
R: 75,39%
2. Admitindo que o nascimento de meninos e meninas sejam iguais, calcule a
probabilidade de um casal com seis filhos ter quatro filhos homens e duas
mulheres.
R: 23,44%

60

3. Qual a probabilidade de que no 25 lanamento de um dado ocorra a face 4 pela


5 vez?
R: 3,56%
4. Uma urna tem 20 bolas pretas e 30 brancas. Retira-se 25 bolas com reposio.
Qual a probabilidade de que:
a) 2 sejam pretas?
R: 0,038%
b) Pelo menos 3 sejam pretas?
R: 99,96%
5. Numa estrada h 2 acidentes para cada 100 km. Qual a probabilidade de que em;
a) 250Km ocorram pelo menos 3 acidentes?
R: 87,53%
b) 300Km ocorram 5 acidentes?
R: 16,06%
6. A probabilidade de um arqueiro acertar um alvo uma nica flecha de 0,20.
Lana 30 flechas no alvo. Qual a probabilidade de que:
a) exatamente 4 acertem o alvo?
R: 13,25%
b) pelo menos 3 acertem o alvo?
R: 95,58
7. O pessoal de inspeo de qualidade afirma que os rolos de fita isolante
apresentam, em mdia uma emenda a cada 50 metros. Admitindo-se que a
probabilidade do nmero de emendas dada pela Poisson, calcule as
probabilidades;
a) de nenhuma emenda em um rolo de 125 metros.
R: 8,21%
b) De ocorrer no mximo duas emendas em um rolo de 125 metros.
R: 54,40%
c) De ocorrer pelo menos uma emenda em um rolo de 100 metros.
R: 86,47%
8. Admitindo que X tem distribuio de probabilidade de Poisson, encontre as
probabilidades:
a) P(X=5) quando = 3,0
R: 10,08%
b) P(X 2) quando = 5,5)
R: 8,84%
c) P(X 4) quando = 7,5)
R: 5,91%
d) P(X = 8) quando = 4,0
R: 2,98%
9. Sabe-se que 20% dos animais submetidos a um certo tratamento no
sobrevivem. Se esse tratamento foi aplicado em 20 animais e se X o nmero de
no sobreviventes:
a) qual a distribuio de X?
Binomial = B(20 ; 0,2)
b) calcular a E[X] e Var [X]
R: E[X] = 4
Var[X]
c) calcular P(2 < X 4)
R : 42,36%
d) calcular P(X 2)
R = 93,08%
10. A experincia mostra que de cada 400 lmpadas, 2 queimam ao serem ligadas.
Qual a probabilidade de que numa instalao de:
a) 600 lmpadas no mnimo se queimem?
R: 57,68%
b) 900 lmpadas, exatamente se queimem?
R: 4,63%
11. O nmero de mortes por afogamento em fins de semana, numa cidade praiana
de 2 para cada 50.000 habitantes. Qual a probabilidade de que em:
61

a) 200.000 habitantes ocorram 5 afogamentos


b) 112.500 habitantes ocorram pelo menos 3 afogamentos?

R: 9,16%
R: 82,64%

12. Numa urna h 40 bolas brancas e 60 bolas pretas. Retiram-se 20 bolas. Qual a
probabilidade de que ocorram no mnimo 2 bolas brancas, considerando as
extraes:
b) sem reposio;
R: 99,98%
c) com reposio.
R: 99,94%
13. Uma urna contm 10 bolas brancas e 40 pretas.
a) Qual a probabilidade de que a 6 bola retirada com reposio, seja a 1 bola
branca?
R: 6,55%
b) Qual a probabilidade de que de 16 bolas retiradas, sem reposio, ocorram 3
brancas?
R: 29,33%
c) Qual a probabilidade de que a 15 bola extrada com reposio seja a 6 branca?
R: 1,72%
d) Qual a probabilidade de que em 30 bolas retiradas com reposio, ocorram no
mximo 2 brancas?
R: 4,41%
14. A mdia de chamadas telefnicas numa hora trs. Qual a probabilidade de:
a) Receber exatamente trs chamada numa hora?
R: 22,41%
b) Receber quatro ou mais chamadas em 90 minutos?
R: 65,8%
15. Certo posto de Bombeiros recebe em mdia trs chamadas por dia. Calcular a
probabilidade de:
a) receber quatro chamadas num dia;
R: 16,8%
b) receber trs ou mais chamadas num dia.
R: 57,67%
16. Uma loja atende em mdia dois cliente por hora. Calcule a probabilidade de em
uma hora:
a) atender exatamente dois cliente;
R: 27%
b) atender trs clientes.
R: 18%
17. Suponha 400 erros de impresso distribudos aleatoriamente em um livro de 500
pginas. Encontre a probabilidade de que dada pgina contenha:
a) nenhum erro;
R: 44,9%
b) exatamente dois erros.
R: 14,37%
18. Se 5% das lmpadas de certa marca so defeituosas, ache a probabilidade de
que, numa amostra de 100 lmpadas, escolhidas ao acaso, tenhamos:
a) nenhuma defeituosa;
R: (0,95)100
100

b) trs defeituosas;
R: (0,05) 3 (0,95) 97
3

62

19. A probabilidade de um atirador acertar uma alvo de


qual a probabilidade de:
10. acertar exatamente dois tiros?
11. no acertar nenhum tiro?

1
. Se ele atirar seis vezes,
3

R: 32,92%
R: 8,78%

20. Em um teste do tipo certo-errado, com 100 perguntas, qual a probabilidade de


uma aluno, respondendo s questes ao acaso, acertar 70% das perguntas?
100
1 100

R:
2 70

63

PARTE X

Distribuio Tericas De Probabilidade De


Variveis Aleatrias Contnuas
1. Introduo
Podemos dizer que uma varivel aleatria contnua aquela que assume valores
em um intervalo da reta real dos nmeros reais.
Por definio, uma varivel aleatria X contnua em IR se existir uma funo

f(x), tal que:


1. f ( x) 0 (no negativa)

2.

f ( x)dx = 1 .

Definio:
Seja X um v.a. contnua. A distribuio de probabilidade ou funo de

densidade de probabilidade (fdp) de X ser, ento, uma funo f(x) tal que, para
quaisquer dois nmeros a e b com a b,
b

P(a X b) = f ( x)dx
a

Isto , a probabilidade de X ter um determinado valor no intervalo [a, b] rea contida


entre o intervalo e abaixo da curva da funo de densidade, conforme ilustrado na
Figura.

Figura 1: A rea sobre a curva expressa a funo densidade de probabilidade de uma fdp.

64

Proposio:
Se X uma varivel aleatria contnua, ento qualquer nmero c, P(X=c)=0.
Alm disso, para quaisquer dois nmeros a e b com a< b,

P ( a X b) = P ( a < X b ) = P ( a X < b ) = P ( a < X < b )


Funo Distribuio Acumulada
A funo distribuio acumulada (fdc) F(x) de uma va discreta X fornece, para qualquer
nmero especfico x, a probabilidade P(X x). Ela obtida somando-se fmp p(y) para
todos os valores que satisfaam y x. A fdc de uma varivel aleatria contnua fornece
as mesmas probabilidades P(X x) e obtida pela integrao da fdp f(y) entre os limites
- e x.

Definio:
A funo distribuio acumulada F(X) de uma va contnua X definida para
cada nmero x por
x

F ( x) = P( X x) =

f ( y )dy,

Para cada x, F(x) a rea abaixo da curva de densidade esquerda de x.

A importncia da fdc neste caso, assim cimo no das vas discretas, que as
probabilidades dos diversos intervalos podem ser calculadas por uma frmula ou lidas
de uma tabela de F(x).
Proposio:
Seja X uma va contnua com fdp f(x) e fdc F(x). Ento, para qualquer nmero a,
P( X > a) = 1 F (a )
e, para quaisquer dois nmeros a e b com a < b,
P (a X b) = F (b) F (a )

Usando o Teorema Fundamental do Clculo temos:

Proposio:
Se X for uma va contnua com fdp f(x) e fdc F(x) ento, para qualquer x em que a
derivada F(x) existir, F(x)=f(x).

65

Propriedades de F(x)
1.0 F ( x) 1;
2. lim F ( x) = 0;
x

3.lim F ( x) = 1;
x

4.F ( x) no-decrescente, isto , x1 x2 F ( x1 ) F ( x2 );


5.F ( x2 ) F ( x1 ) = P( x1 X x2 ), x2 > x1

Parmetros de uma Varivel Aleatria Contnua


3. Esperana Matemtica:
Pode ser entendida como um centro de distribuio de probabilidade.
E ( X ) = ( x) =

x f ( x)dx

4. Varincia Matemtica:
Definio:
A varincia de uma varivel aleatria contnua X com fdp f(x) e mdia
VAR( X ) = x2 = E ( X 2 ) [ E ( X )]2
onde:
E( X ) =
2

f ( x)dx

O desvio Padro (DP) de X x = V ( x)

Distribuio
Contnuas

Conjunta

de

Duas

Variveis

Aleatrias

A probabilidade de o valor observado de uma va contnua X estar em um


conjunto unidimensional A (como um intervalo ) obtida integrando-se a fdp f(x) em
relao ao conjunto A. De forma similar, a probabilidade de o par (X, Y) de vas

66

contnuas estar em um conjunto bidimensional A (como um retngulo) obtida pela


integrao de uma funo denomida funo de densidade conjunta.

Definio
Seja X e Y vas contnuas. Ento, f(x, y) a funo de densidade de probabilidae de

probabilidade conjunta de X e Y se, para qualquer conjunto bidimensional, A

P[( X , Y ) A] = f ( x, y )dxdy
A

Em particular, se A for o retngulo bidimensional {( x, y ) : a x b, c y d } , ento


b d

P[( X , Y ) A] = P(a X b, c Y d ) = f ( x, y )dydx


a c

Para f(x,y) ser candidata a uma fdp conjunta, deve satisfazer f ( x, y ) 0


f ( x, y )dxdy = 1 . Podemos imaginar f(x,y) como especificao de uma superfcie de

altura f(x,y) acima do ponto (x,y) em um sistema tridimensional. Ento P[( X , Y ) A]


o volume abaixo dessa superfcie e acima da regio A, anlogo rea abaixo de uma
curva no caso unidimensional.

Definio:
As funes densidade de probabilidade marginal de X e Y, representadas
respectivamente por f x ( x) e f y ( y ) , so dadas por
f X ( x) =

f ( x, y )dy

para < x <

f ( x, y )dx

para < y <

fY ( y ) =

Variveis Aleatrias Independentes

Definio:
Duas variveis aleatrias X e Y so independentes se, para cada par de valores x e y,
f ( x, y ) = f X ( x) fY ( y ) quando X e Y so contnuas. Caso contrrio so denominadas

dependentes.

67

Distribuies Condicionais

Definio:
Sejam X e Y duas vas contnuas com fdp conjunta f(x,y) e fdp marginal de X, f x ( x) .
Ento, para qualquer valor x de X para o qual f x ( x) > 0 , a funo densidade de

probabilidade condicional de Y dado que X=x,


f y / x ( y / x) =

f ( x, y )
f x ( x)

< y <

Covarincia
Quando duas variveis aleatrias X e Y no so independentes, geralmente de
interesse avaliar quo fortemente esto relacionadas uma com a outra.

Definio:
A Covarincia entre duas vas X e Y
Cov( X , Y ) = E[( X x )(Y y )] =

(x

)( y Y ) f ( x, y )dxdy

X, Y contnuas.

Correlao
O coeficiente de correlao ( ) entre X e Y, representado por Corr (X,Y), X ,Y , ou
simplismente , definido por

cov( X , Y )
x y

Tambm:

x, y
x y

Onde:

1 1 +1

68

PARTE XI

Distribuio Tericas De Probabilidade De


Variveis Aleatrias Contnuas
1. DISTRIBUIO UNIFORME
Uma varivel aleatria contnua X tem distribuio uniforme de probabilidade
no intervalo [a ; b], se sua fdp dada por:
k se a x b
f ( x) =
0 se x < a ou x > b
Graficamente:

O valor de k :
b

kdx = 1
a

Logo:
1
se a x b

f ( x) = b - a
0 se x < a ou x > b
Parmetros:
ESPERANA MATEMTICA: A Esperana de X o ponto mdio do intervalo
b+a
[a, b]:
E( X ) =
2

VARINCIA MATEMTICA: A varincia de X dada por:

VAR( X ) =

(b a ) 2
12

69

2. DISTRIBUIO NORMAL
O nome normal deve-se ao fato de que muitas distribuies de freqncias de
erros de observaes e mensuraes podem ser descritas por uma distribuio dessa
natureza.
A distribuio de probabilidade normal tem importncia na inferncia estatstica
por trs razes:
As medidas produzidas em diversos processos aleatrios seguem esta
distribuio;
Probabilidades normais podem ser usadas freqentemente como aproximaes
de outras distribuies de probabilidade, como a Binomial e de Poisson;
As distribuies estatsticas da amostra, como a mdia e a proporo, seguem
freqentemente a distribuio normal, independentemente da distribuio da populao.
A funo f(x) chamada funo densidade de probabilidade (f.d.p.) de uma
distribuio normal definida por:
f ( x) =

1 x

, para < x < +

O grfico de f(x) ;

As principais caractersticas dessa funo so:


a) o ponto mximo de f(x) o ponto X = ;
b) os pontos de inflexo da funo so: X = + e X = ;
c) a curva simtrica com relao a ;
d) E(X) = e VAR(X) = 2

Se quisermos calcular a probabilidade indicada na figura, devemos fazer:


b

P ( a x b) =

a 2

1 x

dx

70

Embora a curva normal esteja definida de menos infinito (-) mais infinito
(+), pode-se observar que quase a totalidade dos casos cai entre -3 e +3 desvios
padro, ou seja, 97,74% dos casos. Este fato ilustrado na figura a seguir.

Essa integral requer um trabalho computacional em sries para resolv-la, pois


de forma analtica a mesma se torna invivel. Para solucionarmos este problema usamos
uma transformao de variveis que nos conduz chamada distribuio normal
padronizada, ou distribuio normal reduzida. Usaremos a seguinte notao:
X : N ( , 2 )
Para transformao de variveis , consideraremos a seguinte transformao
Zi =

linear de X para Z:

Xi

Logo, para encontrarmos as reas (probabilidade) sob a curva f(x), mudam-se


suas abscissas para Z, determinando-se a probabilidade com auxilio de uma tabela
normal padronizada. Assim:

P ( a < x < b ) = P ( z1 < Z < z 2 )


Onde:
Z1 =

Z2 =

71

72

3. DISTRIBUIO EXPONENCIAL
A distribuio exponencial freqentemente usada em estudos de confiabilidade
como sendo o modelo para o tempo at a falha de um equipamento muito utilizado
para componentes eletrnicos.
O tempo de vida at a falha de um semicondutor pode ser modelado por uma
varivel aleatria exponencial com mdia de 40.000h, por exemplo.
A varivel X, que igual distncia entre contagens sucessivas de um processo
de Poisson, com mdia > 0, tem uma distribuio exponencial com parmetro .

Uma varivel aleatria X tem distribuio exponencial de probabilidade se a sua fdp


dada por:

e x se x 0
f ( x) =
0 se x < 0
A funo de distribuio acumulada de X, fdc, :

1 e x se x 0
F ( x) =
se
se x < 0
0
O grfico da f.d.p. de X :

P(T>t0) = e t0
P(Tt0)=1 e t0

Parmetros:
ESPERANA MATEMTICA: A Esperana de X o ponto mdio do intervalo
1
[a, b]:
E( X ) =

VARINCIA MATEMTICA: A varincia de X dada por:


VAR( X ) =

73

EXERCCIOS
1. A dureza de uma pea de ao pode ser pensada como uma varivel aleatria com
distribuio uniforme no intervalo de [50, 70] da escala de Rockwel segundo a
f.d.p. dada:
1

se 50 h 70
F(h) = 20
0 se h < 50 ou h > 70
Calcular a probabilidade de que uma pea tenha dureza entre 55 e 60.
R:
2. Uma varivel aleatria contnua X, com distribuio exponencial [0, +), tem
f.d.p. dada por:
k x
e se x 0
f ( x) = 2
0 se x < 0

a) calcular o valor de k.
R: K=2
3. O dimetro de um cabo eltrico uma varivel aleatria contnua com f.d.p.
dada por:

R:

k (2 x x 2 ) se 0 x 1
f ( x) =
0 se x < 0 ou x > 1
a) determinar K.
b) calcular a E(x) e Var(x).
c) calcular P(0 x )
a) K=3/2
b) 5/8 e 19/320

c) 5/16

4. A varivel aleatria X tem f.d.p. dada pelo grfico abaixo. Determinar:


a) P (X > 2)
f(x)
1
1
b) m tal que P(X > m) =
8
2
c) E(X)
d) Var (X)
0

R: a)

b) 2,58

c) 4/3

d) 8/9

5. Uma fbrica de TV determinou que a vida mdia dos tubos de sua fabricao
de 800 horas de uso contnuo e segue distribuio exponencial. Qual a
probabilidade de que a fabrica tenha de substituir um tubo gratuitamente, se
oferecer uma garantia de 300 horas de uso?
R:
0,3127

74

6. A varivel aleatria X tem f.d.p. dada por:


6( x x 2 ) para 0 x 1
f (X ) =
0 para x < 0 ou x > 1
Calcular P { 2 < x < + 2 )
R: 0,979264
K + 44 2 kx
se x 0
e

7. Sendo f(x) = 6

0 se x < 0
a) K;
b) P {8 3 < x < 10 + 6 )
R:
a) K=4
b) 0,00674

calcular

2e 2 x se x 0
representa a distribuio do ndice de acidez (X)
8. A f.d.p. f ( x) =
0 se x < 0
de um determinado produto alimentcio. O produto consumvel se este for
menor que 2. O setor de fiscalizao do I.A.L. aprendeu 30 unidades do mesmo.
Qual a probabilidade de que pelo menos 10% da amostra esteja imprpria para
consumo?
R:
0,02172
9. O dimetro X de uma cabo de TV uma varivel aleatria contnua com f.d.p.
3
2
(2 x x ) se 0 x 1
dada por : f ( x) = 2
0 se x < 0 ou x > 1
A probabilidade de um cabo sair com dimetro defeituoso dada por p1 = 0,5125
P(X0,5). Se 25 cabos so produzidos, qual a probabilidade de que:
a) Pelo menos 2 sejam defeituosos?
b) Exatamente 6 sejam defeituosos?
R:
a)0,97261
b) 0,1633
10. Foi feito um estudo sobre a altura de uma faculdade, observando-se que ela se
distribua normalmente com mdia de 1,72m e desvio Padro de 5cm. Qual a
porcentagem dos alunos com altura:
a) entre 1,67m e 1,77m?
b) entre 1,62m e 1,82m?
c) entre 1,57m e 1,87m?
d) acima de 1,90m?
R:
a) 68,27%
b) 95,45%
c) 99,73%
d) 0,02%
11. Um estudo das modificaes percentuais dos preos, no atacado, de produtos
industrializados, mostrou que h distribuio normal com mdia de 50% e
desvio padro de 10%. Qual a porcentagem dos artigos que:
a) sofreram aumentos superiores a 75%?
b) sofreram aumentos entre 30% e 80%?
75

R:

a) 0,626

b) 97,59%

12. O volume de correspondncia recebido por uma firma quinzenalmente, tem


distribuio normal com mdia de 4000 cartas e desvio padro de 200 cartas.
Qual a porcentagem de quinzenas em que a firma recebe:
a) entre 3600 e 4250 cartas?
b) menos de 3400 cartas?
c) mais de 4636 cartas?
R:
a) 87,16%
b) 0,14%
c) 0,07%
13. Numa fbrica foram instaladas 1000 lmpadas novas. Sabe-se que a durao
mdia das lmpadas de 800 horas e desvio padro de 100 horas, com
distribuio normal. Determinar a quantidade de lmpadas que duraro:
a) Menos de 500 horas.
b) Mais de 700 horas.
c) Entre 516 e 814 horas.
R:
a) 1,4
b) 841,3
c) 120,8
14. A durao de certo componente eletrnico pode ser considerada normalmente
distribuda com mdia de 850 dias e desvio padro de 45 dias. Calcular a
probabilidade de um componente durar:
a) entre 700 e 1000 dias;
b) mais de 800 dias;
c) menos de 750 dias;
d) exatamente 1000 dias.
R:
a) 1
b) 0,8665
c) 0,0132
d) 0
15. Uma fbrica de pneumticos fez um teste para medir o desgaste de sues pneus e
verificou que ele obedecia a uma distribuio normal de mdia 48.000 km e
desvio Padro de 2.000km. Calcule a probabilidade de um pneu escolhido ao
acaso:
a) Durar mais de 46.000km;
b) Durar menos de 52.000km
c) Durar entre 45.000 e 50.000km.
16. Suponha que o dimetro mdio de vida dos parafusos produzidos por uma
fbrica seja de 0,25 polegadas, e o desvio padro de 0,02 polegadas. Um
parafuso considerado defeituoso se seu dimetro maior que 0,28 polegadas
ou menor que 0,20 polegadas.
a) Encontre a porcentagem de parafusos defeituosos.
b) Qual deve ser a medida mnima para que tenhamos no mximo 12% de
parafusos defeituosos?
R:
a) 7,3%
b) 0,2266 polegadas
17. Se as interrupes no suprimento de energia eltrica ocorrem segundo uma
distribuio de Poisson com mdia de uma interrupo por mes (quatro
semanas), qual a probabilidade de que entre duas interrupes consecutivas haja
um intervalo de:
a) Menos de uma semana?
b) Entre 10 e 12 semanas?

76

R:

c) Exatamente um ms?
d) Mais de trs semanas?
a) 0,2212
b) 0,0323

c) 0

d) 0,4724

18. O tempo de atendimento numa oficina aproximadamente exponencial com


media de quatro minutos. Qual a probabilidade de:
a) espera superior a quatro minutos?
b) Espera inferior a cinco minutos?
c) Espera de exatamente quatro minutos?
R:
a) 0,3679
b) 0,7135
c) 0
19. Sabemos que o intervalo de ocorrncias sucessivas de uma doena contagiosa
uma varivel aleatria que tem distribuio exponencial com mdia de 100 dias.
Qual a probabilidade de no se ter registro de incidncia da doena por pelo
menos 200 dias a partir da data em que o ltimo caso for registrado?
R:
0,1353

77

PARTE X
Inferncia Estatstica: Estimativa por Ponto e
Intervalos De Confiana
10.1 - INTRODUO
O objetivo da Estatstica o de conhecer populaes por meio das informaes
amostrais. Como as populaes so caracterizadas por medidas numricas descritivas,
denominadas parmetros, a estatstica diz respeito realizao de inferncias sobre
esses parmetros populacionais desconhecidos. Parmetros populacionais tpicos so a
mdia ( X

ou

), o desvio padro ( S ou ) e a proporo (p) de determinado

evento populacional.
Os mtodos para realizar inferncias a respeito dos parmetros pertencem a duas
categorias:

Estimao : determinao de estimativas dos parmetros populacionais;

Teses de hipteses: tomada de deciso relativa ao valor de um parmetro

populacional.

10.2 Estimativa por Ponto


Quando com base em dados amostrais calculamos um valor da estimativa do
parmetro populacional, temos uma estimativa por ponto do parmetro considerado.
Assim, o valor da mdia amostral ( x ) uma estimativa por ponto da mdia
populacional ( ). De maneira anloga, o valor do desvio padro amostral (S) constitui
uma estimativa do parmetro ( ).

EXEMPLO:
Uma amostra aleatria de 200 alunos de uma universidade de 20.000 estudantes
revelou nota mdia amostral de 5,2. logo: x = 5,2 uma estimativa pontual da
verdadeira mdia dos 20.000 alunos.

78

O inconveniente de realizarmos estimativas pontuais refere-se ao fato de no


podermos julgar qual a possvel magnitude do erro que estamos cometendo, o que no
acontece para estimativas por meio de intervalos.
Um estimador obtido em funo dos elementos da amostra, sendo portanto,
uma varivel aleatria caracterizada por uma distribuio de probabilidades.
As

principais

caractersticas

de

um

estimador

referem-se

no-

tendenciosidade; consistncia e eficincia. Um estimador ser no-tendencioso,


quando o valor esperado da estatstica amostral for aproximadamente igual ao
parmetro que est sendo estimado. Um estimador dito consistente quando em termos
prticos, pode-se com amostras suficientemente grandes tornar o erro de estimao to
pequeno quanto se queira.

10.3 Estimativa por Intervalo


Uma estimativa por intervalo para um parmetro populacional um intervalo
determinado por dois nmeros, obtidos a partir de elementos amostrais, que se espera
contenham o valor do parmetro com dado nvel de confiana ou probabilidade de
(1-)%. Geralmente (1-)% = 90%, 95%, 97,5%, . . .
Se o comprimento do intervalo pequeno, temos um elevado grau de preciso
da inferncia realizada. As estimativas dessa natureza so denominadas de intervalos de
confiana.

EXEMPLOS:

O intervalo [1,60m; 1,64m] contm a altura mdia dos moradores do municpio X,

com um nvel de confiana de 95%;

Com 97,5% de confiana, o intervalo [8%; 10%] contm a proporo de analfabetos

da cidade Y;

O intervalo [37mm; 39mm] contm o desvio padro do comprimento de uma pea,

com 90% de confiana.

importante atentar para o risco do erro, quando se constri um intervalo de


confiana. Se o nvel de confiana de 95%, o risco do erro da inferncia estatstica

79

ser de 5%. Assim: se construssemos 100 intervalos, baseados em 100 amostra de


tamanhos iguais, poderamos esperar que 5 deles no iriam conter o parmetro.

10.4 Intervalo de Confiana para a Mdia Populacional quando a varincia


populacional conhecida

Seja uma populao caracterizada pela distribuio de uma v.a. X com os


seguintes parmetros: E(X) = e V (X) =2 . Devido ao erro experimental onipresente,
X uma v.a.; assim, o interesse recai em seu valor esperado.
Os mtodos de estimao por intervalo esto na maioria de suas vezes baseados
no pressuposto de que possa ser usada a distribuio normal de probabilidades. Esta

pressuposio garantida sempre que o nmero de dados amostrados maior que 30


(n 30).
Sejam x1, x2, x3, . . . xn elementos de uma amostra. Ento X: N(, 2). Sabe-se
que a x (mdia amostral) tem distribuio normal de mdia e desvio padro

seja, X : N ;

, ou

).

Portanto tem-se uma distribuio Z tal que Z =

x
seja uma distribuio
/ n

normal N(0, 1).


Assim, P ( Z / 2 Z Z / 2 ) = 1

IC (x, (1 )%) = P x Z
x + Z
= 1
n
n

Ou

Geometricamente:
= n-1

2
1-

Z
2

Z
2

t
Os intervalos de confiana mais frequentemente utilizados so os de 90%, 95% e
99%. No quadro a seguir so apresentados os valores de Z requeridos para alguns
intervalos.

80

Quadro 1: Valores tabelados da distribuio normal Z

: nvel de significncia

(1-): nvel de significncia

Z: distribuio Normal

0,20

0,80

1,28

0,15

0,85

1,44

0,10

0,90

1,65

0,05

0,95

1,96

0,025

0,975

2,24

0,01

0,99

2,58

10.5 Intervalo de Confiana para a Mdia Populacional quando a varincia


populacional desconhecida
Vimos anteriormente que o uso da distribuio normal na estimao da mdia
populacional garantido para qualquer amostra (n 30), sendo-o para uma pequena
amostra (n <30) somente se a populao for normalmente distribuda e for conhecido.
Vejamos agora como proceder para construir o IC para a mdia da populao
quando a varincia populacional (2) desconhecida, o que ocorre em geral, em

problemas prticos.
Quando desconhecemos 2, devemos estimar seu valor com base na amostra
disponvel. Neste caso, calcula-se a estimativa do desvio padro a partir da amostra por:
2

xi
1 n 2 i =1
2
S =
xi n
n 1 i =1

Assim, o desvio-padro obtido extraindo-se simplesmente

a raiz quadrada da

Varincia S .
Como o desvio-padro (s) uma varivel aleatria, a substituio simples e pura
do parmetro por s somente ser justificvel para amostras grandes, ou seja, n 30.
Em caso contrrio, introduz-se uma correo a qual consiste em usar a varivel tde

Student com n-1 graus de liberdade (g.l.) ao invs de Z.


Assim, uma distribuio t apropriada para inferncias sobre a mdia sempre
quando for desconhecida e a populao normalmente distribuda, qualquer que seja o
tamanho da amostra.

81

Seja ento, a varivel aleatria: t =

x
com n-1 g.l. ser dada por:
s/ n

S
IC ( , (1 a )%) = P x t .

n 1,
n
2

x + t

n 1,
2

10.6 Intervalo de Confiana para a proporo ou probabilidade


f p
pq
ento
Sabe-se a proporo () ser f N p,
para n>30. Sendo Z =
n
pq

P ( Z / 2 Z Z / 2 ) = 1 obtendo-se P f Z

pq
p f + Z
n

pq
= 1
n

Como no conhecemos e est se admitindo n>30, substitui-se nos limites do intervalo


o por f e o q por (1 f). Teremos ento:

P f Z

Sendo f =

f (1 f )
p f + Z
n

f (1 f )
= 1
n

x nmero de casos favorveis a situao analisada


=
n
nmero total de observaes

10.7 Intervalo de Confiana para a varincia da populao (2)

A distribuio Chi-quadrado
Seja Z1; Z2; . . . ; Zn, n variveis aleatrias normais padro. Definimos a varivel
aleatria chi- quadrado como:

2 = Z12 + Z 22 + + Z n2

A distribuio de chi-quadrado tem 1 parmetro, n, o qual chamado de graus


2
de liberdade. A media da distribuio de com n graus de liberdade : E ( 2 (n)) = n

A distribuio chi-quadrado no simtrica, ao contrrio do que sucede com as


distribuies Normais e t de Student. medida que o nmero de graus de liberdade
aumenta, a distribuio torna-se mais simtrica, como na figura:

82

f( X 2i )

= n-1

1-

X2inferior

X2

X2superior

Os valores da distribuio Chi-quadrado podem ser positivos ou nulos, mas no


podem ser negativos.
Para determinarmos o IC ao nvel de 1- para a varincia 2 da populao. Neste
caso

usar-se-

famlia

das

distribuies

chi-quadrado

2 .

Seja

ento

P( 2[ n 1;(1 / 2)] 2 n 1 2[ n 1; /2] ) = 1


Ser dada por:

S2 (n 1)
IC ( 2 , (1 a)%) = P 2
2

[ n 1; /2]

S2 (n 1)
= 1
2[ n 1;(1 /2)]

10.8 Intervalo de Confiana para o desvio padro da populao ()

Considerando a raiz quadrada positiva do I.C. de obtemos o I.C. de

(1 - )100% para , que ser:


S2 (n 1)
IC ( , (1 a)%) = P

2[ n 1; /2]

S2 (n 1)
= 1
2[ n 1;(1 / 2)]

Exerccios:
1. Considerando uma amostra de 4 elementos extrada de uma populao com
distribuio normal forneceu mdia de 8,2 e desvio padro de 0,4. Construir um
intervalo de confiana para a mdia dessa populao com 95% e 99% de
confiana. Interprete os resultados.

83

2. A amostra 9, 8, 12, 7, 6, 11, 6, 10,9, foi extrada de uma populao normal.


Construa um intervalo de confiana para a mdia ao nvel de 95% e 99% e
interprete os resultados.

3. A distribuio dos dimetros de parafusos por uma mquina normal, com


desvio padro igual a 0,17mm. Uma amostra de seis parafusos retirada ao acaso
da produo apresentou os seguintes dimetros (mm):
25,4

25,2

25,6

25,3

25,0

25,4

Construa um intervalo com 95% e 99% de confiana para o dimetro mdio da


produo dessa mquina.

4. Em uma indstria de cerveja, a quantidade de cerveja inserida em latas tem-se


comportado como uma varivel aleatria com mdia 350ml e desvio padro 3ml.
Aps alguns problemas na linha de produo, suspeita-se que houve alterao da
mdia. Uma amostra de 20 latas acusou mdia x =346ml. Construa um, I.C. para
o novo valor da quantidade mdia de cerveja inserida em latas, com nvel de
confiana 95%, supondo que no tenha ocorrido alterao no desvio padro.

5. Em uma amostra aleatria simples com 200 edifcios com 5 anos, em certa
cidade, 55% apresentaram problemas estticos relevantes aps entrega da obra.
Construir um IC para a proporo de edifcios da cidade que apresentaram
problemas estticos relevantes nos 5 primeiros anos. Use (1 ) = 95%.

6. A cronometragem de certa operao forneceu os seguintes valores para diversas


determinaes em segundos:
14 16

13

13

15

15

17

14

15

14

16

14

Construa um intervalo de 95% e 99% de confiana para o tempo mdio dessa


operao. Suponha que a distribuio seja normal.

7. Uma amostra de onze elementos extradas de uma populao com distribuio


normal, forneceu varincia S2 = 7,08. Construir um intervalo de 95% de
confiana para o desvio padro populacional. Interprete os resultados.

84

8. Na avaliao de dois sistemas computacionais, A e B, foram selecionadas 400


cargas de trabalho (tarefas) - supostamente uma amostra aleatria de infinidade
de cargas de trabalho que poderiam ser submetidas a esses sistemas. O sistema
A foi melhor que o B em 60% dos casos. Construir intervalos de confiana para
p (proporo de vezes que o sistema A melhor que o sistema B, considerando
todas as possveis cargas de trabalho) usando nveis de confiana de 95% e 99.
9. Foram realizadas 12 determinaes da densidade (g/cm3) de certo metal,
obtendo-se os resultados
19,0; 19,3; 19,1; 19, 3; 19,2; 19,4; 19,2;

19,3; 19,2; 19,0; 19,5; 19,3

Estimar a varincia e o desvio padro da verdadeira densidade atravs de um IC


de 95%

10. Sabe-se que a variao das dimenses fornecidas por uma mquina independem
dos ajustes dos valores mdios. Duas amostras de dimenses das peas
produzidas forneceram:
Amostra 01: 12,2

12,4

12,1

12

12,7

Amostra 02: 14,0

13,7

13,9

14,1

13,9

12,4

Estabelea um intervalo de 90% e 95% de confiana para a mdia e para o desvio


padro com que a mquina opera. Interprete os resultados.

85

PARTE XI
Teste de Hipteses
1. Introduo
Uma hiptese estatstica uma alternativa a respeito de um parmetro de uma
distribuio de probabilidade. Por exemplo, podemos formular a hiptese que a
produtividade diferente de 2,5 peas/hora. Formalmente isso escrito como:

H 0 : = 2,5 peas/hora

H1 : 2,5 peas/hora
H0 chamada de hiptese nula e H1 de hiptese alternativa. Nesse caso, a
alternativa formulada bilateral, mas tambm podem ser estabelecidas alternativas
unilaterais, tais como:

H 0 : = 2,5 peas/hora

H1 : < 2,5 peas/hora


Os testes de hiptese (T. H.) so uma das aplicaes das estatsticas mais usadas.
Via de regra, a hiptese nula feita com base no comportamento passado do
produto/processo/servios, enquanto a alternativa formulada em funo de alteraes /
inovaes recentes.
No ambiente atual de melhoria contnua, fcil entender a importncia dos
testes de hiptese: eles permitem confirmar a eficcia das medidas de melhoria
adotadas.
Ao testar a hiptese, toma-se uma amostra aleatria do sistema em estudo e se
calcula o parmetro desejado. Conforme o valor do parmetro, a hiptese nula ser
aceita ou rejeitada, a partir de procedimentos estatsticos.

2. Passos para realizar um T.H.


Passo 1: Definio da Hiptese
O primeiro passo o estabelecimento das hipteses: hiptese nula (H0) e hiptese
alternativa (H1).

86

Hiptese Nula (H0): um valor suposto para um parmetro. Se os resultados da


amostra no forem muito diferentes de H0, ela no poder ser rejeitada.

Hiptese Alternativa (H1): uma hiptese que contraria a hiptese nula,


complementar de H0. Essa hiptese somente ser aceita se os resultados forem muito
diferentes de H0.
Passo 2: Calcular a estatstica do Teste
o valor calculado a partir da amostra, que ser usado na tomada de deciso.
Uma maneira de tomar-se uma deciso comparar o valor tabelado com a estatstica do
teste. Para o caso de testes de mdias, a estatstica do teste a varivel padronizada Z:
Z calc =

n
Passo 3: Regio Crtica
O valor da estatstica do teste, no caso, o valor Z, calculado supondo que a
hiptese nula (H0) verdadeira. No entanto, o valor calculado pode estar associado a
uma probabilidade de ocorrncia muito baixa. Nesse caso, a hiptese nula deve ser
rejeitada e aceitamos a hiptese alternativa.
A regio crtica a regio onde H0 rejeitada. A rea da regio crtica igual ao
nvel de significncia (), que estabelece a probabilidade de rejeitar H0 quando ela
verdadeira.
Por exemplo, se utilizarmos o nvel de significncia de 5%, a probabilidade de
rejeitar H0 quando ela verdadeira igual a 5%. Na prtica, os valores usuais de alfa
so = 0,01;

0,05 ou 0,10.

Tipos de testes:
1. Unilateral direita

H 0 : = 0

H1 : > 0
2. Unilateral esquerda

H 0 : = 0

H1 : < 0

87

3. Bilateral

H 0 : = 0

H1 : 0

Passo 4: Regra de Deciso


Se o valor da estatstica do teste cair na regio crtica, rejeita-se H0. Ao rejeitar a
hiptese nula (H0) existe uma forte evidencia de sua falsidade.
Ao contrrio, quando aceitamos, dizemos que no houve evidencia amostral
significativa no sentido de permitir a rejeio de H0.

Passo 5: Concluso
Aceitar H0, implica que a hiptese nula no pode ser rejeitada!
Rejeitar H0 implica que temos evidencias estatsticas para rejeit-la com um risco
conhecido: .

3. Teste para a mdia populacional .


1. H 0 : = 0
a ) < 0

2. H1 : b) > 0
c)
0

3. Fixar o nvel de significncia ;


4. Determinar a regio de rejeio;
5. Calcular a estatstica de teste
CASO 1: O desvio Padro populacional conhecido
Para este caso, a estatstica dada por:
Z=

x 0

88

CASO 2: O desvio Padro populacional desconhecido


Para este caso, a estatstica dada por:
t=

x 0
s
n

6. Regras de deciso

(a) a) se z < z ou t < t , rejeita-se H 0 ;


(b) b) se z > z ou t > t , rejeita-se H 0 ;
(c) c) se |z |> z

ou |t |> t , rejeita-se H 0 .
2

Exemplo1:
Uma populao tem desvio padro conhecido, sendo igual a 5mm. Se uma amostra de
50 elementos, obtida dessa populao, tem mdia igual a 46mm; podemos afirmar que a
media dessa populao superior a 43mm, ao nvel de significncia de 1%?

Exemplo 2:
Um fabricante afirma que a tenso mdia de ruptura dos cabos produzidos por
sua companhia no inferior a 500kgf. Uma amostra de 7 cabos foi ensaiada, obtendose os resultados (em kgf)
490

495

480

493

475

478

485

Testar a firmao do fabricante, utilizando = 5%.


A seguir tem-se um resumo do procedimento de teste de hiptese por meio de
um organograma.

89

4. Teste para a diferena entre duas mdias populacionais


1 e 2
CASO 1: Os desvios Padres populacionais 1 e 2 so conhecidos.

1. H 0 : 1 2 = d 0
a ) 1 2 < d 0

2. H1 : b) 1 2 > d 0
c) d
1
2
0

3. Fixar o nvel de significncia ;


4. Determinar a regio de rejeio;
5. Calcular a estatstica de teste
Z cal =

( x1 x2 ) d 0

12
n1

22
n2

6. Regras de deciso

(a ) a) se z < z , rejeita-se H 0 ;
(b) b) se z > z , rejeita-se H 0 ;
(c) c) se |z |> z , rejeita-se H 0 .
2

Exemplo 3: Uma amostra de 100 vlvulas da Companhia A tem mdia xA = 1530h;


sendo A = 100h. Uma amostra de 70 vlvulas da Companhia B, tem xB = 1420h; sendo

B = 80h. Testar a hiptese de que as vlvulas da Companhia A em relao a B tem


durao mdia superior a 100h. Utilizar = 0; 01.

CASO 2: Os desvios Padres populacionais 1 e 2

so desconhecidos e

supostamente iguais.

1. H 0 : 1 2 = d 0

90

a ) 1 2 < d 0

2. H1 : b) 1 2 > d 0
c) d
1
2
0

3. Fixar o nvel de significncia ;


4. Determinar a regio de rejeio;
5. Calcular a estatstica de teste

t=

( x1 x2 ) d 0

1 1
s 2p +
n1 n2

Onde:
s 2p =

(n1 1) s12 + (n2 1) s22


n1 + n2 2

6. Regras de deciso

(a) a) se t < t , rejeita-se H 0 ;


(b) b) se t > t , rejeita-se H 0 ;
(c) c) |t |> t , rejeita-se H 0 .
2

Exemplo 4:
Dois tipos de solues qumicas foram ensaiados para se determinar os pH. Os
resultados obtidos foram:

soluo A:

7,50

7,54

7,51

7,53

7,50

soluo B:

7,49 7,50

7,51

7,52

7,50

7,51

Testar a hiptese de que no existe diferena entre os pH mdios das duas


solues, supondo que os desvios padres populacionais so iguais. Usar = 0; 05.

CASO 3: Os desvios Padres populacionais 1 e 2

so desconhecidos e

supostamente diferentes.
1. H 0 : 1 2 = d 0
a ) 1 2 < d 0

2. H1 : b) 1 2 > d 0
c) d
1
2
0

91

3. Fixar o nvel de significncia ;


4. Determinar a regio de rejeio;
5. Calcular a estatstica de teste
t=

( x1 x2 ) d 0
s12 s22
+
n1 n2

Esta estatstica t tem distribuio t de Student com v graus de liberdade, onde

v=

s12 s22
+
n1 n2
2

s12 s22

n1 + n2
n1 1 n2 1

6. Regras de deciso

(a) a) se t < t , rejeita-se H 0 ;


(b) b) se t > t , rejeita-se H 0 ;
(c) c) |t |> t , rejeita-se H 0 .
2

Exemplo 5:
Uma mesma distancia foi medida 5 vezes por certo instrumento, antes e aps
sofrer uma calibrao.
antes: 100,8 101,3 100,6 99,5 100,1
depois: 100,5 100,4 100,5 100,3 100,3
Testar a hiptese de que no existe diferena entre os resultados obtidos antes e
aps a calibrao do instrumento. Usar = 5%.

CASO 4: Os dados so emparelhados.


Este critrio deve ser usado quando os dados esto relacionados dois a dois de
acordo com algum critrio.

1. H 0 : 1 2 = d 0
a ) 1 2 < d 0

2. H1 : b) 1 2 > d 0
c) d
1
2
0

92

3. Fixar o nvel de significncia ;


4. Determinar a regio de rejeio;
5. Calcular a estatstica de teste
t=

Onde s =

(d

d )2

n 1

d=

d d0
s
n

d
n

d i = x1i x2i

Sendo que di representa a i-sima diferena entre duas observaes emparelhadas.

6. Regras de deciso

(a) a) se t < t , rejeita-se H 0 ;


(b) b) se t > t , rejeita-se H 0 ;
(c) c) |t |> t , rejeita-se H 0 .
2

Exemplo 6: Dois operrios determinaram os pesos (em g) das impurezas contidas em 6


amostras de certo produto qumico, obtendo os resultados

Amostras

Operrio A

10,1

10,4

10,2

10,5

9,9

10,0

Operrio B

9,8

10,0

10,1

10,0

10,1

9,5

Pode-se concordar com a hiptese de que no existe diferena entre as


determinaes dos dois operrios, no nvel de significncia de 1%?

5.

Teste para a varincia populacional

1. H 0 : 2 = 2 0
a ) 2 < 02

2. H1 : b) 2 > 02
c) 2 2
0

3. Fixar o nvel de significncia ;

93

4. Determinar a regio de rejeio;


5. Calcular a estatstica de teste

2 =

(n 1) s 2

02

6. Regras de deciso
(a ) a ) se 2 < 21 , rejeita-se H 0 ;
(b) b) se 2 > 2 , rejeita-se H 0 ;
(c) c) se 2 < 21 , ou 2 > 2 , rejeita-se H 0 .
2

Exemplo 7:
As chapas de ao produzidas por certa indstria tm uma especificao tal que a
varincia de suas espessuras (em mm) no deve ser superior a 0,0009mm2. Uma
indstria de 10 chapas tem espessura (em mm):

3,15

3,18

3,15

3,12

3,14

3,13

3,17

3,16

3,15

3,16

Testar a hiptese de que a varincia est dentro da especificao desejada,


usando = 0,05.

6.

Teste

para

populacionais 1 e
2

igualdade

de

duas

varincias

22 .

1. H 0 : 12 = 22
a ) 12 < 22

2. H1 : b) 12 > 22
c) 2 2
1
2

3. Fixar o nvel de significncia ;


4. Determinar a regio de rejeio;
5. Calcular a estatstica de teste

94

F=

s12
s22

6. Regras de deciso

(a) a) se F < F1 , rejeita-se H 0 ;


(b) b) se F > F , rejeita-se H 0 ;
(c) c) se F < F1 , ou F > F , rejeita-se H 0 .
2

A distribuio F de Snedecor
Sejam as v.a. independentes v21 e v22 , ento:
F (v1 , v2 ) = Fv1 ,v2

v2

v
=
= 2 1
v

2
v1
2
v2

v2
A distribuio F de Snedecor depende de dois parmetros:

v1 e v2 ,

denominados, respectivamente de graus de liberdade do numerador e do denominador.

Notao: F F (v1 , v2 ) ou F Fv1 ,v2


Os valores de F (v1 , v2 ) tais que P( F F (v1 , v2 )) =
tabelas.
Exemplos: Encontrar os valores de F (v1 , v2 ) tais que:
1. P( F > F (3;5)) = 0, 05

so encontrados em

2. P( F > F (2; 4)) = 0, 05


3. P( F < F (4; 2)) = 0, 05
Para este ltimo caso, utiliza-se a frmula de recorrncia:
1
F1 (v1 , v2 ) =
P( F > F (v1 , v2 ))
E para os casos bilaterais:
F (v1 , v2 ) =
2

F1

1
(v1 , v2 )

Exemplo 8:
Foram testadas as durabilidades (em km) dos pneus das marcas A e B, obtendose para 5 pneus de cada marca os resultados:

marca A: 30000

32000

28000

26000

31000

marca B: 25000

30000

20000

21000

23000

95

Existe diferena significativa entre as varincias das durabilidades dos dois


pneus, no nvel de significncia de 10%?

7.

Teste para a proporo populacional p .

1. H 0 : p = p0
a ) p < p0

2. H1 : b) p > p0
c) p p
0

3. Fixar o nvel de significncia ;


4. Determinar a regio de rejeio;
5. Calcular a estatstica de teste
Z=

p p0
p0 (1 p0 )
n

6. Regras de deciso

(a) a) se z < z , rejeita-se H 0 ;


(b) b) se z > z , rejeita-se H 0 ;
(c) c) se |z |> z , rejeita-se H 0 .
2

Exemplo 9:
Para determinarmos se certo tipo de tratamento para evitar a corroso eficiente,
45 tubos de um total de 50 apresentaram resultados satisfatrios. Sabe-se que o
tratamento considerado eficiente se pelo menos 95% dos tubos apresentarem resultado
satisfatrio. Qual a concluso, ao nvel de significncia de 5%?

Exerccios
1. Os indivduos de um pas apresentam altura mdia de 170cm e desvio padro de 3cm.
Uma amostra de 80 indivduos apresentou mdia de 168,5cm. Podemos afirmar, ao
nvel de 1%, que essa amostra formada por indivduos daquele pas? R. Rejeita H0.
2. Lana-se uma moeda 100 vezes e observa-se que ocorrem 35 caras. Baseado nesse
resultado, podemos afirmar, ao nvel de 5%, que a moeda no honesta? R. Rejeita H0.

96

3. O salrio dos empregados metalrgicos gira em torno de 4,5 salrios mnimos, com
desvio padro de 0,5 salrios. Uma industria contrata 75 empregados, com um salrio
mdio de 4,3 s.m. Ao nvel de 10% podemos afirmar que essa indstria paga salrios
inferiores a mdia?R. Rejeita H0.
4. Um exame padro de inteligncia tem sido usado por vrios anos com mdia de 85
pontos e desvio padro de 5 pontos. Um grupo de 40 estudantes e ensinado, dando-se
nfase a resoluo de testes. Se esse grupo obtm mdia de 88 pontos no exame, h
razoes para se acreditar que a nfase dada mudou o resultado do teste ao nvel de 10%?
R. Rejeita H0.
5. Um fabricante de droga medicinal afirma que ela 80% ou mais eficaz na cura de
uma alergia, em um determinado perodo. Em uma amostra de 200 pacientes, a droga
curou 150 pessoas. Testar ao nvel de 10% se a pretenso do fabricante legtima.
R. Rejeita H0.
6. Em 600 lanamentos de um dado, obteve-se o ponto seis em 123 lanamentos. Aos
nveis de 5 e 1% de significncia, h razo para se desconfiar de que o dado seja viciado
quanto ao ponto seis? R. Rejeita H0, No Rejeita H0.
7. A resistncia a quebra de um fio usado na fabricao de material moldvel necessita
ser no mnimo 100psi. Experincia passada indicou que o desvio padro da resistncia a
quebra foi de 2psi. Uma amostra de nove espcimes testada e a resistncia mdia a
quebra b98psi. A fibra deve ser julgada como aceitvel ao nvel de 5% de
significncia? R.Rejeita H0.
8. Um teste de impacto Izod foi feito em 20 corpos de prova de tubo de PVC. O padro
ASTM para esse material requer que a resistncia ao impacto Izod seja maior que
1, 0 ft lb / in. A mdia e o desvio padro obtidos da amostra foram x = 1,25 e s = 0,25,
respectivamente. Teste H0 : = 1,0 versus H1 : > 1,0, usando = 0,01 e retire
concluses. R. Rejeita H0.
9. Uma mquina automtica de enchimento usada para encher garrafas com detergente
lquido. Uma amostra aleatria de 20 garrafas resulta em uma varincia da amostra do
volume de enchimento de s2 = 0,0153. Se a varincia do volume de enchimento exceder
0,01, existir a uma proporo inaceitvel de garrafas cujo enchimento no foi completo
e cujo enchimento foi em demasia. H evidencia nos dados da amostra sugerindo que o
fabricante tenha um problema com garrafas cheias com falta e excesso de detergente?
R.No Rejeita H0.
10. Dois tipos de plsticos so adequados para por um fabricante de componentes
eletrnicos. A resistncia a quebra desse plstico importante. sabido que
1 = 2 = 1,0 psi. A partir de uma amostra aleatria de tamanho n1 = 10 e n2 = 12,
obtemos x1 = 162,5 e x2 = 155,0. A companhia no adotara o plstico 1, a menos que
sua resistncia media a quebra exceda aquela do plstico 2 por, no mnimo, 10 psi.
Baseados na informao da amostra, eles deveriam usar o plstico 1? Use = 5%.
R. Rejeita H0.

97

11. O dimetro de bastes de ao, fabricados em duas maquinas extrusoras diferentes,


esta sendo investigado. Duas amostras aleatrias de tamanho n1 = 15 e n2 = 17 so
selecionadas e as medias e as varincias das amostras so x1 = 8,73; s12 = 0,35; x2 =8,68
e s22 =0,4 respectivamente. Suponha 12 = 22 e que os dados sejam retirados de uma
populao normal. H evidencia que confirme de que as duas mquinas produzem
bastes com diferentes dimetros mdios? R. No Rejeita H0.
12. Camadas de xidos em pastilhas de semicondutores so atacadas em uma mistura de
gases, de modo a atingir a espessura apropriada. A variabilidade na espessura dessas
camadas de xidos uma caracterstica crtica da pastilha. Uma baixa variabilidade
desejada para as etapas subsequentes do processo. Duas misturas diferentes de gases
esto sendo estudadas para determinar se uma delas superior na reduo da
variabilidade de espessura das camadas de xido. Vinte pastilhas so atacadas com cada
gas. Os desvios padro das espessura de xido so s1 = 1; 96 angstrons e s2 = 2; 13
angstrons, respectivamente. H qualquer evidencia que indique ser um gs prefervel em
relao ao outro?
R. No rejeita H0.
13. Um cliente de uma torrefao de caf suspeita que os pesos dos pacotes que
deveriam ser de 500gr no esto corretos. Resolveu, ento retirar uma amostra dos
pesos de 16 pacotes:
510
495 500 501 499
503 500 495 492 499
499
497 495 499 501
(a) calcule o peso mdio e o desvio padro dos elementos da amostra;
R:499 ; 4, 21
(b) o cliente tem razo na suspeita? Use = 5%.
R. No tem razo. No rejeita.
14. Um artigo descreve os resultados de testes de tenso quanto a adeso em 22 corpos
de prova de liga. A carga no ponto de falha do corpo dada a seguir (em MPa).
19,8 18,5 17,6 16,7 15,8 15,4 14,1 13,6
8,8
7,5 15,4 15,4 19,5 14,9 12,7 11,9
A mdia amostral x = 13, 71 e s = 3,55 . Os dados sugerem
falha excede 10MPa? ( = 0,05)

11,9 11,4 11,4


11,4 10,1 7,9
que a carga mdia na
R: Sim. Rejeita H0.

15. Lana-se uma moeda 100 vezes e observa-se que ocorrem 40 caras. Baseado nesse
resultado, podemos afirmar, ao nvel de 5% que a moeda no honesta?
R. A moeda desonesta. Rejeita H0.
16. Uma pea ao ser fabricada, foi planejada de tal maneira que uma de suas dimenses
10cm. A varincia do processo produtivo de 0,0095cm2. Se uma amostra de 40 peas
fornece essa dimenso mdia igual a 10,05cm, devemos rejeitar a hiptese nula de que
x = 10cm, em favor da alternativa 10cm? (Usar = 0,05).
R. Rejeita H0.
17. Uma fbrica produz certo tipo de reguladores de presso. Esses reguladores so
produzidos para suportar uma presso de 20atm. Um ensaio realizado com uma
amostra de 7 reguladores de presso e verificou-se que as presses suportadas so (em
atm)
19,5 18,9 19,0 19,1 18,9 19,3 19,0

98

Com base no ensaio realizado, podemos concluir que a presso suportada na realidade
menor que 20atm? Usar = 0,01.
R. Rejeita H0.
18. Duas amostras de tubos de ao das marcas A e B foram ensaiadas e as resistncias
mdias obtidas foram de 40kgf/mm2 e 35kgf/mm2, com varincias de 5,0 e 4,0
(kgf/mm2)2,respectivamente. Sabendo-se que foram ensaiados 15 tubos de cada marca,
h evidencia, ao nvel de 1% de que a resistncia mdia dos tubos da marca A seja
maior que a de marcaB? Supor que as varincias populacionais sejam iguais.
R. Rejeita H0.
19. Duas mquinas A e B produzem parafusos, e sabe-se que as varincias dos
comprimentos dos parafusos so 25mm2 e 20mm2, respectivamente. Uma amostra de 40
parafusos da mquina A apresentou comprimento mdio de 30mm, enquanto que uma
amostra de 50 parafusos da mquina B apresentou mdia de 25mm. Existe uma
diferena significativa entre os comprimentos mdios dos parafusos fabricados pelas
duas mquinas, ao nvel de 5%?
R. Rejeita H0.
20. Foram ensaiadas vlvulas das marcas A e B, e verificou-se que os tempos de vida
(em h) foram
marca A:
1500 1450 1480 1520 1510
marca B:
1000 1300 1180 1250
Pode-se concluir, ao nvel de significncia de 1%, que o tempo mdio de vida das
vlvulas de marca A supera o de B em mais de 300h? Supor que os desvios padres
populacionais so diferentes.
R. No possvel. No Rejeita H0.

99

PARTE XII
ANOVA (Anlise de Varincia)
1. Introduo
Um problema que se apresenta com maior freqncia do que outro na anlise estatstica
o de avaliar se duas ou mais amostras diferem significativamente com relao a alguma
varivel.
Em funo disso, necessrio um mtodo estatstico para solucionar problemas dessa
natureza. Um dos mtodos mais utilizados para solucionar tais problemas conhecido como

anlise de varincia (ANOVA).


A anlise de varincia foi introduzida por Fischer e essencialmente um processo
baseado na decomposio da varincia total existente entre uma srie de observaes, em partes
que podem ser atribudas a causas conhecidas (fatores) e numa parte devida a causas
desconhecidas ou no suscetveis de controle.

Os fatores propostos podem ser de origem qualitativa ou quantitativa, mas a


varivel dependente necessariamente dever ser contnua.
A principal aplicao da ANOVA a comparao de mdias oriundas de grupos
diferentes, tambm chamados tratamentos, como por exemplo mdias histricas de
questes de satisfao, empresas que operam simultaneamente com diferentes
rendimentos, entre muitas outras aplicaes.
Existem dois mtodos para calcular-se a varincia: dentro de grupos (MQG) e a
varincia das mdias (MQR). Em uma Anava, calcula-se esses dois componentes de
varincia. Se a varincia calculada usando a mdia (MQR) for maior do que a calculada
(MQG) usando os dados pertencentes a cada grupo individual, isso pode indicar que
existe uma diferena significativa entre os grupos.

Variao entre os grupos (between-group variation): diferena entre a mdia de um


grupo em relao mdia global (tambm chamado de efeito de cada grupo).

Variao dentro dos grupos (within-group variation): diferena entre cada indivduo
em relao mdia das observaes do grupo ao qual pertence (tambm chamado de
erro de amostragem).

100

1.1

Suposies da Anlise de Varincia

Uma anlise de varincia s deve ser aplicada a um conjunto de dados quando este
atender

quatro

pressuposies:

aditividade,

independncia,

normalidade

homocedasticidade dos erros.


Para que a aditividade ocorra, os efeitos dos fatores que ocorrem no modelo
matemtico devem ser aditivos, ou seja, os efeitos

m , ti e eij devem ser aditivos.

Para que a independncia seja garantida os erros ou desvios eij, devidos ao efeito de
fatores no controlados, devem ser independentes para isso, necessrio que as parcelas
tenham sido escolhidas levando-se em considerao os critrios de aleatorizao,
delineamento e esquema amostral.
Para analisar a normalidade dos dados, estes devem se ajustar a uma distribuio
normal de probabilidades, ou seja, os erros ou desvios eij, devidos ao efeito de fatores
no controlados, devem possuir uma distribuio normal de probabilidade. Quando se
verifica a falta de normalidade dos dados, usamos transformaes matemticas, para
que os mesmos sejam normalmente distribudos.
Estudando a Homocedasticidade, ou seja, a homogeneidade de varincias,
verificaremos que os erros ou desvios eij devidos ao efeitos no controlados, devem
possuir uma varincia comum 2. Isto significa que a variabilidade das repeties de um
tratamento deve ser semelhante outros tratamentos, isto , os tratamentos devem
possuir varincias homogneas.
Constatada a hetorecedasticidade, devemos verificar se ela regular ou irregular.

Regular: devida a falta de normalidade dos dados;

Irregular: devida a grande variabilidade dos dados ou tratamentos.


Se a hetorecedasticidade for regular, devemos buscar transformaes tal que os dados

possam apresentar uma distribuio normal. As transformaes utilizadas so:

Transformao de raiz quadrada

Transformao angular - arcsen

Transformao logartmica -

x;
x / 100 ;

log x ou ln x

Se a hetorecedasticidade for irregular, devemos eliminar os dados ou tratamentos


discrepantes.

101

1.2

Testes de Hipteses

A retirada de concluses sobre uma ou mais populaes feita atravs da estimao de


parmetros ou pelos testes de hipteses. A estimao de parmetros (a mdia, o desvio padro,
etc.) feita por diversos mtodos. Quanto aos testes de hipteses, os mesmos so usados pelos
pesquisadores para decidir sobre a aceitao ou rejeio de hipteses. Hipteses so suposies
acerca dos parmetros de uma ou mais populaes.
Antes de aplicar tais testes, devemos formular as hipteses estatsticas. Podemos
considerar duas hipteses, so elas:
Para a analise consideraremos as seguintes hipteses:

H0: Os Tratamentos 1 = 2 = 3 = = k , ou seja, no existe efeito tratamento (Hiptese de


Nulidade).

versus
H1: Para pelo menos um Tratamento as mdias no so iguais, existe efeito tratamento
(Hiptese alternativa).
A rejeio de H0 implica a aceitao da hiptese alternativa H1.
Ao testarmos as hipteses podemos cometer dois tipos de erros, os quais so: rejeitar
H0, quando ela verdadeira (erro tipo I) ou aceitar H0, quando ela falsa (erro tipo II).
Dos dois tipos de erros o mais importante o do tipo I. A probabilidade de cometermos
o erro do tipo I chamada de nvel de significncia (). Os nveis de significncia mais usuais
so 5% e 1%.
O quadro a seguir resume a natureza dos erros envolvidos no processo de deciso
quando testamos as hipteses:

1.3

H0 Verdadeira

H1 Falsa

Rejeio H0

Erro do Tipo I

Deciso correta

Aceitao H0

Deciso correta

Erro Tipo II

A Tabela de Anlise de Varincia para fator nico

Como relatado anteriormente, a anlise de varincia uma tcnica que consiste na


decomposio da varincia total (e dos graus de liberdade) em partes atribudas a causas
conhecidas e independentes (fatores controlados) e a uma poro residual de origem
desconhecida e natureza aleatria (fatores no controlados).

102

Vamos admitir um fator nico (varivel independente) que subdividido em


tratamentos (nveis do fator). A varivel de estudo (varivel dependente) medida atravs de
amostras de cada tratamento. Eis a configurao desse tipo de experimento:
Tratamentos
Elem. da
amostra
1

.....

kj

x11

x 21

x 31

.....

x k1

x 12

x 22

x 32

.....

x k2

x 13

x 23

x 33

.....

x k3

ni

x 1n

x 2n

x 3n

.....

x kn

Somas

X1

X2

X3

.....

Xk

Total

Mdias

X1

X2

X3

Xk

i = 1, 2, 3, . . ., k
j = 1, 2, 3, . . . , ni
Assim xij denota o valor da j-sima observao sujeito ao i-simo tratamento.
A mdia dos valores observados no i-simo grupo ser
ni

xi =

ij

i =1

i = 1, 2,..., k

ni

E a mdia geral dada por:

X=

1 k ni
xij
n i =1 j =1

ou

X=

1 k
ni xi
n i =1

Em que n = ni o nmero total de observaes.


i =1

Neste caso queremos verificar se (Hipteses em estudo):


* A hiptese nula onde todos os tratamentos tenham mdias iguais, isto :

H 0 = 1 = 2 = 3 = = k
* E a alternativa de que pelo menos um par de mdias seja diferente:

H1 = p q

para p q

Assim, para avaliarmos se ocorre a variabilidade, construmos um quadro da


seguinte forma:

103

1- Calcula-se os graus de Liberdade para:


Tratamento (k) = k-1
Resduo: n k
Total: n 1

2- Calcula-se a constante, chamada de constante de correo;

k ni

xij
i =1 j =1

C=
n

3- Avalia-se a variabilidade total dos dados atravs da soma do quadrado total(SQTot);

k ni

SQTot = xij2 C
i =1 j =1
4 - Calcula-se a variao entre os tratamentos atravs da soma do quadrado dos
tratamentos (SQTrat);
2
ni

xij
i =1
SQTrat =
C
ni
i

5- Obtem-se a varincia residual, ou seja, soma do quadrado residuais (SQRes);


SQ Re s = SQTot SQTrat
6- Determina-se o Quadrado Mdio para os Tratamentos (QMTrat) e o Quadrado
Mdio Residual (QMRes);
QMTrat =

SQTrat
k 1

QM Re s =

SQ Re s
nk

Assim teremos o conhecido quadro de anlise de varincia:


Fonte de Variao

g.l.

Soma dos quadrados

Entre Tratamentos

k -1

SQTrat

QMTrat =

SQTrat
k 1

Dentro das amostras

n-k

SQRes

QM Re s =

SQ Re s
nk

n-1

SQTot

(Resduo)
Total

Quadrado Mdios

Teste F (Fcal)

Fcal =

QMTrat
QM Re s

104

Para testar a hiptese

H 0 = 1 = 2 = 3 = = k =

contra

H1 = p q

para p q , compara-se o valor do Fcalculado com o valor do Ftabelado a um certo nvel de


significncia. Assim:

Se Fcalculado F (tabelado), (*) - rejeitamos a hiptese H0 e verificamos ao nvel de %

de significncia que: Ti 0, para pelo menos um Tratamento, ou seja, existe efeito


Tratamento e eles so significativos.

Se Fcalculado < F (tabelado), (ns) - aceitamos a hiptese H0 e verificamos ao nvel de %

de significncia que: Ti = 0, ou seja, no existe efeito Tratamento e no ocorre diferena


significativa entre eles.

Exemplo:
Foi realizado um experimento para analisar o efeito de certo polmero na
resistncia da madeira. Foi testado 4 tipos de polmeros A;B;C e D em 3 amostras de
madeira. O quadro a seguir mostra a resistncia (kgf) obtida. Faa a anlise de varincia
para verificar se existe diferena significativa entre os polmeros.

1.4

25

35

41

60

32

28

35

67

27

33

38

59

A Comparao entre mdias

O teste F significativo, para mais que dois tratamentos, nos permite, apenas tirar
concluses muito gerais com relao ao comportamento dos tratamentos, indicando que
entre eles existem efeitos diferentes sobre a varivel analisada, nada nos informando
sobre quais os melhores (ou piores) tratamentos.
Para verificar esta diferena entre tratamentos, uma das maneiras a utilizao dos
procedimentos de comparaes mltiplas ou teste de comparaes de mdias.
Entre eles podemos citar: O teste t, Dunnett, Bonferroni, Scheff (contraste
ortogonais) e Tukey, Duncam, SNK, Scott-Knott (comparaes Mltiplas). Veremos
alguns deles.

105

1.4.1

Teste t de Student
J visto anteriormente nos testes de Hiptese, o teste t de Student serve para

testar mdias de dois tratamentos ou mdias de dois grupos de tratamentos (caso em que
o contraste tem mais de duas mdias envolvidas).
Quando aplicamos o teste t a um contraste qualquer, estamos interessados em
verificar se a estimativa do contrate difere ou no de zero ( valor que a constante deveria
assumir, se a hiptese de nulidade fosse verdadeira).
Ento, testamos H0: Y= 0

vs

H1: Y 0

Devemos indicar a significncia do teste, no valor de t calculado:


ns

- Teste no significativo no nvel de 5% de probabilidade;

*- Teste significativo no nvel de 5% de probabilidade;


**- Teste significativo no nvel de 1% de probabilidade;

1.4.2

O teste de Tukey
Serve para testar quaisquer dois contrastes entre duas mdias de tratamentos. O

nmero de contrastes que podem ser testados consiste no nmero de combinaes das
mdias, duas a duas. Assim, num experimento com 5 tratamentos, podemos testar at 10
contrastes. O teste exato quando temos o mesmo nmero de repeties nos
tratamentos.
um teste bastante rigoroso, e por isso, geralmente testado ao nvel de 5% de
probabilidade e atualmente um dos mais utilizados.

Aplicao do Teste:
Calcular a diferena mnima significativa do teste, representado por , da

i)

seguinte forma:

=q

QMRes
repeties

em que:

q a amplitude estudentizada, para uso no teste de Tukey, encontrada em tabelas, em


funo do nmero de tratamentos (na horizontal) e do nmero de graus de liberdade

do resduo ( na vertical);
QMRes Quadrado Mdio Residual da ANAVA;
ii)

Calcular as estimativas de contraste entre duas mdias - Y

| Yi |=| m k m 1 |

106

iii)

Comparar cada estimativa de contraste, em valor absoluto

( Y ) , com a

diferena mnima significativa ():


- Se Y , o teste significativo, o que indica que as duas mdias diferem entre si;
- Se Y < , o teste no significativo, o que indica que as duas mdias no diferem
entre si;
iv)

Monta-se a tabela de resultados.

Observao:
1 Para a aplicao do teste de Tukey, as mdias no precisam ser colocadas em ordem
decrescente de valores. No entanto, se utilizarmos a ordem decrescente, a aplicao do
teste a mais simples.
EXEMPLO:
1 Fazer o teste de comparao de mdias de Tukey para o exemplo anterior referente
ao efeito do polmero na resistncia de certa madeira.

1.4.3

Teste de Dunnett
Este teste utilizado quando as nicas comparaes que interessam ao

experimentador so aquelas entre um determinado tratamento padro ( Controle ou

testemunha) e cada um dos demais tratamentos.


Assim, um experimento com K tratamentos (um dos quais o tratamento padro)
permite a aplicao do teste a ( k- 1) comparaes.

Aplicao do Teste:
v)

Calcular a diferena mnima significativa do teste, representado por d, da


seguinte forma:
d = td 2

QMRes
repeties

em que:

td obtido na tabela, para uso no teste de Dunnett, em funo do nmero de graus de


liberdade de tratamentos (na horizontal) e do nmero de graus de liberdade do
resduo ( na vertical);
QMRes Quadrado Mdio Residual da ANAVA;
vi)

Calcular as estimativas de contraste entre duas mdias - Y

107

| Y1 |=| m 1 m controle |
| Y |=| m m
|
2

| Y

k 1

vii)

controle

|=| m k 1 m controle |

Comparar cada estimativa de contraste, em valor absoluto

( Y ) , com a

diferena mnima significativa (d):


- Se Y d , o teste significativo, o que indica que a mdia do Controle difere
significativamente da mdia do tratamento com ele comparado.
- Se Y < d , o teste no significativo, o que indica que a mdia do Controle no difere
significativamente da mdia do tratamento com ele comparado.
viii)

Indicar a significncia do teste no valor da estimativa do contraste Y .

Exemplo
1 Considerando o tratamento C como resistncia padro, fazer o teste de comparao
de mdias de Dunnett para o exemplo anterior referente ao efeito do polmero na
resistncia de certa madeira.

1.5

A Anlise de Varincia para Blocos.


Se a variao devida heterogeneidade nas unidades experimentais for muito

grande, de modo que a sensibilidade de deteco das diferenas nos tratamentos seja
reduzida por causa de um valor inflacionado da varincia, um plano melhor pode ser
bloquear a variao devida a essas unidades e, ento reduzir a variao extrnseca para
aquela calculada para blocos menores ou mais homogneos. Por exemplo, suponha que
estamos interessados em testar o efeito de trs catalisadores no rendimento de uma
reao. Digamos que realizamos o teste em 3 dias, fazendo cada um catalizador em dias
diferentes. Como a variao diria pode interferir na eficincia do catalizador, podemos
considerar cada dia como um bloco, e consequentemente diminuir o erro experimental.
O mais objetivo dos delineamentos de blocos aleatorizados aquele no qual
atribumos aleatoriamente cada tratamento uma vez para cada bloco. Tal esquema
experimental chamado de delineamento completamente aleatorizado em blocos, e
cada bloco constitui uma nica rplica dos tratamentos.

108

Vamos admitir um fator nico (varivel independente) que subdividido em


tratamentos (nveis do fator) dentro dos blocos. A varivel de estudo (varivel dependente)
medida atravs de amostras de cada tratamento. Eis a configurao desse tipo de experimento:
BLOCOS

Totais

TRATAMENTOS

...

...

x11

x 12

...

x 1j

...

K1J

T1

x 21

x 22

...

x 2j

...

K2J

T2

...

...

...

...

...

...

...

...

x i1

x i2

...

x ij

...

KiJ

T3

...

...

...

...

...

...

x k1

x k2

...

x kj

...

Totais

B1

B2

...

Bj

...
K kJ

Tk

BJ

Neste caso queremos verificar se (Hipteses em estudo):


* A hiptese nula onde todos os tratamentos tenham mdias iguais, isto :
H 0 = 1 = 2 = 3 = = k
* E a alternativa de que pelo menos um par de mdias seja diferente:

H1 = p q

para p q

Assim, para avaliarmos se ocorre a variabilidade, construmos um quadro da


seguinte forma:
1- Calcula-se os graus de Liberdade para:
Tratamento (k) = k-1
Bloco (J) = J -1
Resduo: (k-1)(J-1)
Total: k.J 1

2- Calcula-se a constante, chamada de constante de correo;

k J

xij
i =1 j =1

C=
kJ

3- Avalia-se a variabilidade total dos dados atravs da soma do quadrado total(SQTot);

k J

SQTot = xij2 C
i =1 j =1

109

4 - Calcula-se a variao entre os tratamentos atravs da soma do quadrado dos


tratamentos (SQTrat);

k 2
Ti
SQTrat = i =1 C

5 - Calcula-se a variao entre os Blocos atravs da soma do quadrado dos Blocos

(SQBloc);
2
J

Bj
j =1
SQBloc =
C
k

6- Obtem-se a varincia residual, ou seja, soma do quadrado residuais (SQRes);

SQ Re s = SQTot ( SQTrat + SQBloc)


7- Determina-se o Quadrado Mdio para os Tratamentos (QMTrat), o Quadrado

Mdio para os Blocos (QMBloc) e o Quadrado Mdio Residual (QMRes);


QMTrat =

SQTrat
;
k 1

QMBloc =

SQBloc
J 1

QM Re s =

SQ Re s
(k 1)( J 1)

Assim teremos o conhecido quadro de anlise de varincia:


Fonte de Variao

g.l.

Soma dos quadrados

Quadrado Mdios

Entre Tratamentos

k -1

SQTrat

QMTrat =

SQTrat
k 1

Fcal =

QMTrat
QM Re s

Entre Blocos

J-1

SQBloc

QMBloc =

SQBloc
J 1

Fcal =

QMBloc
QM Re s

Dentro das amostras

(k-1)(J-1)

SQRes

Jk- 1

SQTot

QM Re s =

(Resduo)
Total

Teste F (Fcal)

SQ Re s
( k 1)( J 1)

A complementao da anlise feita de modo usual.

110

Exemplo: Quatro mquinas diferentes M1, M2, M3 e M4 esto sendo consideradas para a
produo de certo produto. Para comparar as mquinas, decidiu-se que seis operadores
diferentes sero usados em um delineamento em blocos completamente aleatorizado. As
mquinas foram atribudas de forma aleatria para cada operador. A operao da
mquina requer destreza fsica, e j foi antecipado que haver diferena entre os
operadores na velocidade em que cada um opera a mquina. A quantidade de tempo (em
segundos) foi registrada para a montagem do produto.
Teste a hiptese H0, no nvel se significncia de 0,05, de que as mquinas
trabalham na mesma mdia de velocidade.

Operador
Mquina

1.6

42,5

39,3

39,6

39,9

42,9

43,6

39,8

40,1

40,5

42,3

42,5

43,1

40,2

40,5

41,3

43,4

44,9

45,1

41,3

42,2

43,5

44,2

45,9

42,3

A Anlise de Varincia para Experimentos Fatoriais (dois ou mais fatores)


Considere uma situao em que o interesse estudar o efeito de dois fatores, A e

B, em algumas respostas. Por exemplo, em um experimento qumico, gostaramos de


variar simultaneamente a presso e o tempo de reao e estudar o efeito de cada um no
rendimento. Neste caso, importante determinar no somente se cada um dos dois
fatores (caracterstica em anlise) tem influncia na resposta, mas tambm se h
interao significante entre os fatores.
O experimento descrito aqui um experimento com dois fatores e o planejamento
experimental pode ser um delineamento completamente aleatorizado, no qual as vrias
combinaes de tratamentos so atribudas aleatoriamente para todas as unidades
experimentais, ou um planejamento completo de blocos aleatrios, no qual as
combinaes dos fatores so atribudas aleatoriamente aos blocos.
Para apresentar as frmulas gerais da anlise de varincia de um experimento de
dois

fatores

usando

observaes

repetidas

em

delineamento

completamente

aleatorizado, devemos considerar o caso de n replicaes das combinaes dos


tratamentos determinadas por a nveis do fator A e b nveis do fator B. As observaes
podem ser classificadas por meio de uma tabela na qual as linhas representam os nveis
do fator A e as colunas representam os nveis do fator B. Cada combinao de
111

tratamento define uma clula em nossa tabela. Ento, temos ab clulas, cada uma com

n observaes. Denotando por xijk a k-sima observao feita no i-simo nvel do fator A
e no j-simo nvel do fator B, as abn observaes so mostradas a seguir.
B
A
1

.
.
.
a

Total

1
x111
x112
.
.
.
x11n
x211
x212
.
.
.
x21n
.
.
.
x a11

2
x 121
x 122
.
.
.
x12n
x 221
x 222
.
.
.
x 22n
.
.
.
x a21

...
...
...
...
...
...
...
...
...
...
...
...
...
.
.
.
...

b
x 1b1
x 1b2
.
.
.
x1bn
x 2b1
x 2b2
.
.
.
x 2bn
.
.
.
x ab1

x a12

x a22

...

x ab2

.
.
.

.
.
.

x a1n

x a2n

B1

B2

Total
A1...

A2...

.
.
.
Aa...

.
.
.
...
...

x abn
Bb

Y...

As observaoes na (ij)-sima clula constituem uma amostra aleatria de


tamanho n de uma populao que assumida como normalmente distribuda com mdia

ij e varincia 2 .

Neste caso as trs hipteses a serem testadas so:

1. H 0' : 1 = 2 = ... = a = 0,
H1' : pelo menos um dos i' s diferente de zero.

2. H 0'' : 1 = 2 = ... = b = 0,
H1'' : pelo menos um dos 'j s diferente de zero.

3. H 0''' : ( )11 = ( )12 = ... = ( ) ab = 0,

112

H1''' : pelo menos um dos ( )ij' s diferente de zero.


recomendvel que o resultado do teste de interao seja considerado primeiro
e em seguida a dos efeitos principais, pois a natureza da concluso cientifica depende da
interao a ser encontrada. Se no houver interao, ento as hipteses 1 e 2 podero ser
testadas, e a interpretao se torna mais simples.

Assim, para avaliarmos se ocorre a variabilidade, construmos um quadro da


seguinte forma: 1- Calcula-se os graus de Liberdade para:
Fator 1(A) = a-1
Fator 2 (B) = b-1
Interao de dois fatores (AB) = (a-1)(b-1)
Resduo: ab(n-1)
Total: abn - 1

2- Calcula-se a constante, chamada de constante de correo;

a b n

xijk
i =1 j =1 k =1

C=
iJk

3- Avalia-se a variabilidade total dos dados atravs da soma do quadrado total(SQTot);

a b n

SQTot = xijk 2 C
i =1 j =1 k =1

4 - Calcula-se a variao entre os nveis do fator A atravs da soma do quadrado do

fator A (SQFatorA);
2
b n

xijk
a
j =1 k =1
SQFatorA =
C
nb
i =1

5 - Calcula-se a variao entre os nveis do fator B atravs da soma do quadrado do

fator B (SQFatorB);

113

2
a n

xijk
b
SQFatorB = i =1 k =1 C

an
j =1

6- Calcula-se a variao entre a interao dos nveis do fator A e do fator B atravs da

soma do quadrado do fator AxB (SQFatorAxB);


2
a b

xijk
n
i =1 j =1
SQInteraoAxB =
C
n
k =1

7 - Obtem-se a varincia residual, ou seja, soma do quadrado residuais (SQRes);

SQ Re s = SQTot ( SQFatorA + SQFatorB + SQInteraoAxB)


7-

Determina-se

Quadrado

Mdio

para:

FatorA

(QMTFatorA),

FatorB

(QMTFatorB), Interao AxB (QMInteraoAxB) e Quadrado Mdio Residual


(QMRes);

QMFatorA =

SQFatorA
;
a 1

QMFatorB =

SQFatorB
;
b 1

QMInteraoAxB =
QM Re s =

SQInteraoAxB
(a 1)(b 1)

SQ Re s
ab(n 1)

Assim teremos o conhecido quadro de anlise de varincia:


Fonte de Variao

g.l.

Soma dos

Quadrado Mdio

Teste F (Fcal)

quadrados
Efeito principal
Fator A

a-1

SQ F atorA

Fator B

b-1

SQFatorB

(a-1)(b-

SQ FatorA x B

QMFatorA =

SQFatorA
a 1

Fcal =

QMFatorA
QM Re s

QMFatorB =

SQFatorB
b 1

Fcal =

QMFatorB
QM Re s

Interao de dois
fatores AxB

Fcal =

QMInteraoAxB
QM Re s

114

1)

QMInteraoAxB =

SQInteraoAxB
( a 1)(b 1)

Dentro das
amostras (Resduo)

ab(n-1)

SQRes

Total

abn- 1

SQTot

QM Re s =

SQInteraoAxB
( a 1)(b 1)

A complementao da anlise feita de modo usual.

Exemplo: Um experimento foi conduzido para estudar o efeito da temperatura e do tipo


de forno na vida til de certo componente. Quatro tipos de fornos e trs nveis de
temperatura foram usados no experimento. Vinte e quatro peas foram atribudas
aleatoriamente, duas para combinaes de tratamentos, e os resultados foram registrados
a seguir.

Temperatura
(graus)
500
550
600

O1
227
221
187
208
174
202

Forno
O2
214
259
181
179
198
194

O3
225
236
232
198
178
213

O4
260
229
246
273
206
219

Usando o nvel de 0,05, teste as hipteses de que:


a) temperaturas diferentes no tem efeito na vida til do componente;
b) fornos diferentes no tem efeito na vida til do componente;
c) o tipo de forno e a temperatura no interagem.

Exerccios:
1 - Para testar a tenso de ruptura de tijolos similares de seis furos de 3 olarias
diferentes,
foram colhidos 3 tijolos de cada olaria para a verificao. Exercendo uma presso em
cada tijolo para constatar a resistncia, foram obtidos os dados abaixo. Pode-se afirmar
que existe diferena significativa da tenso de ruptura entre os tijolos das olarias? Faa
uma comparao de mdias de Tukey a 5%.
R: no existe diferena.

115

2 - A tabela apresenta as resistncias de corpos de prova onde testado 4 tipos


diferentes de cermicas. Determinar ao nvel de 1%, se existe diferena significativa nas
resistncias dos 4 tipos de cermicas e qual cermica oferece maior resistncia 9Use
Tukey a 5%) ? A resistncia dada em MPa.
R: A cermica D.

3 - A anemia uma doena que afeta muitas pessoas e que pode ter diversas origens.
Pretendendo-se avaliar possveis diferenas entre diferentes tratamentos de estados
anmicos, planejou-se uma experincia com 120 indivduos anmicos, divididos
aleatoriamente em trs grupos de 40, aos quais se atribuiu a cada um, um dos
tratamentos. O primeiro tratamento era constitudo apenas por uma dieta rica em ferro.
O segundo tratamento combinava um suplemento de ferro com a dieta do primeiro
tratamento e o ltimo acrescentava um complexo vitamnico. No sentido de avaliar
possveis diferenas entre os tratamentos, efetuou-se uma ANAVA com base nos
valores de hemoglobina dos 120 indivduos aptos um perodo de 3 meses de tratamento.
Os resultados da ANAVA encontram-se na tabela seguinte. Complete a tabela nos
espaos apropriados.

4 - Uma editora responsvel pela publicao de diversos tipos de revistas. O setor de


publicidade desta editora utiliza diversos meios de comunicao para anunciar os
produtos (televiso, rdio,revistas, jornais, entre outros). E tambm conta com um
servio de vendas de assinaturas das revistas por telefone. Neste servio selecionada
uma rea de uma cidade e por meio de uma lista telefnica so obtidos os telefones dos
provveis futuros assinantes. A relao de nmeros telefnicos repassada para as
operadoras de telemarketing que, por meio de ligaes, estimulam as pessoas a fazerem
assinaturas anuais das revistas.
Em uma reunio do setor de publicidade foram apresentadas informaes sobre o
nmero de assinaturas vendidas por cada operadora. Analisando estes nmeros, a
gerncia responsvel pela rea comercial percebeu que o nmero de assinaturas
vendidas era bastante heterogneo entre as operadoras, fato que levantou a questo de
que algumas delas poderiam no estar explorando devidamente o campo de vendas.
Imediatamente se formou uma equipe para verificar a veracidade das suspeitas, ou seja,
se a empresa estava de fato diante de um problema que deveria ser resolvido por um
estudo de qualidade para melhorar resultados. Observe ento, que a equipe de trabalho
desejava verificar se a variabilidade no nmero de vendas de assinaturas efetuadas pelas
operadoras era explicada simplesmente ao acaso ou se realmente alguma operadoras se
mostravam mais eficientes do que as outras. Se fosse constatado que algumas
operadoras obtinham melhores resultados nas vendas de assinaturas seria necessrio
adotar alguma medida corretiva, tal como ministrar um novo curso de treinamento para
que todas as operadoras obtivessem um elevado ndice de vendas de assinaturas.

116

A equipe de trabalho acompanhou durante uma semana (de segunda-feira a sbado), em


horrio normal de trabalho, o desempenho de 6 operadoras escolhidas aleatoriamente
dentre as 16 operadoras que trabalham com vendas de assinaturas por telefone. Foram
selecionados nmeros de telefones de uma mesma regio scio-econmica da cidade.
Ao final de cada dia eram registrados os nmeros de assinaturas vendidas por cada
operadora. Neste experimento, a equipe de trabalho resolveu considerar os dias da
semana como blocos, pois era de seu conhecimento que alguns dias da semana eram
mais favorveis venda de assinaturas do que outros. Os resultados obtidos do
experimento esto apresentados na Tabela 1.
Tabela 1: Nmero de Assinaturas de Revistas Vendidas no Experimento.
Dias da
Operadoras
Semana
1
2
3
4
5
6
Segunda
18
19
16
23
21
18
Tera
21
23
19
24
26
21
Quarta
23
24
20
25
27
20
Quinta
22
23
18
26
25
19
Sexta
19
19
14
21
20
16
Sbado
17
17
13
21
20
14
a) Quais as hipteses em teste? Cite-as.
b) Utilize a anlise de varincia para verificar a variabilidade no nmero de vendas
de assinaturas efetuadas pelas operadoras era explicada simplesmente pelo acaso
ou se realmente algumas operadoras se mostravam mais eficientes do que as
outras. Utilizar o nvel de significncia de 5%.
c) Faca um teste de comparao de mdia de Tukey se ocorreu diferena
significativa entre as operadoras.
d) De posse dos resultados anteriores, voc considera que seria necessrio adotar
alguma medida corretiva, tal como oferecimento de um novo curso de
treinamento?
5 - Uma empresa deseja adquirir certa mquina e verificou que existem na praa 4
marcas diferentes: A;B;C e D que satisfazem. Decidiu-se que ser comprada a mquina
que apresentar o melhor rendimento. Foi realizado um ensaio com 4 mquinas em
perodos iguais durante 5 dias. Com relao ao rendimento, existe diferena
significativa entre as mquinas ao nvel de 5%? Se sim, qual a mquina que deveria ser
comprada?

6- Os dados abaixo so de um experimento inteiramente ao acaso, onde 5 processos de


estocagem foram usados em um produto perecvel por absoro de gua. Vinte e cinco
exemplares deste produto foram divididos em cinco grupos, e aps uma semana mediuse a quantidade de gua absorvida. Os resultados codificados esto abaixo. Existem
evidencias que os processos de estocagem produzem resultados diferentes? Caso haja,
calcule Tukey.

117

7 - Um engenheiro suspeita que o acabamento da superfcie de uma pea de metal seja


influenciado pelo tipo de pintura usada e pelo tempo de secagem. Ele seleciona trs
tempos de secagem - 20, 25 e 30 minutos - e seleciona aleatoriamente dois tipos de
pintura dentre as vrias disponveis. Ele realiza um experimento e obtm os dados
mostrados aqui. Anlise-os e tire concluses. Estime os componentes da varincia.

8 - Estudam-se os fatores que influenciam a forca de ruptura de um fio de cobre. Quatro


mquinas e trs operadores so escolhidos aleatoriamente e roda-se um experimento que
usa partes do mesmo pedao de fio medindo um metro. Os resultados so os seguintes:

Teste em relao a interaes e efeitos principais ao nvel de 5%.


9 - Uma companhia emprega engenheiros para estudos de tempo. Sua supervisora
deseja determinar se os padres estabelecidos por eles so influenciados por uma
interao entre engenheiros e operadores. Ela seleciona trs operadores aleatoriamente e
realiza um experimento no qual os engenheiros estabelecem padres de tempo para uma
mesma tarefa. Ela obtm os dados a seguir. Cite as hiptese, analise-as e tire
concluses.

Podero ser realizados tambm, os exerccios de 1 a 10 da pgina 395 a 397, do livro de

Probabilidade e estatstica para Engenharia e Cincias, do autor Jay L. Devore.

118

S-ar putea să vă placă și