Sunteți pe pagina 1din 80

PCO

PROGRAMA DE CERTIFICAO
OPERACIONAL CST

ESTATSTICA II

ELABORAO: DEZEMBRO/04
CST - Companhia Siderrgica de Tubaro
FDH - Departamento de Recursos Humanos
FHD - Diviso de Desenvolvimento e Remunerao
Av. Brigadeiro Eduardo Gomes, 930, Jardim Limoeiro - Serra - ES.
CEP: 29163-970
Telefone: 0 XX (27) 3348-1420
Fax: 0 XX (27) 3348-1077
Sumrio

1. INTRODUO...................................................................................................................................... 6
2. DEFINIES DE TERMOS USADOS EM ESTATSTICA............................................................ 7
3. VARIVEIS DISCRETAS E CONTNUAS..................................................................................... 12
4. POPULAES E AMOSTRAS ......................................................................................................... 13
4.1. TCNICAS DE AMOSTRAGEM ......................................................................................................... 14
4.2. AMOSTRA ALEATRIA SIMPLES ..................................................................................................... 15
4.3. AMOSTRA SISTEMTICA ................................................................................................................ 15
4.4. AMOSTRA ESTRATIFICADA ............................................................................................................ 15
4.5. AMOSTRA DE CONVENINCIA (GRUPO).......................................................................................... 16
4.6. ERROS DE AMOSTRAGEM............................................................................................................... 16
5. HISTOGRAMAS DE FREQNCIA............................................................................................... 16
5.1. PRIMEIRA ETAPA: CLCULO DA AMPLITUDE (R) .......................................................................... 17
5.2. SEGUNDA ETAPA: DETERMINAO DO INTERVALO DE CLASSE .................................................... 18
5.3. TERCEIRA ETAPA: PREPARAO DO FORMULRIO DA TABELA DE FREQNCIA .......................... 19
5.4. QUARTA ETAPA: DETERMINAO DAS CLASSES .......................................................................... 19
5.5. QUINTA ETAPA: CLCULO DO PONTO MDIO DE CADA CLASSE .................................................. 20
5.6. SEXTA ETAPA: OBTENO DAS FREQNCIAS.............................................................................. 20
6. DESENHANDO UM HISTOGRAMA DE FREQNCIA ............................................................ 20
6.1. POLGONO DE FREQNCIAS ......................................................................................................... 21
6.2. ESTRATIFICAO DE HISTOGRAMAS ............................................................................................. 22
7. PARMETROS DA DISTRIBUIO DE FREQNCIA............................................................ 24
7.1. TENDNCIA CENTRAL ................................................................................................................... 25
7.2. DISPERSO .................................................................................................................................... 25
7.3. ASSIMETRIA .................................................................................................................................. 25
7.4. CURTOSE ....................................................................................................................................... 25
8. MDIA ARITMTICA ...................................................................................................................... 26
9. MDIA PONDERADA ....................................................................................................................... 27
10. MDIA DA RAIZ DA MDIA DOS QUADRADOS .................................................................. 29
11. MEDIA HARMNICA .................................................................................................................. 30
12. MEDIANA ....................................................................................................................................... 30
13. MODA.............................................................................................................................................. 31
14. MEDIDAS DE DISPERSO.......................................................................................................... 32
15. AMPLITUDE .................................................................................................................................. 32
16. VARINCIA ................................................................................................................................... 33
17. DESVIO PADRO ......................................................................................................................... 34
18. COEFICIENTE DE VARIAO ................................................................................................. 36

Estatstica
19. FORMATO...................................................................................................................................... 37
20. DISTRIBUIO DE PROBABILIDADES.................................................................................. 37
20.1. INTRODUO AO CLCULO DE PROBABILIDADES ......................................................................... 38
20.2. REGRA DA ADIO ........................................................................................................................ 41
20.3. REGRA DO PRODUTO ..................................................................................................................... 42
21. DISTRIBUIO BINOMIAL ....................................................................................................... 43
22. DISTRIBUIO DE POISSON .................................................................................................... 45
23. DISTRIBUIO NORMAL.......................................................................................................... 47
23.1. PROPRIEDADES DA DISTRIBUIO NORMAL ................................................................................. 47
23.2. CARACTERSTICAS ........................................................................................................................ 48
23.3. MODELO MATEMTICO ................................................................................................................ 49
23.4. DISTRIBUIO NORMAL PADRO ................................................................................................. 50
23.5. APLICAES.................................................................................................................................. 54
23.6. DISTRIBUIO DE AMOSTRAGEM DA MDIA ARITMTICA............................................................ 56
23.7. ERRO PADRO DA MDIA ARITMTICA ........................................................................................ 58
23.8. TEOREMA DO LIMITE CENTRAL .................................................................................................... 59
24. DISTRIBUIO UNIFORME (OU RETANGULAR) ............................................................... 60
25. DISTRIBUIO TRIANGULAR................................................................................................. 62
26. DISTRIBUIO T (STUDENT) ................................................................................................... 65
27. GRAUS DE LIBERDADE ............................................................................................................. 67
28. INTERVALO DE CONFIANA................................................................................................... 67
29. EXERCCIOS DE ESTATSTICA ............................................................................................... 70
30. RESPOSTAS DOS EXERCCIOS DE ESTATSTICA.............................................................. 78

Estatstica
5

Apresentao

Muitas pessoas ainda pensam que Metrologia se refere apenas a Dimenso e Comprimento,
que se trata de paqumetros, micrmetros, calibres e similares. Este conceito deve ser
corrigido, pois Metrologia a Cincia da Medio e se refere medio de qualquer
grandeza fsica.
Segundo a norma 1 NBR ISO 10012, Comprovao Metrolgica um conjunto de
operaes necessrias para assegurar-se de que um dado equipamento de medio est em
condies de conformidade com os requisitos para o uso pretendido.
Quando se relata o resultado de medio de uma grandeza fsica, obrigatrio que seja
dada alguma indicao quantitativa da qualidade do resultado, de forma tal que aqueles que
o utilizam possam avaliar sua confiabilidade. Sem essa indicao, resultados de medio
no podem ser comparados, seja entre eles mesmos ou com valores de referncia
fornecidos numa especificao tcnica ou numa norma.
A avaliao da qualidade de medidas fundamental para a prtica gerencial. Segundo o
Dr. William Edwards Deming, o que se registra ao final de uma determinada operao
de medio o ltimo produto de uma longa srie de operaes, desde a matria-prima
at a operao de medio propriamente dita. A medio , pois, a parte final deste
processo. Assim, do mesmo modo como vital controlar estatisticamente as outras partes
deste processo, vital controlar-se estatisticamente o processo de medio; caso
contrrio, no h medida que tenha significado comunicvel.
Estas palavras de Deming mostram a importncia do conhecimento e do uso sistemtico,
por parte das empresas, da comprovao metrolgica, a qual utiliza as tcnicas estatsticas
para avaliao da capacidade de sistemas de medio.
O pressuposto bsico da metrologia que toda medida possui erros. Como conseqncia,
nem o valor verdadeiro e nem o valor do erro so conhecidos com exatido. Como em
outras reas cientficas, por exemplo, a fsica, na metrologia temos que conviver com a
incerteza e os erros de medio. Convm, portanto, que a incerteza e os erros de medio
sejam tratados de tal modo que as medies possam ter alguma utilidade.
Uma das razes mais comuns de dados com baixa qualidade a grande variao dos dados.
Por exemplo, um sistema de medio usado para medir a vazo de um gs em uma
tubulao, pode ser sensvel temperatura do gs medido. Neste caso, a variao nos
dados pode ser devida ou a mudanas na vazo ou a mudanas na temperatura do gs. Isto
torna a interpretao dos dados mais difcil e o sistema de medio, conseqentemente,
menos conveniente ou at mesmo inadequado.
Alm disso, outros fatores tambm influem na medio, por exemplo: o operador, os
equipamentos auxiliares, as condies ambientais, o instrumento de medio etc.
Esta apostila pretende tratar com mais nfase os componentes de um Sistema de
Comprovao Metrolgica, fazendo, contudo, uma breve explanao dos conceitos bsicos
de Estatstica, necessrios aplicao da metrologia.

1
Norma NBR ISO 10012/2004 Sistemas de Gesto de Medio Requisitos para os processos de medio
e equipamento de medio.

Estatstica
6

1. INTRODUO

A Estatstica pode ser dividida em duas partes: descritiva e inferencial.

A estatstica descritiva cuida dos mtodos que envolvem a coleta, a apresentao e a


caracterizao de um conjunto de dados de modo a descrever apropriadamente as vrias
caractersticas deste conjunto. Utiliza-se de tabelas, grficos e mtodos numricos para
resumir conjuntos de dados da populao total ou de amostras.

A estatstica inferencial cuida dos mtodos que tornam possveis a estimativa de uma
caracterstica de uma populao ou a tomada de uma deciso referente populao com
base somente em resultados de amostras.

A estatstica inferencial uma tcnica usada para coletar, descrever, analisar e interpretar
os dados numricos. Ela trata das variaes aleatrias contidas nos dados. conveniente
deixar claro que a estatstica inferencial mostra apenas as informaes j contidas nos
dados. Nenhuma informao nova criada por ela. O tratamento estatstico dos dados
permite fazer julgamentos objetivos relacionados com a validade dos resultados,
permitindo v-los de modos diferentes e a tomada de decises objetivas e inteligentes
quanto qualidade e aplicao.

Em metrologia a estatstica inferencial amplamente usada, pois o objetivo obter


concluses provveis, em condies de incerteza, sobre determinado sistema de medio
baseando-se em uma pequena amostra de uma populao estatstica.

Usando a estatstica podemos determinar o valor mais provvel de uma grandeza, partindo
de um conjunto de dados de medio, bem como determinar o erro provvel e o valor da
incerteza.

Quando se faz apenas uma medio dizemos que a mesma imprevisvel e aleatria.
Entretanto uma srie de medies previsvel e determinada. A base da estatstica a
repetio das medies. Com apenas uma medio obtm-se pouca informao do
mensurando, sujeita a erros. Com mltiplas medies os erros aleatrios aparecem como
um espalhamento em torno da mdia das medies.

Estatstica
7

Este espalhamento causado pelas variaes da medio e pelas variaes das


caractersticas do sistema de medio. Dentro do possvel, as variaes da medio devem
ser consideradas nos clculos estatsticos e as variaes do sistema de medio devem ser
eliminadas.

Como sabido, devido ao alto custo das medies, torna-se impeditivo realizar muitas
medies para caracterizar uma populao, da serem usadas algumas poucas amostras
(medies) para inferir (tirar concluses) sobre as populaes. Por conseqncia, este
processo tem suas limitaes, no exato, podendo estar sujeito a erros. A estatstica
inferencial poder avaliar e controlar o tamanho do erro cometido ao se fazer estas
dedues. Ou seja: a incerteza e o grau de confiana do sistema de medio.

A qualidade dos dados de medio est relacionada com as propriedades estatsticas de


medies mltiplas obtidas com um sistema de medio operando em condies estveis 2.

2. DEFINIES DE TERMOS USADOS EM ESTATSTICA

A seguir so apresentados alguns termos usados em estatstica, extrados do Guia 3 para a


Expresso da Incerteza de Medio, que os extraiu da Norma 4 ISO 3534-1. Esta norma
deve ser a primeira fonte a ser consultada para a definio de termos estatsticos no
includos nesta apostila.

Amostra: uma parcela representativa da populao que escolhida para anlise com o
propsito de tirarmos concluses sobre a essa populao.

Atributo: quando os dados estatsticos apresentam um carter qualitativo, o levantamento


e os estudos necessrios ao tratamento desses dados so designados genericamente de
estatstica de atributo.

2
Anlise dos Sistemas de Medio (MAS), 2a Edio Fev/ 95.
3
Guia Para a Expresso da Incerteza de Medio 2a Edio ABNT INMETRO SBM 1998.
4
ISO 3535-1: 1993 Statistics Vocabulary and Symbols Part 1: Probability and general statistical terms.

Estatstica
8

Caracterstica: propriedade que ajuda a identificar ou diferenciar itens de uma dada


populao.

Nota: a caracterstica pode ser ou quantitativa (por variveis) ou qualitativa (por atributos).

Coeficiente de confiana; nvel de confiana: o valor (1 - ) da probabilidade associada


com um intervalo de confiana ou um intervalo estatstico de abrangncia.

Nota: (1- ) freqentemente expresso como uma porcentagem.

Dado Estatstico: dado numrico considerado a matria-prima sobre a qual iremos


aplicar os mtodos estatsticos.

Desvio padro: a raiz quadrada positiva da varincia.

Nota: o desvio padro da amostra um estimador 5 no-tendencioso do desvio padro da


populao.

No texto original, o estimador consta como "biased", que no corresponde traduo "no-
tendencioso.

Distribuio de freqncia: relao emprica entre valores de uma caracterstica e suas


freqncias ou suas freqncias relativas.

Nota: a distribuio pode ser apresentada graficamente como um histograma, grficos de


barras, polgono de freqncia cumulativa ou como uma tabela de dupla entrada.

Distribuio de Probabilidade (de uma varivel aleatria): funo que determina a


probabilidade de uma varivel aleatria assumir qualquer valor dado ou pertencer a um
dado conjunto de valores.

Nota: a probabilidade do conjunto inteiro de valores da varivel aleatria igual a 1.

Esperana (de uma varivel aleatria ou de uma distribuio de probabilidade); valor


esperado; mdia.

5
No texto original, o estimador consta como "biased", que no corresponde traduo "no-tendencioso.

Estatstica
9

Estatstica: funo de variveis aleatrias da amostra.

Nota: Estatstica, como uma funo de variveis aleatrias, tambm uma varivel
aleatria e, como tal, assume diferentes valores de uma amostra para outra. O valor da
estatstica obtida, usando-se os valores observados nesta funo, pode ser utilizado num
teste estatstico ou como estimativa de um parmetro de populao, tal como uma mdia
ou um desvio padro.

Estimao: a operao que designa, atravs de observaes numa amostra, valores


numricos para os parmetros de uma distribuio escolhida, como o modelo estatstico da
populao da qual a amostra extrada.

Nota: um resultado desta operao pode ser expresso como um valor nico singular
(estimativa pontual) ou como uma estimativa de intervalo.

Estimador: estatstica utilizada para estimar um parmetro de populao.

Estimativa: valor de um estimador obtido como um resultado de uma estimao.

Fenmeno Estatstico: qualquer evento que se pretenda analisar, cujo estudo seja possvel
da aplicao do mtodo estatstico.

Freqncia: o nmero de ocorrncias de um dado tipo de evento ou o nmero de


observaes que se enquadram em uma classe especificada.

Funo densidade de probabilidade (para uma varivel aleatria contnua): derivada


(quando existe) da funo distribuio: f(x) = dF(x)/dx

Nota: f(x)dx = Pr(x < X < x + dx)

Funo distribuio: funo que determina, para cada valor x, a probabilidade de que a
varivel aleatria X seja menor ou igual a x:

F(x) = Pr(X x).

Graus de liberdade: em geral, o nmero de termos em uma soma menos o nmero de


restries aos termos da soma.

Estatstica
10

Intervalo de confiana bilateral: quando T1 e T2 so duas funes dos valores


observados, tais que, sendo um parmetro de populao a ser estimado, a probabilidade
Pr (T1 T2) , pelo menos, igual a (1- ) [onde (1- ) um nmero fixo, positivo e
menor que 1], o intervalo entre T1 e T2 um intervalo de confiana (1- ) bilateral para .

Notas:

1) Os limites T1 e T2 do intervalo de confiana so estatsticas e, como tais, geralmente


assumem diferentes valores de amostra para amostra.

2) Em uma longa srie de amostras, a freqncia relativa dos casos nos quais o valor
verdadeiro do parmetro de populao coberto pelo intervalo de confiana, maior ou
igual a (1- ).

Intervalo de confiana unilateral: quando T uma funo dos valores observados, tais
que, sendo um parmetro de populao a ser estimado, a probabilidade Pr (T theta)
[ou a probabilidade Pr (T1 )] pelo menos igual a (1 - ) [onde (1 - ) um nmero
fixo, positivo e menor do que 1], o intervalo do menor valor possvel de at T (ou o
intervalo de T at o maior valor possvel de ) um intervalo de confiana (1 - )
unilateral para .

Nota: o limite T do intervalo de confiana uma estatstica e, como tal, geralmente ir


supor diferentes valores de amostra para amostra.

Intervalo estatstico de abrangncia: intervalo para o qual pode-se dizer que, com um
dado nvel da confiana, ele contm pelo menos uma proporo especificada da populao.

Notas:

1) Quando ambos os limites so definidos por estatsticas, o intervalo bilateral. Quando


um dos dois limites no finito ou consiste do limite absoluto da varivel, o intervalo
unilateral.

2) Tambm denominado "intervalo estatstico de tolerncia". Este termo no deve ser


usado porque pode ser confundido com intervalo de tolerncia", que definido na ISO
3534-2.

Estatstica
11

Mdia aritmtica; mdia: a soma de valores dividida pelo nmero de valores.

Notas:

1) O termo "mdia" (mean) , geralmente, utilizado quando se refere a um parmetro de


populao (mdia da populao) e o termo "mdia" (average) quando se refere ao resultado
de um clculo sobre dados obtidos de uma amostra (mdia da amostra).

2) A mdia (average) de uma amostra aleatria simples tomada de uma populao um


estimador no-tendencioso da mdia (mean) desta populao. Entretanto, outros
estimadores, tais como a mdia geomtrica ou harmnica, ou a mediana ou a moda, so por
vezes utilizados.

Parmetro - uma grandeza utilizada na descrio da distribuio de probabilidade de uma


varivel aleatria.

Populao: totalidade de itens sob considerao.

Nota: no caso de uma varivel aleatria, considera-se que a distribuio de probabilidade


defina a populao daquela varivel.

Probabilidade: um nmero real na escala de 0 a 1 associado a um evento aleatrio.

Varincia: uma medida de disperso, que a soma dos desvios quadrticos das
observaes de sua mdia aritmtica dividida pelo nmero de observaes menos um.

Varivel Aleatria: uma varivel que pode assumir qualquer um dos valores de um
conjunto especificado de valores e com a qual est associada uma distribuio de
probabilidade.

Nota: Uma varivel aleatria que s pode assumir valores isolados chamada discreta.
Uma varivel aleatria que pode assumir qualquer valor dentro de um intervalo finito ou
infinito chamada contnua.

Varivel aleatria centrada: uma varivel aleatria cuja esperana se iguala a zero.

Estatstica
12

3. VARIVEIS DISCRETAS E CONTNUAS

As variveis podem ser caracterizadas como qualitativas ou quantitativas. A varivel


qualitativa resulta de uma classificao por tipo ou por atributo, enquanto que a
quantitativa por seus valores expressos em nmeros.

As variveis quantitativas podem ser agrupadas em discretas e contnuas. chamada


discreta quando pode assumir apenas valores isolados ao longo de uma escala. Por
exemplo: o nmero de altos fornos existentes na CST uma varivel discreta, enquanto
que a temperatura deles uma varivel contnua.

Pode-se concluir tambm que os valores das variveis discretas so obtidas mediante
alguma forma de contagem enquanto que as variveis contnuas advm de um processo de
medio, freqentemente fornecidos em alguma unidade de medida. Por outro lado a
interpretao de um valor de uma varivel discreta dada exatamente pelo seu valor
numrico. Quando dizemos que a CST possui dois altos fornos (em 2004), temos a noo
exata do seu significado. Entretanto, no podemos dizer o mesmo da temperatura, pois a
interpretao de uma varivel contnua a de que se trata de um valor aproximado. Isso
decorre do fato de no existirem instrumentos de medida capazes de oferecer preciso
absoluta, alm do fato de que existem outros fatores de influncia que afetam o resultado
da medida, como, por exemplo, a variabilidade do processo, reajuste do equipamento, troca
de operador, entre outros.

Ao medirmos uma varivel contnua, estamos sempre fazendo uma aproximao, cujo
resultado deve ser interpretado como sendo uma aproximao compatvel com o nvel de
preciso e com o critrio utilizado para medir.

Estatstica
13

4. POPULAES E AMOSTRAS

Por definio, populao conjunto total de elementos portadores de, pelo menos, uma
caracterstica comum. Ento, qualquer subconjunto no vazio e com menor nmero de
elementos do que a populao constitui uma amostra dessa populao. A figura 1 ilustra
este conceito.

Populao

Amostra

Figura 1 - Ilustrao do conceito de populao e amostra

As populaes podem ser finitas, como o conjunto dos habitantes de um pas ou infinitas
como o nmero de vezes em que se pode tirar a carta de 7 de paus de um baralho.

De um modo geral, considera-se como se fossem infinitas as populaes finitas muito


grandes. Como exemplo, o nmero de torcedores do Flamengo. Este nmero
matematicamente finito, mas to grande que um pesquisador, ao analisar uma mostra de
1000 pessoas, pode considerar a populao como infinita.

Entretanto, se as informaes de toda a populao so coletadas, diz-se que houve um


recenseamento. Pois Censo o conjunto de dados obtidos atravs de recenseamento. Por
outro lado, se as informaes so provenientes de apenas parte da populao, dito que foi
feita uma amostragem. A amostra tanto a parte retirada da populao para estudo como,
tambm, o conjunto de dados obtidos nessa parte da populao.

Convm, contudo, ressaltar que mesmo que o pesquisador trabalhasse com a populao, o
que seria impossvel, mesmo assim, poderia ter um trabalho astronmico para estud-la e
na maioria dos casos os resultados seriam sempre falhos. Imagine o nmero de
nascimentos e mortes dirios em nosso pas. Portanto, vai sempre existir uma impreciso
no resultado do trabalho. Nesses casos, o estatstico recorre a uma amostra, que
basicamente, constitui uma reduo da populao a dimenses menores, sem perda das
caractersticas essenciais.

Estatstica
14

Na metrologia, ocorre o mesmo, pois mesmo que algum se disponha a fazer, digamos,
100 medies da corrente eltrica de um motor, o resultado ser sempre uma amostra
porque, teoricamente, a corrente eltrica pode ser medida um nmero infinito de vezes.
Alm disso, o estudo cuidadoso de uma amostra tem mais valor cientfico do que o estudo
sumrio de toda a populao.

4.1. TCNICAS DE AMOSTRAGEM


Uma amostra para ser boa tem de ser representativa, ou seja, deve conter em proporo
tudo o que a populao possui, tanto qualitativa quanto quantitativamente. Tambm tem
que ser imparcial, isto , todos os elementos da populao devem ter igual oportunidade de
fazer parte da amostra. Imagine algum pesquisando que time tem a maior torcida, no
Esprito Santo, na sada do estdio, aps o jogo, Desportiva e Estrela, realizado em
Cariacica! Conforme a tcnica utilizada, tem-se um tipo de amostra. Existem basicamente
dois tipos de amostras: amostra no-probalstica e amostra probabilstica, as quais de
dividem em:

Amostra no-probalstica pode ser:

a) amostra de julgamento;
b) amostra por quota;
c) fatia.

Amostra probabilstica pode ser:

a) amostra aleatria simples;


b) amostra sistemtica;
c) amostra estratificada;
d) amostra de convenincia (grupo).

Em muitos casos, somente a amostra no-probalstica est disponvel, como por exemplo,
em um julgamento. Nesse caso a opinio de um perito no assunto estudado fundamental
para que se possa utilizar os resultados obtidos a fim de realizar modificaes em um
processo.

Estatstica
15

Existem outros casos de amostragem no-probalstica, que so: a amostragem de quota e a


amostragem de fatia. Por no serem utilizadas em metrologia, no vamos estud-las.

As inferncias estatsticas de uma amostra para uma populao feita atravs de uma
amostra probabilstica.

4.2. AMOSTRA ALEATRIA SIMPLES


Neste tipo de amostragem, os elementos so retirados ao acaso da populao, logo, cada
elemento tem a mesma chance de todos os demais componentes da amostra de ser
escolhido.

4.3. AMOSTRA SISTEMTICA


Neste caso, os elementos so escolhidos, no por acaso, mas por um sistema. Quando a
populao est organizada mais fcil obter uma amostra sistemtica do que uma amostra
aleatria simples. Vejamos um exemplo. Para obter uma amostra de 4% de certificados de
calibrao de um laboratrio, mais fcil pegar o ltimo de cada 25 certificados do que
fazer um sorteio at conseguir 4% do total de certificados emitidos.

4.4. AMOSTRA ESTRATIFICADA


composta por elementos provenientes de todos os extratos da populao. Por exemplo,
numa pesquisa de nvel de satisfao com o governo do Estado do ES necessrio coletar
amostras em um nmero maior de municpios do Estado e no somente na regio chamada
de Grande Vitria.

Sempre que a populao for constituda de por diferentes extratos, devem ser obtidas
amostras estratificadas.

Estatstica
16

4.5. AMOSTRA DE CONVENINCIA (GRUPO)


formada pelos elementos que se dispe. Logo, se algum toma os certificados de
calibrao de que dispe como amostra de todos os certificados emitidos pelo laboratrio,
estar usando uma amostra de convenincia.

Como regra geral, h muitas restries ao uso de mostras por convenincia. Entretanto,
elas so comuns, em vrias reas, principalmente quando constituem a nica maneira de
estudar determinado problema.

4.6. ERROS DE AMOSTRAGEM


A importncia da amostragem no pode ser deixada de lado. Se a amostra no for
representativa da populao que se quer analisar, de nada vai adiantar o esmerado cuidado
nas medies, na coleta e anlise dos dados. Entretanto, convm frisar que a amostragem
sempre contribui para a incerteza de medio. Cabe ao metrologista avaliar previamente
todas as fontes de erro oriundos da amostragem e tentar minimiz-las, pois uma vez
cometidos eles so irreversveis. Por exemplo, se ao fazer uma medio de baixo sinal DC,
o equipamento no for aterrado conveniente, todas as medies podero ser afetadas por
rudos intermitentes presentes no circuito.

5. HISTOGRAMAS DE FREQNCIA

uma ferramenta estatstica apropriada para apresentao de grandes massas de dados


numa forma que torna mais clara a tendncia central e a disperso dos valores ao longo da
escala de medio, bem como a freqncia relativa de ocorrncia dos diferentes valores.

A tabela 1 apresenta dados brutos, isto , dados que ainda no foram numericamente
organizados, de medidas de comprimento de 100 eixos fabricados numa Usinagem.
Observe que interpretar essa massa de dados bastante trabalhoso. Por isso fazemos uso de
alguns recursos para facilitar a anlise dos dados. O histograma um dos mtodos usados
que vamos aplicar agora. Siga as seis etapas do mtodo.

Estatstica
17

5.1. PRIMEIRA ETAPA: CLCULO DA AMPLITUDE (R)


A frmula para clculo da Amplitude (R) a seguinte:

R = Vmax Vmin,

Sendo:
R = amplitude
Vmax = maior valor entre os 100 valores
Vmin = menor valor entre os 100 valores

No. da Medidas
Amostra (em mm)

1 a 10 4162 4168 4178 4165 4167 4168 4157 4161 4164 4165
11 a 20 4157 4158 4173 4183 4189 4167 4172 4171 4173 4176
21 a 30 4154 4168 4178 4169 4177 4173 4176 4166 4171 4165
31 a 40 4169 4169 4165 4171 4169 4167 4173 4172 4181 4171
41 a 50 4186 4171 4174 4164 4165 4167 4158 4172 4183 4187
51 a 60 4163 4169 4173 4169 4182 4165 4169 4170 4175 4174
61 a 70 4167 4177 4172 4179 4171 4157 4159 4178 4173 4176
71 a 80 4162 4163 4182 4169 4177 4156 4160 4178 4173 4175
81 a 90 4169 4178 4169 4173 4174 4173 4177 4169 4182 4184
91 a 100 4185 4171 4177 4169 4171 4151 4168 4177 4169 4169
Tabela 1 - Dados brutos medidas de comprimento de 100 eixos fabricados (em mm).

Encontrar tanto o menor valor, quanto o maior deles, percorrendo visualmente a lista de
100 valores. Este mtodo passvel de erro quando se tem muitos valores a comparar.
melhor acrescentar duas colunas direita da tabela 1 e nome-las como Menor Valor e
Maior Valor. Veja a Tabela 2. Percorrer visualmente cada linha e anotar na coluna
correspondente o Menor Valor de cada linha. Percorrer visualmente a coluna Menor
Valor e anotar qual o Menor Valor. Repetir o mesmo procedimento para o Maior
Valor. Feito isso, s aplicar a frmula de clculo da amplitude e obter:

R = Vmax Vmin = 4189 mm 4151 mm = 38 mm


Portanto, R = 38 mm.

Estatstica
18

5.2. SEGUNDA ETAPA: DETERMINAO DO INTERVALO DE CLASSE


O intervalo de classe pode ser determinado dividindo a amplitude (R) por 1, 2, ou 5 (ou 10,
20, 50 ou por 0, 1, 0, 2, 0,5 etc) de modo a se obter de 5 a 20 intervalos de classe, de igual
amplitude. No conveniente ter muitos intervalos, pois isto tornam trabalhosas as etapas
seguintes.

Neste caso vamos dividir 38 por 1, por 2 e por 5.

Logo obtemos:

a) 38 / 1 = 38
b) 38 / 2 = 19
c) 38 / 5 = 7,6 que deve ser arredondado para 8.

Ento vamos optar pela letra c, que nos permitir 8 classes com intervalo de 5 mm.

No. da Medidas Menor Maior


Amostra (em mm) Valor Valor
1 a 10 4162 4168 4178 4165 4167 4168 4157 4161 4164 4165 4162 4178
11 a 20 4157 4158 4173 4183 4189 4167 4172 4171 4173 4176 4157 4189
21 a 30 4154 4168 4178 4169 4177 4173 4176 4166 4171 4165 4154 4178
31 a 40 4169 4169 4165 4171 4169 4167 4173 4172 4181 4171 4165 4181
41 a 50 4186 4171 4174 4164 4165 4167 4158 4172 4183 4187 4158 4187
51 a 60 4163 4169 4173 4169 4182 4165 4169 4170 4175 4174 4163 4182
61 a 70 4167 4177 4172 4179 4171 4157 4159 4178 4173 4176 4157 4179
71 a 80 4162 4163 4182 4169 4177 4156 4160 4178 4173 4175 4156 4182
81 a 90 4169 4178 4169 4173 4174 4173 4177 4169 4182 4184 4169 4184
91 a 100 4185 4171 4177 4169 4171 4151 4168 4177 4169 4169 4151 4185
Menor Valor da Tabela 4151
Maior Valor da Tabela 4189
Tabela 2 - Como encontrar o maior e o menor valor numa tabela de dados

Estatstica
19

5.3. TERCEIRA ETAPA: PREPARAO DO FORMULRIO DA TABELA DE FREQNCIA


Preparar um formulrio conforme mostrado na tabela 3, de modo que a classe, o intervalo
de classe, o ponto mdio da classe, as marcas de freqncia, a freqncia (f) e a freqncia
relativa possam ser registradas.

Classe Intervalo de Ponto Mdio Freqncias Freqncia Freqncia


no Classe da Classe (Marcas) f Relativa

Total 100 0,01


Tabela 3 - Formulrio para Tabela de Freqncia.

Observe que:

a) a soma das freqncias (f) tem que ser igual quantidade (n) de dados levantados
(neste caso: 100);

b) a freqncia relativa, quando desejada, obtida pela diviso de f por n.

5.4. QUARTA ETAPA: DETERMINAO DAS CLASSES


Determinar os limites dos intervalos de forma que incluam o menor e o maior valores
levantados e anotar no formulrio para Tabela de Freqncia. Determinar o limite inferior
da primeira classe e acrescentar a amplitude do intervalo a ele, para obter o limite entre a
primeira e a segunda classe. Assegurar-se de que a primeira classe contenha o menor valor
observado. Os limites de classe devem ter um decimal a mais que os dados reais, sendo o
ltimo dgito igual a 5. Continuar a adicionar a amplitude do intervalo ao valor anterior
para obter o segundo limite, o terceiro etc at alcanar a ltima classe. Conferir se a ltima
classe contm o valor mximo observado. Preencher o formulrio adequadamente com
estes valores.

Estatstica
20

5.5. QUINTA ETAPA: CLCULO DO PONTO MDIO DE CADA CLASSE


Calcular o ponto mdio da primeira classe, somando os valores dos limites superior e
inferior da primeira classe e dividindo o resultado por 2. Anotar no formulrio da tabela de
freqncia. Prosseguir com o mesmo mtodo para as outras classes. Alternativamente, os
pontos mdios da segunda, terceira e demais classes tambm podem ser obtidos somando-
se ao ponto mdio da primeira classe o intervalo de classe e assim sucessivamente.

5.6. SEXTA ETAPA: OBTENO DAS FREQNCIAS


Ler todos os valores contidos na tabela 1 e colocar uma marca ( | ) para cada valor,
agrupando-as de 5 em 5, de acordo com as classes a que pertenam. Veja exemplo na
tabela 4. Contar quantas marcas foram registradas e anotar na coluna Freqncia (f).
Calcular a freqncia relativa, dividindo f por n.

Intervalo de Ponto Mdio Freqncias Freqncia Freqncia


Classe no
Classe da Classe (Marcas) (f) Relativa
1 4150,5 a 4155,5 4153,5 || 002 0,002
2 4155,5 a 4160,5 4158,5 ||||| ||| 008 0,008
3 4160,5 a 4165,5 4163,5 ||||| ||||| ||| 013 0,013
4 4165,5 a 4170,5 4168,5 ||||| ||||| ||||| ||||| ||||| 025 0,025
5 4170,5 a 4175,5 4173,5 ||||| ||||| ||||| ||||| ||||| | 026 0,026
6 4175,5 a 4180,5 4178,5 ||||| ||||| ||||| 015 0,015
7 4180,5 a 4185,5 4183,5 ||||| ||| 008 0,008
8 4185,5 a 4190,5 4188,5 ||| 003 0,003
Total 100 0,010
Tabela 4 - Tabela de Freqncia.

6. DESENHANDO UM HISTOGRAMA DE FREQNCIA

a) Usando uma folha de papel quadriculado, marcar o eixo horizontal com uma escala
(mm). A escala deve ser baseada na unidade de medida dos dados (kg, oC, mm);

b) Deixar um espao aproximadamente igual ao intervalo de classe no eixo horizontal


antes da primeira e aps a ltima classe;

c) Marcar o eixo vertical da esquerda com a escala de freqncia. Traar o eixo vertical
da direita, marcando nele a escala de freqncia relativa;

Estatstica
21

d) Marcar o eixo horizontal com os valores limites das classes;

e) Usando o intervalo de classe como base, traar retngulos cuja altura corresponda
freqncia daquela classe;

f) Traar uma linha (trao-ponto) para representar a mdia e, se houver, traar linhas
verticais representando os limites da especificao;

g) Anotar a quantidade de dados (n), a mdia ( x ) e o desvio padro (s) e quando foi feita
a coleta de dados etc. Veja o exemplo da figura 2 para os dados da tabela 1.

6.1. POLGONO DE FREQNCIAS


A construo de um polgono de freqncias feita marcando o ponto mdio (central) no
topo de cada coluna do grfico de histograma e freqncia e unindo estes pontos com
uma linha cheia.

Figura 2 - Histograma baseado nos dados da tabela 1.


Nota: Esta linha sinuosa ( ) que comea no zero serve para economizar espao.
Com este recurso o valor 4151 pode ficar perto do zero.

Estatstica
22

Por exemplo, na tabela 4 calculamos o ponto mdio de cada classe. Vamos repetir o
histograma da figura 2, construindo a figura 3, e vamos marcar neste histograma o ponto
mdio de cada classe e em seguida vamos unir os pontos marcados. E para concluir o
grfico, imaginamos duas classes tericas, de ponto mdio = 0, nos dois extremos do
histograma.

Figura 3 - Polgono de Freqncias com os dados da tabela 3.

6.2. ESTRATIFICAO DE HISTOGRAMAS


De forma geral, a maioria dos estudos voltados deteco das causas de defeitos
envolve a associao dos dados de causas com os dados dos correspondentes efeitos. Neste
caso, a disposio dos dados numa ordem tal que mostre claramente esta correspondncia,
e mais tarde, a anlise dos dados atravs da estratificao por causas ou da construo de
histogramas de disperso em funo dessas causas podem facilitar a identificao das
fontes do problema.

Considere os dados da tabela 5. Foram coletados da medio de temperatura em


duas posies do forno, a saber: lado direito (A) e lado esquerdo (B). Foi feito o
histograma de todos os dados figura 4 - e posteriormente os dados foram estratificados
em dois histogramas (uma para o lado A e outro para o lado B) figura 5 - visando
identificar se h variaes de temperatura entre os lados do forno.

Estatstica
23

Foram identificadas diferenas nas temperaturas entre os dois sensores. Este mtodo pode
ser usado para melhorar a qualidade do produto, reduzindo a variao e melhorando a
mdia do processo. A estratificao geralmente feita de acordo com a metodologia 6M 6
(tambm conhecida como diagrama de Ishikawa, diagrama de causa-e-efeito ou ainda
espinha de peixe). Os 6M so: mtodo, mquina, mo-de-obra, meio-ambiente, matria
prima e medida.

o Temp. o Temp. o Temp. o Temp.


Medio N Forno Medio N Forno Medio N Forno Medio N Forno
em C em C em C em C

1 A 184,9 26 B 186,2 51 B 186,6 76 B 185,4


2 A 183,8 27 B 187,2 52 B 187,0 77 B 184,6
3 B 186,2 28 A 183,0 53 B 186,7 78 A 183,9
4 B 185,7 29 B 186,3 54 A 184,9 79 A 183,2
5 A 183,9 30 A 183,9 55 A 183,7 80 B 185,7
6 B 186,4 31 A 183,5 56 B 184,7 81 B 186,9
7 B 186,8 32 B 184,1 57 A 185,1 82 A 184,0
8 B 187,0 33 B 184,7 58 B 185,4 83 B 185,7
9 A 183,8 34 A 185,3 59 A 184,4 84 A 184,3
10 B 186,0 35 A 184,5 60 A 184,2 85 B 186,0
11 B 186,3 36 A 184,5 61 B 185,8 86 A 183,6
12 A 183,0 37 B 186,2 62 A 185,1 87 B 186,0
13 A 183,5 38 A 184,1 63 A 184,4 88 A 183,6
14 A 182,7 39 A 183,2 64 A 183,8 89 B 186,5
15 B 185,2 40 B 186,2 65 B 187,0 90 B 187,6
16 B 186,7 41 A 182,9 66 B 186,9 91 A 184,7
17 A 183,1 42 A 183,8 67 B 185,5 92 A 185,1
18 B 185,9 43 A 183,7 68 A 183,7 93 A 183,8
19 B 187,5 44 B 186,6 69 B 186,0 94 B 186,6
20 A 183,8 45 B 185,7 70 A 184,5 95 B 186,7
21 B 187,5 46 A 182,9 71 B 187,9 96 A 184,3
22 A 184,4 47 B 186,9 72 A 182,7 97 A 183,7
23 A 183,4 48 B 186,1 73 A 184,2 98 B 184,9
24 A 184,3 49 B 186,0 74 A 183,9 99 B 185,8
25 B 186,1 50 A 183,8 75 B 185,5 100 B 184,1
Tabela 5 - Dados da medio de temperatura do forno Lados A e B.

6
As Ferramentas da Qualidade no Gerenciamento de Processos Werkema, Maria C. Catarino

Estatstica
24

25

20

15

10

0
1 2 3 4 5 6 7
Figura 4 - Histograma de Freqncia da Medio de Temperatura nos lados A e B

16
14

14
12
12
10
10
8
8

6
6

4
4

2 2

0 0
1 2 3 4 5 6 7 1 2 3 4 5 6 7 8
Figura 5 - Histogramas Estratificadas da
Temperatura do Forno
a) lado direito: posio A; b) lado esquerdo: posio B.

7. PARMETROS DA DISTRIBUIO DE FREQNCIA

A distribuio de freqncias mostra os dados em formas e formatos comuns. Os nmeros


tm uma tendncia de se agrupar e mostrar padres semelhantes. Estes padres podem ser
identificados, medidos e analisados. Na anlise dos dados de uma distribuio de
freqncias h quatro parmetros importantes: tendncia central, disperso, desvio e
curtose.

Estatstica
25

7.1. TENDNCIA CENTRAL


A maioria das distribuies de freqncia exibe uma tendncia central, isto , uma forma
tal que a maior parte das observaes se acumula na rea entre os dois extremos.
Tendncia Central um dos conceitos fundamentais em toda a anlise estatstica. a
mdia dos pontos. As curvas podem ter diferentes simetrias e disperses, mas a mesma
tendncia central. Tambm possvel ter curvas com a mesma simetria e mesma disperso,
mas com diferente tendncia central.

7.2. DISPERSO
a caracterstica que indica o grau de espalhamento dos dados. Tambm chamada de
variao.

7.3. ASSIMETRIA
Indica o grau de distoro em uma curva simtrica ou o grau de assimetria. Uma curva
simtrica possui os lados direito e esquerdo da lei de centro iguais. Os dois lados de uma
curva simtrica so imagens de cada lado. Uma curva se distorce para direita quando a
maioria dos valores est agrupada no lado direito da distribuio.

7.4. CURTOSE
a caracterstica que descreve o pico em uma distribuio. uma medida relativa para
comparar o pico de duas distribuies. Uma maior curtose significa um pico maior de
freqncia relativa, no maior quantidade de dados.

H trs classes de curtose: platicrtica (curva plana e esparramada), leptocrtica (curva


com pico estreito e alto) e mesocrtica (intermediria entre as duas outras).

Estatstica
26

8. MDIA ARITMTICA

Os dados podem ser reduzidos a um nico nmero, para fins de comparao. A mdia ou
valor mdio o mais representativo de um conjunto de dados ou medies. Quanto maior o
nmero de medies feitas, melhor ser o resultado. O valor mdio a expectativa
matemtica do conjunto de dados.

A mdia aritmtica a mdia mais usada e calculada como sendo a soma de todas as
medidas de um conjunto dividida pelo nmero total de medidas. Se uma varivel x possui
os n valores: x1 , x2 , ...., xn , a mdia aritmtica, x , (leia-se: xis barra) :

x1 + x2 + ... + xn
x=
n

x i
Simplificando esta frmula podemos usar x= i =1
n
Onde:

x = mdia aritmtica

= letra grega Sigma

x
i =1
i = somatrio de todos os valores xi na amostra (i varia de 1 at n)

n = tamanho da amostra

Exemplo: Calcular a mdia de: 25, 36, 45 e 72. Usando a frmula, temos:

25 + 36 + 45 + 72
x= = 44,5
4
Logo, a mdia aritmtica, ou simplesmente, a mdia : 44,5.

importante observar que a mdia baseia-se em todas os elementos do conjunto de dados,


por isso ela altamente afetada pelos valores extremos. Por isso, s vezes, a mdia
aritmtica apresenta uma representao distorcida daquilo que os dados esto transmitindo;
assim sendo, a mdia aritmtica no seria, sozinha, a melhor medida a ser utilizada para
descrever ou resumir tal conjunto de dados.

Estatstica
27

Quando se tem uma populao muito grande de dados (n tende para o infinito), o smbolo
da mdia expresso como:
n

x i
= i =1
n

Sendo = smbolo da mdia (para n grande).

Deve-se sempre fazer de trs a cinco replicaes de uma medio. Os resultados


individuais de um conjunto de medies so raramente os mesmos e usa-se a mdia como
melhor valor para o conjunto, pois a mdia sempre mais confivel do que qualquer
resultado individual. A variao nos dados deve fornecer uma medida da incerteza
associada com o resultado.

9. MDIA PONDERADA

s vezes as medies x1 , x2 , ...., xn , esto associadas com certos fatores de peso, como

p1 , p2 , ...., pn, respectivamente, dependendo da importncia associada a estes

nmeros. Neste caso, define-se a mdia aritmtica ponderada como:

x1 p1 + x2 p2 + ... + xn pn
xp =
p1 + p2 + ... + pn
A mdia ponderada muito usada nas mdias escolares, onde se pode atribuir importncias
(pesos) diferentes ao exame final, trabalhos de casa, aulas prticas e provas mensais.

Em metrologia, a mdia ponderada mais comum usa as freqncias das medies como
seus respectivos pesos. Freqncia o nmero de vezes que um dado observado.
Freqncia relativa a percentagem de vezes que um dado observado.

Considere a Figura 6, de distribuio de freqncias com k classes. Sejam


x1 , x2 , ...., xk , os valores dos pontos mdios de classe e sejam f1 , f 2 , ...., f k , as

respectivas freqncias, como mostra a Figura 6.

Estatstica
28

Ponto Mdio Freqncia


x1 f1
x2 f2
. .
. .
. .
xk fk
Figura 6 - Distribuio de freqncias com k classes.

x p = x1 f1 + x2 f 2 + ... + xk f k
k

fx i i
xp = i =1
k

f
i =1
i

Onde f i a freqncia relativa da ocorrncia da medio xi .


k
Nota: A expresso f
i =1
i ser sempre igual a n (neste caso: 100).

Vejamos um exemplo. Considere os dados da tabela 6 (esta tabela a mesma j estudada


anteriormente). E que desejssemos calcular a mdia, baseando-nos apenas nos dados desta
tabela.

(Ponto
Intervalo Ponto
Classe Freqncias Freqncia Freqncia Mdio
de Mdio
no (Marcas) (f) Relativa Classe) x
Classe da Classe
(Freqncia)
4151,5 a
1 4153,5 || 002 0,002 8307,00
4156,5
4156,5 a
2 4158,5 ||||| ||| 008 0,008 33268,00
4161,5
4161,5 a
3 4163,5 ||||| ||||| ||| 013 0,013 54125,50
4166,5
4166,5 a
4 4168,5 ||||| ||||| ||||| ||||| ||||| 025 0,025 104212,50
4171,5
4171,5 a ||||| ||||| ||||| ||||| |||||
5 4173,5 026 0,026 108511,00
4176,5 |
4176,5 a
6 4178,5 ||||| ||||| ||||| 015 0,015 62677,50
4181,5
4181,5 a
7 4183,5 ||||| ||| 008 0,008 33468,00
4186,5
4186,5 a
8 4188,5 ||| 003 0,003 12565,50
4191,5
Total 100 0,010 417135,00
Mdia 4171,35
Tabela 6 - Tabela de Freqncia.

Estatstica
29

Podemos observar que a soma da coluna Freqncia (f) 100 (total de elementos que
compem esta amostra). Para obtermos a mdia do dimetro dos 100 eixos desta tabela,
multiplica-se o ponto mdio de cada classe (2a coluna) pela respectiva freqncia, somam-
se os produtos e divide-se a soma por n (neste caso, k =8, pois so 8 classes de
freqncia). Ento a mdia :
k

f x ( f x + f x + ... + f x ) 2 * 4153,5 + 8 * 4158,5 + ... + 3 * 4188,5


i i
xp = i =1
= 1 1 2 2
= 8 8
k
f + f + ... + f 2 + 8 + ... + 3
f
i =1
i
1 2 8

417135
xp = = 4171,35
100

10. MDIA DA RAIZ DA MDIA DOS QUADRADOS

Quando temos dados positivos e negativos e as suas influncias se somam, no podemos


tirar a mdia aritmtica, pois a soma algbrica dos dados cancelam seus valores. Ento se
utiliza a frmula:

x rms = (x2
1 + x 22 + ... + x n2 )
Esta frmula tambm usada em metrologia, quando se quer combinar diversos erros, por
exemplo, numa malha de medio. Neste caso, x1 , x2 , ...., xn , seriam os erros de cada

componente da malha de medio e x rms seria o erro mdio da malha.

Estatstica
30

11. MEDIA HARMNICA

A mdia harmnica dada pela frmula:

n
xh = n
1
x
i =1 i

usada quando se deseja calcular a mdia de grandezas inversas. Por exemplo: Suponha
que um tanque esteja alimentando trs clientes, com vazes individuais de 100, 120 e 140
litros por minuto. Deseja-se saber qual a vazo mdia. Aplicando a frmula da mdia
harmnica, temos:

n 3
xh = = = 117,76
n
1 1 1 1
x
i =1
+ +
100 120 140
i

A vazo mdia de 118 litros por minuto.

12. MEDIANA

A Mediana o valor central quando os dados esto ordenados por valor e a amostra possui
nmero mpar de dados. Por exemplo:

4, 6, 8 12 e 18, a mediana 8.

Se a amostra contm um nmero par de dados, a mediana a mdia aritmtica dos dois
valores que ficam na posio central dos dados ordenados. Por exemplo:

25, 30, 35, 40, 60, 80, 90 e 100.

Os dois valores que ficam na posio central so 40 e 60, logo a mediana ser:

40 + 60
= 50
2

Veja que no grfico da Figura 7 os dados esto representados ao longo do eixo e que a
posio da mediana (linha pontilhada) est assinalada (50) e divide a amostra em dois
conjuntos com igual nmero de dados (4 dados para cada lado).

Estatstica
31

Figura 7 - Distribuio dos dados sobre o eixo e a respectiva mediana.

A mediana usada para reduzir o efeito dos valores extremos ou para dados que possam
ser ordenados, mas que no sejam economicamente mensurveis (tons de cor, aparncia
visual, odores). Na curva percentil, o valor da escala horizontal onde a curva alcana a
altura 50%.

13. MODA

A Moda o valor que ocorre com maior freqncia. Por exemplo: 12, 14, 15, 15, 15, 18,
29, 29, e 30. A moda 15, pois este o nmero que ocorre maior nmero de vezes.
Existem conjuntos de dados que no possuem moda, porque nenhum valor se repete maior
nmero de vezes e existem conjuntos de dados com mais de uma moda. Por exemplo: 7, 8,
9, 10, 11, 12 e 18 no tem moda e o conjunto de nmeros 7, 8, 8, 9, 10, 11, 11, 12 e 18 tem
duas modas, a saber, 8 e 11.

A moda, diferentemente das outras medidas de tendncia central, pode ser obtida mesmo
que a varivel seja qualitativa. Veja os dados apresentados na tabela 7. O sangue tipo A
ocorreu com maior freqncia entre os doadores de sangue no ms de junho.

Tipo de Sangue Freqncia


O 680
A 735
B 246
AB 97
Tabela 7 - Doadores de sangue, segundo o tipo de sangue.

A moda tambm usada para distribuies extremamente assimtricas, situaes


irregulares onde dois picos so encontrados, ou para eliminar os efeitos dos valores
extremos.

Estatstica
32

14. MEDIDAS DE DISPERSO

Os dados esto sempre dispersos ao redor da zona de tendncia central, e a extenso dessa
disperso chamada disperso ou variao. Uma medida de disperso a segunda das
duas medidas mais fundamentais em toda a anlise estatstica.

Dentre as medidas de disperso, vamos estudar a amplitude, a varincia, o desvio padro e


o coeficiente de variao.

15. AMPLITUDE

Dentre as vrias medidas de disperso, a mais simples a Amplitude, que a diferena


entre os valores mximo e mnimo dos dados. Por exemplo, calcular a amplitude entre os
dados:

5, 8, 12, 17 e 32 a amplitude 32 5 = 27

Como a amplitude baseada em dois nmeros, mais til quando o nmero de


observaes pequeno (cerca de 10 ou menos).

Entretanto a amplitude nem sempre nos mostra certas diferenas contidas nos dados. Sua
deficincia reside no fato de que usa apenas os valores extremos e no todos os dados.
Mesmo assim, ela muito usada, principalmente pela facilidade com que calculada e
interpretada.

Estatstica
33

16. VARINCIA

Embora a amplitude seja uma medida de disperso, como vimos anteriormente, ela no
leva em conta como os dados se distribuem ou se agrupam. Duas maneiras utilizadas para
medir a variao que realmente considera como os dados se distribuem em torno da mdia
so a varincia e o desvio padro.

Para um conjunto de dados composto de: x1 , x2 , ...., xn , a varincia calculada usando a

frmula:

s2 =
(x x ) + (x
1
2
2 )
2
(
x + ... + xn x )
2

ou, simplificando
n 1

(x x )
n n

x
2
i
2
i n x2
s2 = i =1
ou podemos usar tambm s 2 = i =1
n 1 n 1

Esta segunda frmula facilita o clculo, quando usamos calculadora simples.

Onde:

s 2 = varincia

x = mdia aritmtica

n = tamanho da amostra

xi = encimo valor da varivel aleatria x

(x )
n
2
i x = somatrio de todas as diferenas ao quadrado entre os valores xi e
i =1

Aqui convm explicar o uso de n 1 ao invs de n . Isto se deve a certas propriedades


matemticas desejveis possudas pela estatstica s 2 (varincia), que a tornam apropriada
para inferncia estatstica. medida que cresce o tamanho da amostra, n , a diferena na
diviso por n ou por n 1 vai se tornando cada vez menor.

Estatstica
34

Os estatsticos chamam a expresso n 1 de graus de liberdade. Quando calculamos a


mdia, x , utilizamos todos os n dados que compunham a amostra. Dizemos ento que no
clculo da mdia temos n valores de xi livres que devem ser considerados para

podermos calcular o valor desta estatstica. Ou seja, se qualquer dos valores de xi livres da
amostra for desconhecido, no poderemos determinar o valor desta estatstica, pois todos
os valores da amostra so livres, podendo variar aleatoriamente.

Por outro lado, a estatstica da varincia expressa pela equao acima, por usar a mdia, x ,
ao invs do parmetro populacional , tem um grau de liberdade a menos. Isso ocorre
porque o clculo dessa estatstica pressupe que anteriormente j se tenha usado todos os
valores da amostra no clculo da mdia, x , os quais estariam sendo usados uma segunda
vez no clculo da varincia. Ou seja, ao usarmos o mesmo conjunto de dados para
determinar a mdia, x , e a varincia que faz uso do valor da mdia, perdemos um grau de
liberdade para a determinao da mdia.

17. DESVIO PADRO

O desvio-padro, s, a medida mais importante de variao. Ele determina a disperso dos


valores em relao mdia. O desvio-padro da amostra a raiz quadrada da varincia, ou
seja:

s = s 2 ou substituindo s 2 , temos:

(x + x )
n
2
i
s= i =1
n 1

Estatstica
35

Exemplo: Calcular o desvio padro de: 10, 12, 9, e 14.

x1 + x2 + ... + xn
A mdia ser: x =
n

10 + 12 + 11 + 15
x= = 12
4

(x )
n
2
i x
A varincia ser: s 2 = i =1
n 1

s 2
=
(10 12) + (12 12 ) + (11 12) 2 + (15 12) 2
2 2

4 1

(2) 2 + (0) 2 + (1) 2 + (3) 2 14


s2 = = = 4,666
3 3

O desvio padro ser: s = s 2

s = 4,666 = 2,160

Convm ressaltar que a varincia e o desvio padro nunca podem ser negativos. Entretanto
podem ser zero, o que ocorre quando todos os valores so exatamente iguais. Neste caso, a
amplitude tambm ser zero.

A varincia e o desvio padro medem a disperso mdia em torno da mdia aritmtica


ou seja, como os valores maiores e menores se distribuem acima e abaixo da mdia,
respectivamente.

Estatstica
36

18. COEFICIENTE DE VARIAO

O coeficiente de variao, cv( x) , definido como o quociente entre o desvio padro e a


mdia. Ele mede a disperso em torno da mdia aritmtica. Freqentemente expresso em
porcentagem. Sua frmula :

s
cv( x) = 100 %
x

Onde:
cv( x) = coeficiente de variao

s = desvio padro

x = mdia aritmtica

A vantagem do coeficiente de variao como uma medida relativa devido ao fato de que
ele nos permite comparar a variabilidade de dois ou mais conjuntos de dados expressos em
diferentes unidades de medio. Ou ento quando comparamos dois ou mais conjuntos de
dados nas mesmas unidades, porm com diferenas entre si de tal monta que no permita
comparao direta entre suas mdias e seus desvios padres. Por exemplo, imagine que em
dois grupos de pessoas tenham sido calculadas a idade mdia e o desvio padro, conforme
abaixo:

Grupo 1: x1 = 20 e s1 = 4

Grupo 2: x2 = 50 e s2 = 4

Se ambos os grupos tm o mesmo desvio padro, a priori, comparar a disperso de suas


idades um pouco difcil. Fazendo uso do coeficiente de variao, temos:

Grupo 1: cv1 = s1 / x1 * 100 = 4/20*100 = 20 %

Grupo 2: cv2 = s2 / x2 * 100 = 4/50*100 = 8 %

Estatstica
37

Podemos agora concluir que, mesmo tendo desvio padro igual, o grupo 1 apresenta uma
variao relativa muito maior (20 %) do que o grupo 2 (8 %).

Alm disso, por ser adimensional, o coeficiente de variao permite que se comparem as
disperses de variveis cujas unidades sejam irredutveis.

19. FORMATO

A terceira propriedade importante em um conjunto de dados o seu formato, ou seja: a


maneira como os dados esto distribudos. Esta distribuio pode ser simtrica ou
assimtrica.

Para saber o formato de um conjunto de dados, basta comparar sua mdia com sua
mediana, ou seja:

Se a mdia > mediana: assimetria direita (ou positiva).

Se a mdia = mediana: assimetria em zero (ou simetria).

Se a mdia < mediana: assimetria esquerda (ou negativa).

20. DISTRIBUIO DE PROBABILIDADES

Por causa de suas caractersticas, a distribuio da probabilidade est relacionada com as


distribuies de freqncia. Mas, na distribuio de freqncia, as freqncias so nmeros
observados de eventos ocorridos e a na distribuio da probabilidade, a freqncia
derivada da probabilidade de eventos que podem ocorrer.

H diversas distribuies de probabilidades, entre elas:

a) distribuio binomial;

b) distribuio de Poisson;

c) distribuio normal

Estatstica
38

d) distribuio uniforme (ou retangular)

e) distribuio triangular

f) distribuio t (Student)

As duas primeiras distribuies so distribuies de probabilidades discretas, ou seja, so


distribuies de probabilidade para uma varivel discreta.

Varivel discreta aquela que pode assumir apenas valores isolados ao longo de uma
escala. Por exemplo: o nmero de altos fornos existentes na CST uma varivel discreta.

As outras distribuies so funes de densidade de probabilidades contnuas. Essas


distribuies encontram importantes aplicaes na engenharia, nas cincias fsicas, bem
como na rea financeira e em cincias sociais.

20.1. INTRODUO AO CLCULO DE PROBABILIDADES


Os elementos bsicos da teoria da probabilidade so os resultados do processo (ou
fenmeno) em estudo. Cada tipo possvel de ocorrncia relacionado como um evento.

Probabilidade , portanto, a possibilidade ou a chance de que um evento em particular


venha a ocorrer. Pode ser a chance de acertar uma das faces da moeda atirada ao ar, ou de
se encontrar uma carta num baralho ou mesmo de acertar na sena.

Em cada um desses eventos a probabilidade a proporo ou a frao cujos valores variam


entre 0 e 1, inclusive. bom frisar que um evento que no tem chance de ocorrer, o evento
nulo, tem uma probabilidade 0 e um evento que certamente ir acontecer, evento certo,
tem a probabilidade 1.

Examine as duas frases seguintes:

a) provvel que Pedro no venha aula amanh.

b) provvel que a Atlntica tenha existido.

Estatstica
39

Em ambas as frases esto presentes as idias de incerteza e grau de confiana que


depositamos naquilo que afirmamos. Embora a palavra provvel tambm nos d a idia de
futuro, na segunda frase estamos afirmando algo que deve ter ocorrido no passado se
que ocorreu, pois neste caso a probabilidade no est ligada ao tempo, mas sim eventual
veracidade da prpria afirmao.

Em um dado experimento um evento deve ocorrer ou no ocorrer, como por exemplo, ao


jogar uma moeda ao ar, a probabilidade da ocorrncia de cara mais a probabilidade da
no ocorrncia de cara ser sempre igual a 1. Ento:

P(X) = P(X) + P (X) = 1

Ou seja, o complemento de um evento X inclui todos os eventos que no fazem parte de X,


e representado por X.

Lanando-se uma moeda um nmero grande de vezes, dever aparecer cara em metade dos
lanamentos e coroa no restante. A freqncia relativa de caras se aproxima de 0,5
conforme aumentado o nmero de lanamentos da moeda. Portanto a freqncia relativa
de um ponto amostral pode ser tomada, aproximadamente, como a sua probabilidade.

Por definio, probabilidade o nmero de resultados da diviso do nmero de casos


favorveis a um evento pelo nmero total de casos possveis.

Por exemplo: ao jogar a moeda uma nica vez, a probabilidade de sair cara de 0,5 (50%
de chance de acertar). Logo a frmula :

(nmero de vezes que o evento


CARA pode sair numa jogada)
(Probabilidade de sair cara) = ----------------------------------------------
(Nmero total de casos possveis)
Uma moeda honesta s tem uma cara e uma coroa, logo, o nmero total de eventos
possveis so 2 (1 cara + l coroa). Ento,

1
Probabilidade de CARA = = 0,5
2

Estatstica
40

O smbolo P usado para designar a probabilidade de um evento. Ento P(X) denota a


probabilidade de o evento X ocorrer em uma s observao ou experimento.

A frmula resumida para a probabilidade :

f
P(X) =
p

Onde:

P(X) = probabilidade de ocorrer o evento X

f = nmero de eventos favorveis ocorrncia de X

p = nmero de casos possveis

No exemplo anterior, diramos:

f 1
P( X ) = = = 0,5
p 2

Observe que a probabilidade sempre expressa por um nmero adimensional, isto , sem
unidade de medida.

Veja este exemplo: Qual a probabilidade de sair a face 3 ao lanar um dado uma vez?

Casos possveis: Face 1, Face 2, Face 3, Face 4, Face 5, Face 6. Ou seja, temos 6 casos
possveis. Casos favorveis: somente uma face 3. Logo, usando a frmula.

Face 3
P(de sair Face 3) =
Face 1 + Face 2 + Face 3 + Face 4 + Face 5 + Face 6

1
= = 0,1666...
6

Estatstica
41

20.2. REGRA DA ADIO


Outro exemplo: Qual a probabilidade de sair face impar numa nica jogada? Temos como
nmero de casos favorveis trs eventos: Face 1 ou Face 3 ou Face 5. E como nmero total
de casos possveis 6 eventos: Face 1, Face 2, Face 3, Face 4, Face 5, Face 6. Aplicando a
frmula, temos:

Face 1 + Face 3 + Face 5


P(de sair Face 1 ou Face 3 ou Face 5) =
Face 1 + Face 2 + Face 3 + Face 4 + Face 5 + Face 6

3 Faces 3 1
= = = = 0,5
6 Faces 6 2

Observando este exemplo, conclui-se que em probabilidade a palavra ou significao


adio.

Por definio, f p, sendo que f pode ser zero. Veja o seguinte exemplo: Numa nica
jogada, qual a possibilidade de sair a face 7. Observe que o dado no possui a face 7. Logo,

Zero casos favorveis


P(7) =
6 casos possveis

0
P(7) = = 0 e dizemos que esta a menor probabilidade que existe.
6

Em um dado experimento um evento deve ocorrer ou no ocorrer, como por exemplo, ao


jogar uma moeda ao ar, a probabilidade da ocorrncia de cara mais a probabilidade da
no ocorrncia de cara ser sempre igual a 1. Ento:

P(X) = P(X) + P (X) = 1

Ou seja, o complemento de um evento X inclui todos os eventos que no fazem parte de A,


e representado por X.

Lanando-se uma moeda um nmero grande de vezes, dever aparecer cara em metade dos
lanamentos e coroa no restante. A freqncia relativa de caras se aproxima de 0,5
conforme aumentado o nmero de lanamentos da moeda. Portanto a freqncia relativa
de um ponto amostral pode ser tomada, aproximadamente, como a sua probabilidade.

Estatstica
42

Se dois eventos, de um mesmo espao amostral, no tm pontos em comum, a


probabilidade de ocorrer um ou o outro a soma de suas probabilidades. Se a
probabilidade do primeiro no depende da probabilidade do segundo e vice-versa, a
probabilidade desses dois eventos ocorrerem simultaneamente o produto de suas
probabilidades individuais.

1 1 2 1
P (2 ou 5) = + = = = 0,333
6 6 6 3

20.3. REGRA DO PRODUTO

Uma moeda ser jogada duas vezes. Qual a probabilidade de ocorrer cara nas duas
jogadas? A probabilidade de ocorrer cara na primeira jogada :

1
P(ACARA) = = 0,5
2

A probabilidade de ocorrer cara na segunda jogada

1
P(BCARA) = = 0,5
2

Porque o fato de ocorrer cara na primeira jogada no modifica a probabilidade de ocorrer


cara na segunda jogada (eventos independentes). Para obter a probabilidade de ocorrer cara
nas duas jogadas (primeira e segunda), faz-se o produto:

1 1 1
{P(ACARA) e P(BCARA) }= 2 * 2 = 4 = 0,25

Suponha que numa urna tenha 3 bolas: duas brancas e uma vermelha. Retirando-se ao
acaso, uma bola e em seguida a outra (sem que a primeira tenha sido recolocada na urna),
qual a probabilidade de que as duas bolas sejam brancas:

A probabilidade de a primeira bola ser branca :

2
P(branca) = 3 = 0,6666...

Estatstica
43

A probabilidade de a segunda bola ser branca depende do que ocorreu na primeira retirada.
Se sair bola branca, a probabilidade de a segunda tambm ser branca :

1
P(branca) = = 0,5
2

Para obter a probabilidade de as duas bolas retiradas serem brancas, faz-se o produto

P(A e B) = P(A) * P(B)

2 1 2 1
=
= 3 * 2 = 6 3 = 0,3333...

Se A e B so independentes, a probabilidade de ocorrer A e B dada pela probabilidade de


ocorrer A, multiplicada pela probabilidade condicional de ocorrer B, dado que A ocorreu.
A frmula expressa assim:

P(A e B) = P(A) * P(B A)

Nota: P(B A) L-se: probabilidade de ocorrer B, dado que A j ocorreu (probabilidade


de sair bola branca j que bola branca j saiu).

21. DISTRIBUIO BINOMIAL

extremamente til para descrever muitos fenmenos. A distribuio binomial se aplica,


principalmente, contagem de eventos, onde as duas sadas possveis podem ser sucesso
ou falha, pea normal ou defeituosa. A formula :

n!
P ( x) = p x (1 p) n x
x!(n x)!

Estatstica
44

Onde:

P(x) = probabilidade de x sucessos

N = nmero de sucessos na amostra (x = 0, 1, 2, 3, ..., n)

n! = fatorial de n (ou seja: se n = 5, n! = 5*4 *3*2*1 = 120

p = probabilidade de sucesso

1-p = probabilidade de fracasso

Observe que a varivel aleatria x pode ser qualquer valor inteiro de 0 at n e que na
frmula acima o produto do termo p x (1 p) n x nos informa a probabilidade de obtermos
exatamente x sucessos entre n observaes numa determinada seqncia.

n!
Por outro lado, o termo nos mostra quantas combinaes de x sucessos entre n
x!(n x)!
observaes so possveis. Por isso, toda vez que um conjunto de parmetros n e p
especificado, uma distribuio binomial pode ser gerada.

Vejamos um exemplo. Jogando um dado trs vezes, qual a probabilidade de se obterem


exatamente duas faces 3? Os valores deste problema so: n = 3; x = 2. Vamos
primeiramente calcular p. Como o dado tem 6 faces, temos 6 casos possveis: Face 1, Face
2, Face 3, Face 4, Face 5 e Face 6. Casos favorveis: somente uma face 3. Logo, usando a
frmula:

Face 3 1
P(de sair Face 3) = =
Face 1 + Face 2 + Face 3 + Face 4 + Face 5 + Face 6 6

Estatstica
45

Logo, p = 1/6. Aplicando a frmula, temos:

n!
P ( x) = p x (1 p) n x
x!(n x)!

2 3 2
3! 1 1
1
P(x = 2) = 2!(3 2 )! 6 6

1
3 * 2 *1 1 1 5
=
2 *1(1) 6 6 6

6 5 5
= * = 3* = 0,0694
2 6 216

Ou seja, a probabilidade de 6,94% de chance de em 3 lances, obter duas faces 3. Para


evitar enfadonhos clculos, principalmente para n grande, pode-se usar tabelas disponveis
na literatura tcnica, onde se determina P(x) a partir de n e x.

22. DISTRIBUIO DE POISSON

Esta distribuio um caso limite da distribuio binomial, que d o nmero de


ocorrncias de um evento num intervalo de tempo. Ela se aplica quando se tem um numero
muito grande de eventos e quando a probabilidade de sucesso de cada tentativa e muito
pequena e por isso e tambm chamada de distribuio de eventos raros. Na pratica a
distribuio de Poisson se aplica anlise de controle da qualidade para estabelecer o
nmero de itens defeituosos ou o nmero de paradas da mquina, em um dado intervalo de
tempo.

Tendo x como varivel aleatria representando o nmero de eventos raros, ento a


probabilidade destes x eventos ocorrerem em algum intervalo de tempo especificado (ou
espao) dado pela frmula:

(e ) x
P( x) =
x!

Estatstica
46

Onde:

P(x) = probabilidade de x sucessos, dado o conhecimento de

e = 2,7182818284590... (nmero de Euler)

= nmero esperado de sucessos

x = nmero de sucessos

Veja o exemplo a seguir: Qual a probabilidade de que, num determinado minuto,


exatamente dois clientes iro chegar na agncia bancria, sabendo que: no horrio de
almoo, de 12 s 13 horas, chegam em mdia 180 clientes?

Soluo: A mdia de clientes por minuto = 3 e x = 2.

(e ) x
Aplicando a frmula P ( x) = , temos,
x!

e 3 * 32 9
P(x = 2) = = = 0,2240
2! (2,71828)3 * 2

Neste mesmo problema, qual seria a chance de que mais de dois clientes iro chegar em
um dado minuto?

Soluo: P(x > 2) = P(x = 3) + P(x = 4) + ... + P(x = )

Como porm a soma de todas as probabilidades em uma distribuio sempre 1, os termos


no lado direito da equao P(x > 2), tambm representam o complemento da probabilidade
de que x sejam menor ou igual a 2, ou seja: 1 - P(x 2). Portanto,

P(x > 2) = 1 - P(x 2) = 1 - [P(x = 0) + P(x = 1) + P(x = 2)]

(e ) x
E utilizando a equao P ( x) = , temos
x!

e 3 * (3)0 e 3 * (3)1 e 3 * (3) 2


P(x > 2) = 1 + + +
0! 1! 2!

= 1 - [0,0498 + 0,1494 + 0,2240]

= 1 - 0,4232 = 0,5768

Estatstica
47

Deste modo, vemos que existe uma chance de aproximadamente 42,3 % de que dois ou
menos clientes iro chegar ao banco a cada minuto e que existe uma chance de 57,7 % de
que trs ou mais clientes iro chegar.

23. DISTRIBUIO NORMAL

A distribuio normal uma distribuio contnua de probabilidade, fundamental para a


inferncia estatstica e anlise de dados. Os modelos contnuos so importantes nas
aplicaes de engenharia, cincias fsicas, cincias sociais e em finanas.

Uma forma abreviada de indicar que a varivel x se distribui normalmente (ou tem
distribuio normal) escrever:

x N ( ; 2 )

Onde e 2 so os parmetros fundamentais da distribuio normal.

23.1. PROPRIEDADES DA DISTRIBUIO NORMAL


Esta distribuio muito importante na estatstica pois:

a) Muitos fenmenos fsicos e muitos conjuntos de dados seguem uma distribuio


normal;

b) A distribuio normal possui propriedades matemticas precisas e idnticas para todas


as distribuies normais;

c) possvel provar que vrias estatsticas de amostras, principalmente a mdia, seguem a


distribuio normal, mesmo que a populao de onde foram retiradas as amostras no seja
normal;

d) Podemos utiliz-la para aproximar vrias distribuies de probabilidade discreta.

e) Ela oferece bases para a inferncia estatstica devido sua afinidade com o teorema do
limite central.

Estatstica
48

23.2. CARACTERSTICAS
A curva de distribuio deve ter as seguintes caractersticas:

a) simtrica em relao mdia, indicando que os erros negativos de determinado valor


so igualmente freqentes quanto os positivos;

b) O formato de uma curva de distribuio de probabilidade normal simtrico e se parece


com um sino (figura 8);

Figura 8 - Formato da Curva Normal.

c) O ponto mximo de f(x) o ponto ;

d) Os pontos de inflexo da funo so: x = + e x = - ;

e) Os parmetros so indicadores populacionais: mdia aritmtica () e varincia (2);

f) Existem infinitas curvas, basta que seja diferente um dos parmetros: ou 2. Veja a
figura 9;

Figura 9 - Trs distribuies normais com parmetros diferentes e .

Estatstica
49

g) A curva assinttica em relao ao eixo horizontal, isto , suas caudas aproximam-se


dele, mas no o tocam jamais;

h) A rea total sob a curva vale 1, porque essa rea corresponde probabilidade de a
varivel aleatria assumir qualquer valor real.

23.3. MODELO MATEMTICO


A expresso matemtica que representa a funo densidade da probabilidade
representada pelo smbolo f(x). Para a distribuio normal, o modelo empregado para obter
as probabilidades :

1 1 x 2
F ( x) = exp
2 2

onde:

exp = 2,7182818284590... (nmero de Euler)

= constante matemtica aproximada por 3,14159

= mdia aritmtica da populao

= desvio padro da populao

x = qualquer valor da varivel aleatria contnua, onde - < x < +

Avaliando os componentes da frmula padro para a funo de densidade da probabilidade


normal, podemos observar que e e so constantes matemticas. Logo as probabilidades
da varivel aleatria x so dependentes somente dos dois parmetros da distribuio
normal a mdia aritmtica da populao () e o desvio padro da populao (). Isto
significa que para cada par de valores de e , teremos uma distribuio de probabilidade
diferente.

Estatstica
50

23.4. DISTRIBUIO NORMAL PADRO


Para evitar os clculos exaustivos quando se usa a frmula acima, foi estabelecida uma
padronizao de dados, de modo que com a utilizao de apenas uma tabela Veja Anexo
A, seja possvel calcular os parmetros desejados.

Observe a figura 10(a). Imagine uma varivel x que tenha distribuio normal com media
aritmtica e desvio padro , pois se trata de uma populao (e no de uma amostra), e o
eixo vertical (das freqncias), for deslocado at o ponto , onde se localiza a mdia
aritmtica da populao. Esta operao pode ser chamada de mudana de origem, em
que o zero mudou de lugar. A nova curva ficou como mostrada na figura 10(b).

A frmula de converso passa a ser a seguinte:

x
Z=

Onde:

Z = varivel normal padronizada

= mdia aritmtica da populao

= desvio padro da populao

x = qualquer valor da varivel aleatria contnua, onde - < x < +

Freqncia

(a) (b)
Figura 10 - Converso de X em Z .

Estatstica
51

Assim, usando a frmula de converso, qualquer varivel aleatria normal x pode ser
convertida para uma varivel normal padronizada Z . Vejamos um exemplo:

O Supervisor de Inspeo de uma fbrica de tubos est interessado em conhecer melhor o


tempo que os inspetores levam para a calibrao de um medidor de presso. Aps realizar
a pesquisa, ele verificou que o tempo, em minutos, para calibrar o medidor distribudo de
maneira normal com mdia aritmtica () de 30 minutos e desvio padro () de 5 minutos.
A figura 11 mostra as curvas normais de x e de Z, juntas.

Figura 11 - Transformao da Escala X em Z .


A figura 11 nos mostra que possvel obter uma medida padronizada Z para qualquer
medida x, usando a formula de converso acima. Esta nova curva chamada de
distribuio normal reduzida ou ainda distribuio normal padronizada. Observe que nesta
nova curva, os parmetros mudaram:

=0
=1
Estas operaes e esses dados so muito importantes pelo seguinte:

Estatstica
52

As infinitas distribuies normais reduzem-se a apenas uma: x N(;2),

ou x N(0; 1), onde:

= 0 e 2= = 1 = 1
2

A varivel Z no tem unidade de medida, ou seja, um nmero puro. Esta notao


abreviada, x N(0;1), muito prtica e significa que a varivel x se distribui normalmente
(ou tem distribuio normal) e 0 a mdia aritmtica da populao e 1 a unidade de
medida, ou seja, o desvio padro.

Veja este exemplo. Suponha que um inspetor tenha feita uma calibrao em 45 minutos.
Pela figura 12 podemos concluir que este tempo est a uma unidade padronizada (ou seja, a
um desvio padro, 1) acima da mdia aritmtica. Veja os clculos utilizando a frmula de
converso:

x
Z=
substituindo, temos:

45 40
Z= =1
5

Figura 12 - A rea hachurada corresponde a 1 desvio padro (1 ).


e no caso de um inspetor que faa a mesma tarefa em 25 minutos, dizemos que este tempo
est a 3 unidades padronizadas (ou seja, 3 desvios padres, 3) abaixo da mdia, pois:

25 40
Z= = 3
5

Estatstica
53

Vemos assim que o desvio padro se tornou uma unidade de medida. Ou seja: 45 minutos
5 minutos mais demorado (ou seja, 1 desvio padro) do que o tempo mdio de 40 minutos,
assim como o tempo de 25 minutos 15 minutos (3 desvios padres) mais rpido do que a
mdia observada.

A figura 13 nos permite ainda observar mais uma caracterstica da curva normal. Por ser
simtrica, a rea total abaixo da curva vale 1, ou seja 100%, entre os limites - < x < +
pois todos os resultados caem dentro dela. Os traos verticais perpendiculares ao eixo de x
esto graduados em -3, -2, -1, , +1, +2 e +3. Alm disso, a rea coberta
por 1, 2, 3 vale, respectivamente, 68,26 %, 95,44 % e 99,74% independente de
sua largura.

Figura 13 - Graduao do eixo X. A rea hachurada vale 68,26 % (1).

Estatstica
54

23.5. APLICAES
Vamos agora aprender a usar a tabela de probabilidades (Anexo A). Esta tabela nos
permite resolver diversos problemas que envolvem uma varivel x normalmente
distribuda. Suponha x com os seguintes parmetros: N(45; 4). Qual ser o valor de Z para
x = 49,5? Aplicando a frmula de converso, temos:

x
Z= e, substituindo:

49,5 45
= = 2,25
2

Isto significa que Z est 2,25 desvios padres direita da mdia . Agora vamos localizar
este valor na tabela do Anexo A. Para consultar este valor preciso decompor Z em duas
parcelas, a saber:

a) Primeira parcela: parte inteira + a 1 casa decimal = 2,2

b) Segunda parcela: 0,0 + 2 casa decimal = 0,05

Em seguida, localiza-se a primeira parcela (2,2) na margem esquerda da tabela (na vertical)
e a segunda parcela (0,05) na margem superior (na horizontal). Ler o valor da clula
correspondente ao cruzamento destes valores (0,4878), o qual a probabilidade
correspondente rea da curva entre Zero e o Z calculado. A figura 14 mostra a curva
desta probabilidade.

Estatstica
55

Figura 14 - Probabilidade calculada para x= 49,5 e N(45/4).


No exemplo anterior, onde a mdia aritmtica da populao = 40, e o desvio padro da
populao = 5, e usando a notao N(0;1), temos: N(40;25), x = 45. O Z correspondente
foi calculado como sendo 1. A figura 15 ilustra este exemplo.

xN(40;25)
x = 45
Z=1

Figura 15 - A rea hachurada mostra a probabilidade para xN(40;25); x = 45; Z =1.

Estatstica
56

23.6. DISTRIBUIO DE AMOSTRAGEM DA MDIA ARITMTICA


A mdia aritmtica a medida de tendncia central mais utilizada. Ela tambm a melhor
medida quando se supe que a populao est normalmente distribuda. Do ponto de vista
de uma distribuio normal, podemos dizer que a mdia aritmtica possui trs propriedades
importantes:

a) ausncia de vis
b) eficincia
c) consistncia.
Com respeito primeira propriedade, podemos dizer que a mdia das mdias aritmticas
de todas as amostras possveis (de um dado tamanho de amostra n) ser igual mdia
aritmtica da populao .

Suponha que voc tenha uma populao Beta composta de (N = 5) valores: 1, 2, 3, 4 e 5.


Vamos retirar amostras de tamanho n = 2, com reposio e calcular a mdia obtida.
Construindo a tabela 8 com a mdia, temos:

SORTEIO NO SORTEIO NO 2
1 1 2 3 4 5
1 1 1,5 2 2,5 3
2 1,5 2 2,5 3 3,5
3 2 2,5 3 3,5 4
4 2,5 3 3,5 4 4,5
5 3 3,5 4 4,5 5

Tabela 8 - Mdia aritmtica das amostras.

Esta tabela mostra que a mdia uma varivel, pois tambm assumiu valores de 1 a 5.
Alm disso, existem grupos de dados em que a mdia ( x ) constante, por exemplo: 1 e 4,
2 e 3, 3 e 2 e 4 e 1, cuja mdia 2,5. Entretanto, verificamos que da populao Beta com 5
elementos, tiramos 25 amostras de tamanho n = 2.

Podemos calcular a mdia aritmtica da populao e a mdia das mdias aritmticas ( x ) e


comparar os resultados.

Estatstica
57

a) Clculo da mdia aritmtica da populao

N =5; x = 1, 2, 3, 4, 5
N

x i
1 + 2 + 3 + 4 + 5 15
= i =1
= = =3
N 5 5

b) Calculo da mdia das mdias aritmticas (amostrais)

Amostra A

n =2 (tamanho = 2)

x =1; 1,5;2;2,5;...; 5

Veja os dados na tabela 9.

xi ni xi * ni
1 1 1
1,5 2 3
2 3 6
2,5 4 10
3 5 15
3,5 4 14
4 3 12
4,5 2 9
5 1 5
Soma 25 75
Tabela 9 - Calculando a mdia das medias aritmticas.

x= xn
i i
=
75
=3
n i 25

c) Comparao entre as mdias da populao e mdia das mdias amostrais

Comparando, temos x = .

Estatstica
58

23.7. ERRO PADRO DA MDIA ARITMTICA


As flutuaes das mdias aritmticas so pequenas quando comparadas com as flutuaes
dos elementos contidos na populao. Isto decorre diretamente da lei dos grandes
nmeros. A mdia aritmtica de uma determinada amostra comprova a mdia de todos os
valores da amostra. Mesmo em populaes com grandes variaes nos seus elementos,
quando estes so usados no clculo da mdia, seus impactos tendem a ser reduzidos, pois
no clculo so levados em conta todos os valores contidos na amostra.

Quanto maior o nmero de elementos na amostragem, menor ser o efeito dos extremos,
tanto acima quanto abaixo da mdia. Esta caracterstica expressa estatisticamente no
valor do desvio padro da mdia aritmtica da amostra. Esta a medida de variabilidade da
mdia aritmtica de amostra para amostra e chamada de erro padro da mdia
aritmtica, x . Considerando a amostragem com reposio, o erro padro da mdia

definido como sendo o desvio padro da populao dividido pela raiz quadrada do
tamanho da amostra n.


x =
n

Logo, medida que cresce o nmero de elementos (n) na amostra, o erro padro da mdia
vai decrescendo a um fator igual raiz quadrada do tamanho da amostra.

Quando no conhecemos a varincia (ou o desvio padro) da populao, usamos a frmula:

sx
sx =
n

onde sx = desvio padro amostral.

Neste caso, n 30.

Estatstica
59

23.8. TEOREMA DO LIMITE CENTRAL


O teorema do Limite Central muito importante, tanto na estatstica como na
Comprovao Metrolgica. Seu postulado o seguinte: medida que n cresce, as mdias
amostrais vo progressivamente tendendo a uma distribuio limite que a distribuio
normal, independentemente do formato da distribuio dos valores individuais na
populao.

Neste caso, n significa nmero de observaes em cada amostra. Qual deve ser o tamanho
da amostra? Como regra geral, se o tamanho da amostra for pelo menos igual a 30, a
distribuio de amostras da mdia aritmtica ser muito prxima da normal. Mas se temos
alguma informao sobre a populao podemos aplicar o teorema do limite central para
tamanhos de populao ainda menores. Se a distribuio da populao for relativamente
simtrica, recomenda-se pelo menos 15 elementos, mas se a populao for normal, a
distribuio de amostragem da mdia ser normal, independentemente do tamanho da
amostra.

Do Teorema do Limite Central segue-se que a distribuio de probabilidade da mdia


aritmtica q de n observaes qk de uma varivel aleatria q, com expectativa q e desvio

padro finito se aproxima de uma distribuio normal com mdia q e desvio padro

/ n quando n , qualquer que possa ser a distribuio de probabilidade de q.

Estatstica
60

24. DISTRIBUIO UNIFORME (OU RETANGULAR)

Numa distribuio de probabilidade retangular a probabilidade de que um valor de t esteja


dentro do intervalo [a - , a + ] igual a 1, para todos os pontos, e a probabilidade de que t
esteja fora deste intervalo essencialmente zero. A figura 16 mostra a curva da funo
densidade de probabilidade retangular.

Figura 16 - Distribuio retangular.

Como a rea total do retngulo vale 1 (100%), temos que:

rea = (a + a) * h = 1

1
h=
2a

e para a varincia:

a2
2 (t ) =
3

e calculando o desvio padro:

a2 a
(t ) = =
3 3

Estatstica
61

Por exemplo, as especificaes do fabricante para um voltmetro digital estabelecem que a


resoluo do mesmo na faixa de 10 V 0,000 1 V = 100 V. Se o instrumento for usado
para medir uma diferena de potencial V, e que a mdia aritmtica de um nmero de
observaes repetidas independentes de V encontrada como sendo V = 9,928 571 V.

Pode-se calcular a probabilidade de que o valor da diferena de potencial seja tal que a -
V a +, supondo que a resoluo declarada fornece fronteiras simtricas para uma

correo aditiva a V , V , de esperana igual a zero e com igual probabilidade de estar em


qualquer parte dentro das fronteiras [a - , a +]. A meia-largura a, mostrada na figura 16,

da distribuio retangular simtrica de valores possveis de V , ento,

a = 100/2 V
a = 50 V

a2
cuja varincia 2 (t ) =
3

a 2 (50) 2
( V ) = = = 833,3 V
3 3
( V ) = 833,3 V

a2 a
e o desvio padro (t ) = =
3 3

a2 a 50
( V ) = = = = 28,86 28,9 V
3 3 3

( V ) = 28,9 V

Outro exemplo, as especificaes do fabricante para um voltmetro digital estabelecem que


entre um e dois anos depois que o instrumento calibrado, sua exatido na faixa de 1 V
14 x 10-6 vezes a leitura mais 2 x 10-6 vezes a faixa. Considere que o instrumento usado
20 meses aps a calibrao para medir em sua faixa de 1 V uma diferena de potencial V, e
que a mdia aritmtica de um nmero de observaes repetidas independentes de V
encontrada como sendo V = 0,928 571 V.

Estatstica
62

Baseando-se na especificao do fabricante, pode-se calcular a probabilidade de que o


valor da diferena de potencial seja tal que a - V a +, supondo que a exatido declarada
fornece fronteiras simtricas para uma correo aditiva a V , V , de esperana igual a zero
e com igual probabilidade de estar em qualquer parte dentro das fronteiras [a - , a +]. A
meia-largura a, mostrada na figura 17, da distribuio retangular simtrica de valores
possveis de V , ento,

a = (14 x 10-6) X (0,928 571 V) + (2 x 10-6) X (1 V) = 15 V,


a = 15 V
a2
cuja varincia 2 (t ) =
3
a 2 (15) 2
( V ) = = = 75 V
3 3
( V ) = 75 V

a2 a
e o desvio padro (t ) = =
3 3

a2 a 15
( V ) = = = = 8,66 8,7 V
3 3 3

( V ) = 8,7 V

25. DISTRIBUIO TRIANGULAR

Acabamos de ver que no caso da distribuio retangular, por no haver conhecimento


especfico sobre os possveis valores de xi dentro de seus limites estimados [a - , a +
] foi
considerado que somente se poderia supor que seria igualmente provvel, para xi, tomar
qualquer valor entre esses limites, com probabilidade zero de estar fora deles. Em muitos
casos, mais realista esperar que valores perto dos limites sejam menos provveis do que
os que estejam perto do ponto mdio. , ento razovel substituir a distribuio retangular
simtrica, por uma distribuio trapezoidal simtrica, tendo lados inclinados iguais (um
trapezide issceles), uma base de largura a + - a - = 2a e um topo de largura 2a,

Onde 0 1.

Estatstica
63

Na medida em que 1, esta distribuio trapezoidal se aproxima da distribuio


retangular, vista anteriormente, enquanto que, para = 0, torna-se uma distribuio
triangular.

Numa distribuio de probabilidade triangular a probabilidade de que um valor de t esteja


dentro do intervalo [a - , a + ] igual a 1, para todos os pontos, e a probabilidade de que t
esteja fora deste intervalo essencialmente zero. A figura 17 mostra a curva da funo
densidade de probabilidade triangular.

Figura 17 - Distribuio triangular

Como a rea total do tringulo vale 1 (100%), temos que:

b * h (a + a ) * h
rea = = =1
2 2

2 1
h= =
2a a

a2
e para a varincia: (t ) =
2

Estatstica
64

a2 a
e calculando o desvio padro: (t ) = =
6 6

Por exemplo, suponha que se disponha poucas informaes sobre uma medio, a no ser
estas: Resultado das n = 20 medies, mdia aritmtica t = 200 psi e que t descrito
-
como uma distribuio triangular de limite inferior, a = 194 psi, e de mesmo limite
+ + -
superior a = 206 psi. Logo, a meia-largura a = [a - a ]/2 = (206-194)/2 = 12/2 = 6 psi.
A funo densidade de probabilidade de t , ento:

p(t) = (t - a - )/a2, para a - t (a + + a - )/2


p(t) = (a + - t )/a2, para (a + + a - )/2 t a +
p(t) = 0 para outros valores de t
Logo,

p(t) = (t - a - )/a2 = (200-194)/36 = 0,1666...


p(t) = 0,1666...
A figura 18 Ilustra graficamente a probabilidade triangular para o exemplo dado. A
esperana de t = [a + + a - ]/2 = (206 +194)/2 = 200 Co.

Figura 18 - Ilustrao grfica da probabilidade triangular para o exemplo dado.

Estatstica
65

26. DISTRIBUIO T (STUDENT)

Pelo que vimos at agora, se n 30, podemos usar a distribuio normal na estimao da
mdia da populao mesmo no conhecendo bem a populao. Para n < 30 somente se a
populao for normalmente distribuda e se for conhecido. A distribuio t de Student
utilizada quando a varivel x normalmente distribuda mas o no for conhecido.

Se uma populao normalmente distribuda, a distribuio de amostragem da mdia, para


qualquer tamanho de amostra, ser tambm normalmente distribuda. Isto verdade, quer
seja conhecido, quer no. Contudo, no processo de inferncia, cada valor da mdia
convertido para um valor normal padronizado.

A frmula :

x
t=
sx
n

Onde,

x = mdia aritmtica de uma amostra (pequena, n < 30)

= mdia aritmtica (presumida) da populao

medida que aumenta o tamanho da amostra (n), a distribuio t aproxima-se da forma da


distribuio normal, ou seja, a distribuio t pode ser aproximada pela distribuio normal
quando n 30, para uma nica amostra. Isso acontece porque, medida que o tamanho da
amostra fica maior, sx se torna uma melhor estimativa de .

Os valores de t para os graus apropriados de liberdade podem ser obtidos a partir da


Tabela 10 Tabela t (resumida) da distribuio t. A parte superior de cada coluna da
tabela t indica a rea na cauda direita da distribuio t (como so fornecidas entradas
positivas para t, os valores referem-se cauda superior) cada linha representa o valor t
especfico para cada grau de liberdade determinado. Exemplo: com 40 graus de liberdade e
95% de confiana, a cauda seria 1-/2, ou seja, para 95% de confiana significa que
sobrariam 5 % para as duas caudas, ou 2,5 % para cada cauda.

Estatstica
66

Como normalmente estes valores vem dividido por 100, temos 2,5/100 = 0,025. No
cruzamento da linha de 40 graus de liberdade com a coluna 0,025 encontramos o valor de t
= 2,0211.

Uma vez que t uma distribuio simtrica, com uma mdia aritmtica 0, se o valor da
cauda superior + 2,0211, o valor da cauda inferior ser -2,0211. Um valor de t = 2,0211
significa que a probabilidade de t exceder a + 2,0211 igual a 0,025 ou 2,5%, conforme
ilustrado na figura 20.

Aparentemente, a distribuio t muito parecida com a distribuio normal. Ambas tm


curvas em formato de sino e so simtricas. A distribuio t tem maior rea nas caudas e
menor rea do centro do que a distribuio normal. Isto se deve pelo fato de que
desconhecido e utiliza-se s para fazer sua estimativa. Como no estamos certos quanto ao
valor de , os valores de t sero mais variveis do que aqueles referentes a Z .

Notas:

a) O uso da estatstica t pressupe que a varivel tenha na populao de onde foi retirada
uma distribuio normal.

b) medida que n cresce, t tende a Z , principalmente quando n > 30

c) No existe uma nica distribuio t, mas uma famlia, ou seja, para cada n existe uma
distribuio e uma curva especfica.

Figura 19 - Distribuio t para 40 graus de liberdade.

Estatstica
67

27. GRAUS DE LIBERDADE

Os estatsticos chamam a expresso n 1 de graus de liberdade. Quando calculamos a


mdia, x , utilizamos todos os n dados que compem a amostra. Dizemos ento que no
clculo da mdia temos n valores de xi livres que devem ser considerados para podermos

calcular o valor desta estatstica. Ou seja, se qualquer dos valores de xi livres da amostra
for desconhecido, no poderemos determinar o valor desta estatstica, pois todos os valores
da amostra so livres, podendo variar aleatoriamente. Por outro lado, a estatstica da
varincia por usar a mdia, x , ao invs do parmetro populacional , tem um grau de
liberdade a menos. Isso ocorre porque o clculo dessa estatstica pressupe que
anteriormente j se tenha usado todos os valores da amostra no clculo da mdia, x , os
quais estariam sendo usados uma segunda vez no clculo da varincia. Ou seja, ao usarmos
o mesmo conjunto de dados para determinar a mdia, x , e a varincia que faz uso do valor
da mdia, perdemos um grau de liberdade para a determinao da mdia.

28. INTERVALO DE CONFIANA

Na verdade, nunca conhecemos o valor exato da mdia, , de uma populao de dados


porque seria necessrio um nmero infinito de medies. Entretanto, a teoria estatstica
permite estabelecer limites em torno da mdia obtida de uma amostra, x , e ento a mdia
verdadeira, , cai dentro destes limites com um dado grau de probabilidade. A esses limites
chamamos de limites de confiana e o intervalo que eles definem chamado de
intervalo de confiana.

O tamanho do intervalo de confiana, o qual derivado do desvio padro da amostra,


depende da certeza com que o desvio padro, , conhecido. Se h uma razo para
acreditar que o desvio padro amostral, sx , uma boa aproximao de , ento o intervalo
de confiana pode ser significativamente mais estreito do que o intervalo para baseado
em apenas duas ou trs medies.

Estatstica
68

A estimativa do intervalo de confiana comumente usada para fazer afirmaes de


probabilidade acerca de amostras retiradas de populao ou para prever os resultados de
uma futura amostra da mesma populao. Um mtodo comum determinar os limites de
confiana para um parmetro, de modo que se possa ter um determinado grau de confiana
de que o parmetro est dentro deste intervalo. Por exemplo: se for determinado um limite
de confiana de 95 %, ento, em longo prazo a mdia verdadeira (mdia das mdias) da
populao ir cair dentro dos limites em 95% das vezes em que for medida.

Os limites de confiana definem um intervalo em torno da mdia da amostra que


provavelmente contem a mdia da populao total.

O intervalo de confiana da mdia d os limites que podem ser reclamados, com um grau
de confiana dado por (1-)%, para conter o valor desconhecido da mdia da populao.
Quando o desvio padro da populao, , conhecido, o intervalo simtrico vale:


x z / 2 < < x + z /2
n n

Quando o desvio padro da populao, , no conhecido, mas se tem o desvio da


amostra, sx , usamos a distribuio t, com n-1 graus de liberdade.

sx s
x t /2 < < x + t /2 x
n n

Onde,

t / 2 = coeficiente de confiana, obtido na tabela x, a partir do grau de liberdade

() e do nvel de significncia () desejado.

O grau de liberdade () dado por n-1, onde n o nmero de dados da amostra (medies).
O nvel de significncia () igual a um menos o coeficiente de confiana, que
multiplicado por 100, d o intervalo de confiana (em %). Exemplo: Para 95% de
confiana, significa que se admite que 5% dos valores podem estar fora do intervalo de
confiana. Como na tabela t estes valores esto em probabilidade (0 a 1), logo 5% valem
0,05, ento = 0,05, ou seja: 1- ) = 0,95 que corresponde a 95%.

Estatstica
69

Para n = 2 temos n-1 grau de liberdade ( = n-1). Ento se voc consultar a tabela 9 da
distribuio t ver que t / 2 vale 12,71 para 95% de confiana, quando se faz apenas 2

medies. E t / 2 vale 4,30 e 3,18 quando se faz 3 e 4 medies respectivamente. Isto


significa uma reduo do intervalo de confiana de cerca de 12,71/3,18 = 3,9968 4 vezes,
quando se opta por fazer quatro medies ao invs de duas medies.

A rpida melhoria na confiabilidade de sx quando n aumenta sugere que se deva fazer


muitas medies, quando isso no consumir tempo excessivo e houver amostras
disponveis.

= (n-1) = 0,20 = 0,10 = 0,05 = 0,01


1 3,08 6,31 12,71 63,66
2 1,89 2,92 4,30 9,92
3 1,64 2,35 3,18 5,84
4 1,53 2,13 2,78 4,60
5 1,48 2,02 2,57 4,03
6 1,44 1,94 2,45 3,71
7 1,42 1,90 2,36 3,50
8 1,40 1,86 2,31 3,36
9 1,38 1,83 2,26 3,25
10 1,37 1,81 2,23 3,17
15 1,34 1,75 2,13 2,95
20 1,32 1,72 2,09 2,84
30 1,31 1,70 2,04 2,75
60 1,30 1,67 2,00 2,66
00 1,29 1,64 1,96 2,58

= (n-1), grau de liberdade


= (1 - intervalo de confiana)

Tabela 10 - Tabela t (resumida).

Estatstica
70

29. EXERCCIOS DE ESTATSTICA

Estatstica Bsica

1. As fichas de 60 alunos da 2. Srie de uma escola pblica esto arquivados em ordem


alfabtica. Qual a maneira mais rpida de amostrar um dcimo dos alunos

2. Uma amostra no-probalstica pode ser:

a) amostra de julgamento; amostra por quota; fatia


b) amostra de julgamento; fatia, amostra cheia
c) amostra por quota; fatia amostra cheia
d) amostra de julgamento; amostra por quota, amostra cheia
3. Amostra probabilstica pode ser:

a) amostra aleatria simples; por cota; amostra sistemtica; amostra de julgamento


b) amostra por quota; amostra sistemtica; amostra estratificada; amostra cheia
c) amostra aleatria simples; amostra sistemtica; amostra estratificada; amostra de
convenincia (grupo).
d) amostra por cota; amostra sistemtica; amostra estratificada; amostra cheia
4. Numa amostragem simples,

a) os elementos so divididos em grupos e sorteado um grupo que deve fornecer a


amostra
b) os elementos so retirados ao acaso da populao
c) os elementos so classificados por ordem de grandeza e em seguida so escolhidos
2 de cada extremo da lista.
d) Todos os elementos da populao so escolhidos.
5. Na anlise dos dados de uma distribuio de freqncias h quatro parmetros
importantes:

a) mdia, tendncia central, disperso e desvio


b) mdia, disperso, desvio e curtose
c) tendncia central, disperso, desvio e curtose
d) disperso, mdia, desvio e curtose

Estatstica
71

6. Disperso a caracterstica que indica:

a) o grau de espalhamento dos dados.


b) o grau de distoro em uma curva
c) o pico em uma distribuio
d) a mdia aritmtica dos dados
7. Se os pesos das notas forem p1 = 2, p2 = 4 , p3 = 1 e p4 = 3, a mdia ponderada de 8,
10, 6 e 7 :

a) 7,25
b) 8,3
c) 16,155
d) 7,75
8. A mdia harmnica dos nmeros 8, 9, 10 e 11 ?

a) 9,4
b) 9,5
c) 9,555
d) 9,367
9. A mediana dos nmeros 100, 20, 70, 40 e 60 ?

a) 58
b) 59
c) 60
d) 70
10. A mediana dos nmeros 4, 8, 6, 5, 10 e 7 ?

a) 6.666
b) 6,5
c) 7
d) 7,5
11. A moda dos nmeros 5, 7, 6, 6, 7, 8, 9, 10, 5, 7 ?

e) 5
f) 6
g) 10
h) 7

Estatstica
72

12. A amplitude dos nmeros 5, 7, 6, 6, 7, 8, 9, 10, 5, 7 ?

a) 5
b) 6
c) 7
d) 8
13. A varincia dos nmeros 8, 6, 7 e 9 :

a) 7,5
b) 1,118
c) 5,477
d) 1,29

14. O desvio padro de 8, 6, 7 e 9 ?

a) 1,136
b) 2,340
c) 1,057
d) 2,739
15. Dados a mdia = 5 e a varincia = 3,2, calcular o coeficiente de variao.

a) 64 %
b) 156,25 %
c) 35,78 %
d) 69,88 %

Estatstica
73

Probabilidades

16. As distribuies abaixo so distribuies discretas:

a) distribuio binomial e de Poisson


b) distribuio de Poisson e distribuio triangular
c) distribuio retangular e distribuio triangular
d) distribuio uniforme e distribuio t
17. Qual a probabilidade de sair a face 5 ao lanar um dado uma vez?

a) 5
b) 1.333
c) 1,6666
d) 2
18. Qual a probabilidade de sair face impar numa nica jogada?

a) 1,333
b) 0,5
c) 1,666
d) 3
19. Jogando-se uma moeda duas vezes, qual a probabilidade de ocorrer cara nas duas
jogadas?

a) 1,333
b) 1,666
c) 0,25
d) 2
20. Numa urna tem 3 bolas: duas brancas e uma vermelha. Retirando-se ao acaso, uma bola
e em seguida a outra (sem que a primeira tenha sido recolocada na urna), qual a
probabilidade de que as duas bolas sejam brancas?

a) 0,5
b) 1,3333
c) 1,6666
d) 0,3333

Estatstica
74

Distribuio Binomial

21. Jogando um dado 3 vezes, qual a probabilidade de se obterem exatamente 2 faces 5?

a) 6,94%
b) 10,94 %
c) 12,333 %
d) 1,666 %
22. Jogando uma moeda quatro vezes, quais so as chances de se obter duas caras?

a) 23/16
b) 2/3
c) 11/16
d) 15/32
Distribuio de Poisson

23. Se um telefone recebe em mdia duas chamadas por hora, qual a probabilidade deste
telefone no receber nenhuma chamada em uma hora?

a) 0,15
b) 0,1353
c) 0,2325
d) 0,4
24. Qual a probabilidade do telefone acima receber no mximo duas chamadas em 30
minutos?

a) 0,9197
b) 0,8133
c) 0,3333
d) 0,7156
25. Os parmetros da distribuio normal so:

a) e x
b) 2 e s2
c) e 2
d) s2 e

Estatstica
75

26. Numa fbrica, o tempo mdio para fabricar um eixo de 35 minutos (distribuio
normal), com desvio padro de 5 minutos. Qual a probabilidade de um trabalhador
escolhido aleatoriamente fabricar um eixo em menos de 25 minutos? Consultar a
tabela de distribuio normal padronizada (Anexo A).

a) 0,4772
b) 0,0228
c) 0,0456
d) 0,73,47
27. Usando os dados do problema anterior, qual seria a probabilidade de que um
trabalhador possa concluir o eixo entre 18 e 22 minutos?

a) 0,2345
b) 0,0482
c) 0,4735
d) 0,1935
Erro Padro da Mdia Aritmtica

28. Suponha que uma empacotadora esteja ajustada para encher pacotes de caf de 400
gramas. Dados anteriores confirmam uma distribuio normal, com mdia aritmtica
de 400 gramas. O desvio padro da populao conhecido como sendo igual a 12
gramas. Qual o erro padro da mdia aritmtica para uma amostra de 8 pacotes?

a) 1,50
b) 4,24
c) 4,35
d) 1,48

Estatstica
76

29. Suponha que uma empacotadora esteja ajustada para encher pacotes de caf de 400
gramas. Dados anteriores confirmam uma distribuio normal, com mdia aritmtica
de 400 gramas. O desvio padro da populao conhecido como sendo igual a 12
gramas. Qual a probabilidade percentual de que uma amostra de 15 pacotes, escolhida
aleatoriamente das centenas de pacotes, tenha uma mdia entre 380 e 390 gramas?

a) 40,15 %
b) 45,50 %
c) 12,93 %
d) 10,25 %
30. Considerando os dados do problema anterior, qual a probabilidade percentual de que os
pacotes tenham entre 396 e 400 gramas?

a) 46 %
b) 44,97 %
c) 13,35 %
d) 12,93 %
31. O certificado de calibrao de um peso padro de referncia fornece o valor de 1kg,
com incerteza de 5 mg, para um fator de abrangncia k = 2. Consultando o histrico
de um peso padro de valor nominal de 1 kg foi possvel estimar a deriva do seu valor,
entre duas calibraes, como sendo 1,5 mg. Considerando esta deriva como uma
funo de distribuio retangular, qual o valor da funo de densidade de
probabilidade?

a) 0,3000 mg
b) 0,3333 mg
c) 3,3333 mg
d) 0,8660 mg
32. Considerando os dados do exerccio anterior, qual a varincia da deriva?

a) 1,2990 mg
b) 0,70 mg
c) 0,75 mg
d) 3 mg

Estatstica
77

33. Supondo haver pouca informao sobre os dados, exceto que se trata de uma
distribuio triangular e que a melhor estimativa de t seja 300 oC, com os valores
limites de a - = a + = 4 oC. Qual seria a funo densidade de probabilidade de t?

a) 0,25 oC
b) 0,30 oC
c) 2,256 oC
d) 2,828 oC
34. Considerando os dados do exerccio anterior, qual a varincia desta funo?

a) 2,555 oC
b) 2 oC
c) 16 oC
d) 2,666 oC
35. Para uma distribuio t de Student, qual o valor crtico de t para (1- ) = 0,95 e n = 10?

a) 2,26
b) 2,22
c) 2,82
d) 1,83
Intervalo de Confiana

36. Sabe-se, pelas especificaes do fabricante, que o desvio padro da quantidade de leo
de soja nas latas de 1 litro igual a 0,02 litros. Uma amostra aleatria de 50 latas
selecionada e a quantidade mdia de leo por lata de l litro igual a 0,995 litros.
Calcular o intervalo de confiana de 99 % da verdadeira mdia da populao da
quantidade de leo de soja contida em uma lata de 1 litro.

a) 0,9877 1,0023
b) 0,9834 1,0065
c) 0,9945 1,0123
d) 0,9845 1,0043

Estatstica
78

37. Um novo suco de pssego testado para o mercado durante 3 meses, em filiais de uma
grande cadeira de supermercados. Os resultados para uma amostra de 21 filiais indicam
vendas mdias de R$ 8.600,00 com um desvio padro da amostra de R$ 240,00.
Calcular o intervalo de confiana para 99 % de vendas desse novo suco.

a) 8.460,89 8.739,11
b) 8.464,89 8.735,11
c) 8.467,60 8.732,40
d) 8.450,99 8.749,01

30. RESPOSTAS DOS EXERCCIOS DE ESTATSTICA

Estatstica Bsica

1. Resposta: Escolher como amostra uma ficha em cada 6, por exemplo, o 6 , o 12, o
18, etc.
2. Resposta: letra A.
3. Resposta: letra C
4. Reposta: letra B
5. Resposta: letra C
6. Resposta: letra A
7. Reposta: letra B
8. Resposta: letra D
9. Resposta: letra C
10. Resposta: letra B
11. Resposta: letra D
12. Resposta: letra A
13. Resposta: Letra D
14. Resposta: letra A
15. Resposta: letra C

Estatstica
79

Probabilidades

16. Resposta: letra A


17. Resposta: letra C
18. Resposta: letra B
19. Resposta: letra C
20. Resposta: letra D
Distribuio Binomial

21. Resposta: letra A


22. Resposta: letra C
Distribuio de Poisson

23. Resposta: letra B


24. Resposta: letra A
25. Resposta: letra C
26. Resposta: letra B
27. Reposta letra D
Erro Padro da Mdia Aritmtica

28. Resposta: letra B


29. Resposta: letra A.
30. Resposta: letra D
31. Resposta: letra B
32. Resposta: letra C
33. Resposta: letra A
34. Resposta: letra D
35. Resposta: letra A
Intervalo de Confiana

36. Resposta: letra A


37. Resposta: letra Dom

Estatstica
80

Anexo A Tabela de Distribuio Normal Padronizada

Estatstica

S-ar putea să vă placă și