Sunteți pe pagina 1din 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

2 ( x )

ou

s=

( x x)
n 1

x =
N

1 ( x ) 2 / 2 2 y= e 2
x=

( x

f)

r=

n x 2 ( x ) n y 2 ( y )
2

n x y ( x) ( y )

Pgina 1 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

SUMRIO
1. INTRODUO ESTATSTICA...............................................................................................4 1.1 VISO GERAL.....................................................................................................................4 1.2 CLASSIFICAO DE DADOS................................................................................................6 1.3 COLETANDO DADOS..........................................................................................................7 1.4 TCNICAS DE AMOSTRAGEM..............................................................................................8 1.5 USOS E ABUSOS...............................................................................................................11 2. MEDIDAS DE TENDNCIA CENTRAL....................................................................................12 2.1 MDIA..............................................................................................................................12 2.2 MEDIANA.........................................................................................................................12 2.3 MODA..............................................................................................................................12 2.4 MDIA PONDERADA.........................................................................................................13 3. DISTRIBUIES DE FREQUNCIA........................................................................................15 3.1 DETERMINANDO FREQUNCIAS DE UM CONJUNTO DE DADOS AGRUPADOS.....................15 3.2 PONTO MDIO..................................................................................................................16 3.3 FREQUNCIA RELATIVA....................................................................................................16 3.4 FREQUNCIA CUMULATIVA...............................................................................................16 3.5 MDIA DE UMA DISTRIBUIO DE FREQUNCIA................................................................16 4. GRFICOS..........................................................................................................................22 4.1 HISTOGRAMA DE FREQUNCIAS.......................................................................................22 4.2 POLGONO DE FREQUNCIAS...........................................................................................22 4.3 HISTOGRAMA OU POLGONO DE FREQUNCIAS RELATIVAS..............................................22 4.4 GRFICO DE FREQUNCIA CUMULATIVA OU OGIVA..........................................................22 4.5 ASPECTO DAS DISTRIBUIES.........................................................................................22 5. MEDIDAS DE POSIO........................................................................................................28 5.1 QUARTIL..........................................................................................................................28 5.2 AMPLITUDE INTERQUARTIL...............................................................................................28 5.3 PERCENTIS E OUTROS FRACTIS........................................................................................28
Pgina 2 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I 6. MEDIDAS DE VARIAO.....................................................................................................33 6.1 AMPLITUDE TOTAL...........................................................................................................33 6.2 DESVIO............................................................................................................................33 6.3 VARINCIA.......................................................................................................................33 6.4 DESVIO PADRO..............................................................................................................33 6.5 COEFICIENTE DE VARIAO.............................................................................................34 7. DISTRIBUIO NORMAL DE PROBABILIDADE......................................................................37 7.1 PROPRIEDADES DE UMA DISTRIBUIO NORMAL..............................................................37 7.2 CURVAS NORMAIS E PROBABILIDADES.............................................................................39 7.3 DISTRIBUIO NORMAL PADRO......................................................................................41 8. CORRELAO E REGRESSO..............................................................................................48 8.1 CORRELAO...................................................................................................................48 8.2 COEFICIENTE DE CORRELAO........................................................................................49 8.3 TESTANDO A CORRELAO PARA A POPULAO..............................................................52 8.4 RETAS DE REGRESSO.....................................................................................................53 8.5 COEFICIENTE DE DETERMINAO.....................................................................................56 8.6 ERRO PADRO DA ESTIMATIVA.........................................................................................57 8.7 INTERVALOS DE PREVISO...............................................................................................58

Pgina 3 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

1. INTRODUO ESTATSTICA
1.1 VISO GERAL O campo da Estatstica lida com a coleta, a apresentao, a anlise e o uso dos dados para tomar decises e resolver problemas. Engenheiros resolvem problemas de interesse da sociedade pela aplicao eficiente de princpios cientficos. O mtodo de engenharia ou cientfico a abordagem para formular e resolver esses problemas. As etapas no mtodo de engenharia so dadas a seguir: 1. Desenvolver uma descrio clara e concisa do problema. 2. Identificar, no mnimo tentar, os fatores importantes que afetam esse problema ou que possam desempenhar um papel em sua soluo. 3. Propor um modelo para o problema, usando conhecimento cientfico ou de engenharia do fenmeno em estudo. 4. Conduzir experimentos apropriados e coletar dados para testar ou validar o modelotentativa ou concluses feitas nas etapas 2 e 3. 5. Refinar o modelo com base nos dados observados. 6. Manipular o modelo com base nos dados observados. 7. Conduzir um experimento apropriado para confirmar que a soluo proposta para o problema efetiva e eficiente. 8. Tirar concluses ou fazer recomendaes baseadas na soluo do problema. Essas etapas so mostradas na Figura a seguir.

Devido a muitos aspectos da prtica de engenharia envolver o trabalho com dados, obviamente algum conhecimento de estatstica importante para qualquer engenheiro. Especificamente, tcnicas estatsticas podem ser ajuda poderosa no planejamento de novos produtos e sistemas, melhorando projetos existentes e planejando, desenvolvendo e melhorando os processos de produo.
Pgina 4 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I Mtodos estatsticos so usados para nos ajudar a entender a variabilidade. Por variabilidade, queremos dizer que sucessivas observaes de um sistema ou fenmeno no produzem exatamente o mesmo resultado. A Estatstica moderna pode ser dividida em 3 partes: A estatstica descritiva a parte da estatstica que se ocupa da coleta, organizao, resumo e apresentao dos dados ou informaes que representam e descrevem os fenmenos em estudo. Na estatstica indutiva ou inferencial pretende-se concluir ou predizer a evoluo de fenmeno ao longo do tempo, com base em ocorrncias verificadas no passado. A ferramenta bsica no estudo da estatstica indutiva a teoria das probabilidades. A teoria das probabilidades originou-se nos jogos de azar. o estudo das situaes ou fenmenos em que os resultados possveis dos experimentos so previamente conhecidos, mas incertos quanto sua ocorrncia ou no. Busca-se a quantificao do grau de incerteza, apresentado por certo resultado particular nas repeties do mesmo experimento. Os dados consistem em informaes provenientes de observaes, contagens, medidas ou respostas. Existem dois tipos de conjuntos de dados que voc ir usar ao estudar estatstica. Esses conjuntos so chamados de: POPULAO o conjunto de todos os resultados, respostas, medidas ou contagens que so de interesse. AMOSTRA um subconjunto da populao. A menos que uma populao seja pequena, geralmente impraticvel obter todos os seus dados. Na maior parte dos estudos a informao deve ser obtida a partir de uma amostra. EXEMPLO Em um levantamento recente, perguntou-se a 3.002 adultos no Brasil se liam notcias na Internet pelo menos uma vez por semana. Seiscentos adultos responderam que sim. Identifique a populao e a amostra. Descreva o conjunto de dados. A populao consiste nas respostas de todos os adultos do Brasil. A amostra consiste na resposta de 3.002 adultos do Brasil no levantamento. O conjunto de dados consiste em 600 respostas positivas e 2.402 respostas negativas.

POPULAO Resposta de todos os adultos do Brasil

AMOSTRA Resposta dos adultos levantamento

no

O fato de um conjunto de dados ser uma populao ou amostra depende geralmente do contexto da situao na vida real. No exemplo acima, a populao era o conjunto de respostas de todos os adultos no Brasil. Dependendo do propsito do levantamento, a populao poderia
Pgina 5 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I ter sido o conjunto de respostas de todos os adultos que vivem no Paran, ou daqueles que tivessem telefone, ou ainda que fossem leitores de um determinado jornal. EXEMPLO A ANP realiza levantamentos semanais em 800 postos de gasolina para determinar o preo mdio da gasolina comum. Em 14 de maio de 2011 o preo mdio era de R$ 2,513 por litro. Identifique a populao e a amostra. A populao consiste nos preos de gasolina comum em todos os postos do Brasil. A amostra consiste no preo da gasolina comum nos 800 postos levantados. O conjunto de dados consiste em 800 preos. Dois termos importantes que sero usados so parmetro e estatstica: PARMETRO uma descrio numrica de uma caracterstica da POPULAO. ESTATSTICA uma descrio numrica de uma caracterstica da AMOSTRA. EXEMPLO Decida se o valor numrico descreve um parmetro populacional ou uma estatstica amostral. 1. Um recente levantamento de uma amostra de pessoas que possuem um diploma de MBA revelou que o salrio mdio inicial para elas inferior a R$ 65 mil. Como a medida numrica de R$ 65 mil baseia-se num subconjunto da populao, ela uma estatstica amostral. 2. O salrio inicial para os 667 diplomados em MBA pela FGV aumentou 8,5% em relao ao ano anterior. Como a medida numrica de 8,5% baseia-se no salrio inicial de todos os 667 diplomados, ela um parmetro populacional. 3. Em uma verificao aleatria de uma amostra de lojas de varejo, a ANVISA observou que 34% delas no estavam armazenando peixe a uma temperatura adequada. Como a medida numrica de 34% baseia-se em um subconjunto da populao, ela uma estatstica amostral. 1.2 CLASSIFICAO DE DADOS Os dados podem ser qualitativos e quantitativos. Os dados qualitativos consistem em atributos, classificaes ou registros no numricos. Os dados quantitativos consistem em medidas ou contagens numricas. EXEMPLO Os preos bsicos de veculos esto na tabela a seguir. Quais dados so qualitativos e quais so quantitativos? MODELO Gol Special Gol City 1.0 Mi 8v 2p Gol 1.0 Plus 16 v 2p Gol 1.0 Plus 16 v 4p Fox City 1.0 Mi PRE O 21.8 55 22.2 47 25.2 73 27.2 33 29.9
Pgina 6 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I 3p Fox City 1.0 Mi 4 Fox Plus 1.0 Mi 3p Fox Plus 1.0 Mi 4p 43 30.7 81 32.7 03 34.6 88

As informaes mostradas na tabela podem ser separadas em dois conjuntos de dados. Um deles contm os nomes dos modelos de veculos, enquanto o outro, os preos. Os nomes so registros no numricos, logo, estes so os dados qualitativos. Os preos so registros numricos e, portanto, so dados quantitativos.

1.3 COLETANDO DADOS H vrias maneiras de coletar dados. Frequentemente, o foco do estudo determina a melhor maneira de colet-los. A seguir, apresentamos um breve resumo de quatro mtodos de coleta de dados. a) CENSO a contagem ou medio de toda uma populao. O censo fornece informaes completas, mas frequentemente dispendioso e difcil de ser realizado. b) AMOSTRA uma contagem ou medio de parte de uma populao. As estatsticas calculadas a partir da amostra so usadas para predizer vrios parmetros populacionais. O uso da amostra frequentemente mais prtico que a realizao de um censo. c) SIMULAO o uso de um modelo matemtico ou fsico para reproduzir as condies de uma situao ou de um processo. A coleta de dados geralmente faz uso de computadores. As simulaes permitem estudar situaes que seria pouco prtico ou at mesmo perigoso criar na vida real, alm de poupar tempo e dinheiro. Por exemplo, fabricantes de automveis usam simulaes com bonecos para estudar efeitos que as colises tm em seres humanos. d) EXPERIMENTO - aplicado um tratamento a uma parte da populao e so observadas as respostas. Uma segunda parte da populao , em geral, usada como um grupo de controle. Esse grupo no recebe tratamento algum ou recebe um placebo. Aps serem observadas as respostas dos dois grupos os resultados so comparados. EXEMPLO Qual mtodo de coleta de dados voc empregaria em cada caso abaixo descrito? 1. Um estudo a respeito do efeito que a mudana dos padres de voo tem sobre o nmero de acidentes areos. Como no prtico criar essa situao, voc preferiria usar uma simulao. 2. Um estudo sobre o efeito da aspirina na preveno de ataques cardacos. Neste estudo voc deseja medir o efeito de um tratamento, assim prefervel realizar um experimento. 3. Um estudo sobre o peso de todos os jogadores do Campeonato Brasileiro 1 Diviso. Como os times do Campeonato Brasileiro da 1 Diviso mantm um registro preciso dos dados fsicos de todos os jogadores, seria possvel fazer um censo.

Pgina 7 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I 4. Um estudo sobre o ndice de aprovao do presidente Lula em meio s pessoas que residem no pas. Seria praticamente impossvel indagar todos os brasileiros se eles aprovam ou no o desempenho do presidente. Assim, voc usaria amostragem para coleta de dados. 1.4 TCNICAS DE AMOSTRAGEM Para coletar dados no tendenciosos, importante que a amostra seja representativa da populao. Tcnicas de amostragem apropriadas devem ser usadas para garantir que as inferncias sobre a populao sejam vlidas. Um estudo feito com dados imprecisos conduz a resultados questionveis. Uma amostra tendenciosa aquela que no representativa da populao da qual foi extrada. Por exemplo, uma amostra constituda apenas de estudantes universitrios com idades entre 18 e 22 anos no seria representativa de toda a populao que se encontra nessa faixa etria no pas. Uma amostra aleatria aquela na qual todos os membros da populao tm chances iguais de serem selecionados. Uma amostra aleatria simples aquela na qual toda amostra possvel tem mesma chance de ser selecionada. Uma maneira de coletar uma amostra aleatria simples atribuir um nmero diferente para cada membro da populao e ento usar uma tabela de nmeros aleatrios como a apresentada na tabela a seguir. Calculadoras e programas de computadores tambm so usados para gerar nmeros aleatrios.

EXEMPLO Suponha que 356 alunos esto matriculados no Curso de Engenharia Civil da PUCPR. Voc deseja formar uma amostra de 5 estudantes para responder a algumas questes de um levantamento. Selecione os estudantes que faro parte da amostra aleatria simples. Atribua nmeros de 1 a 356 para cada estudante do Curso. Na tabela de nmeros aleatrios, escolha um lugar de partida ao acaso. Por exemplo, a quinta linha da tabela. 06348 76938 90379 51392 55887 71015 09209 79157 23330 30244 Agrupe os nmeros com 3 dgitos 06348 769389037951392558877101509209791572333030244 063 487 693 890 379 513 925 588 771 015 092 097 915 723 330 302 44 e elimine os valores superiores a 356 063 487 693 890 379 513 925 588 771 015 092 097 915 723 330 302 44 Assim, os cinco alunos que iro responder ao levantamento so aqueles de nmeros: 063, 015, 092, 097 e 330 Outra forma de obter nmeros aleatrios utilizar o Excel. Para a verso 2003 proceda da seguinte maneira: Na caixa Ferramentas, selecione a opo Suplementos. Marque as opes Ferramentas de anlise e Ferramentas de anlise VBA. Clique OK. Na clula A1 insira a frmula =RANDBETWEEN(1;356) Caso o valor no seja apresentado, selecione Ferramentas, Auditoria de frmulas e modo de auditoria de frmulas. Copie o valor da clula A1 para outras quatro clulas e voc ter gera uma lista de cinco nmeros aleatrios variveis entre 1 e 356. Anote os valores obtidos. Agora experimente recalcular a planilha usando a tecla F9 ...... veja que novos nmeros so gerados. Tambm experimente gerar esses nmeros utilizando a sua calculadora. Para a verso 2010 a funo =ALEATRIO ou =ALEATRIOENTRE(1;356).
Pgina 8 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I Quando escolher os membros de uma amostra, voc deve decidir se aceitvel ou no ter o mesmo membro da populao selecionado mais de uma vez. Se for aceitvel, diz-se que o processo de amostragem feito com reposio. Se no for aceitvel, ento se diz que o processo feito sem reposio. H vrias outras tcnicas comumente usadas para se constituir uma amostra. AMOSTRA POR AGRUPAMENTO Quando a populao apresenta a ocorrncia natural de subgrupos, cada um deles com caractersticas similares pode ser mais apropriada uma amostra por agrupamento. Para selecionar uma amostra por agrupamento, divida a populao em grupos, chamados de agrupamentos, e selecione todos os membros de um ou mais agrupamentos (mas no todos). Exemplos de agrupamentos podem ser as sees diferentes de um mesmo curso ou os diferentes departamentos de um banco. Por exemplo: para coletar uma amostra por agrupamento do nmero de pessoas que vivem nos domiclios do Prado Velho, divida os domiclios em grupos de acordo com o CEP, depois selecione todos os domiclios segundo um ou mais CEPs (mas no todos) e conte o nmero de pessoas que vivem em cada domiclio. Quando usarmos uma amostra por agrupamento, devemos ter cuidado para garantir que todos os agrupamentos possuam caractersticas similares. Por exemplo, se o agrupamento do oeste apresenta uma maior proporo de pessoas de alta renda, os dados podem no ser representativos da populao.

Pgina 9 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

AMOSTRA SISTEMTICA Uma amostra sistemtica aquela na qual atribudo um nmero a cada membro da populao. Os membros da populao so ento ordenados de alguma maneira, o nmero inicial selecionado aleatoriamente e depois os membros da amostra so selecionados segundo intervalos regulares que ocorrem a partir do nmero inicial. (Por exemplo, cada terceiro, quinto ou centsimo membro selecionado.). Por exemplo, para coletar uma amostra sistemtica do nmero de pessoas que vivem nos domiclios do Prado Velho, voc poderia atribuir um nmero diferente para cada domiclio, escolher aleatoriamente um nmero inicial, selecionar um domiclio a cada cem e contar ento o nmero de pessoas que vivem em cada um desses domiclios selecionados.

EXEMPLO Identificando tcnicas de amostragem Voc est fazendo um estudo para determinar a opinio dos estudantes de sua escola com respeito ao controle do porte de armas. Identifique a tcnica de amostragem que voc ir usar se selecionar uma das amostras relacionadas abaixo. 1. Selecione aleatoriamente uma classe e faa perguntas a cada estudante. 2. Divida a populao estudantil com relao s especialidades estudadas, realize uma seleo aleatria e faa perguntas a alguns estudantes de cada especialidade. 3. Atribua um nmero a cada estudante e escolha nmeros aleatrio. Voc ento ir questionar cada estudante cujo nmero for selecionado ao acaso. SOLUO 1. Como cada classe um subgrupo que ocorre naturalmente (um agrupamento) e voc questionar cada estudante da classe, essa uma amostra por agrupamento. 2. Como os estudantes esto divididos em estratos (especialidades) e a amostra selecionada
Pgina 10 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I de acordo com cada especialidade, essa uma amostra estratificada. 3. Cada amostra de mesmo tamanho possui chances iguais de ser selecionada e cada estudante tem chances iguais de ser selecionado; assim, essa uma amostra aleatria simples. 1.5 USOS E ABUSOS USOS Levantamentos podem ser importantes na determinao da atitude de uma populao acerca de um candidato, produto ou tema. Se voc estiver trabalhando para um candidato poltico, importante que saiba como os eleitores veem seu candidato. De posse dessa informao, voc pode voltar-se para as preocupaes dos eleitores e aumentar as chances de seu candidato vencer a eleio. Se voc estiver trabalhando em um departamento de pesquisa de mercado de uma companhia manufatureira, importante que saiba como o povo ir reagir ao lanamento de um novo produto antes que ele seja produzido. Talvez voc possa alterar o projeto do produto para tornlo mais interessante e conquistar assim uma fatia maior do mercado. Se voc estiver trabalhando para uma organizao ativista, importante que saiba como a populao se sente acerca das questes levantadas por sua organizao. Se descobrir que a populao no apoia uma questo, talvez possa mudar isso por meio de uma campanha informativa. ABUSOS Amostras tendenciosas. O abuso (ou mau uso) mais comum da estatstica est na utilizao de uma amostra no representativa de toda a populao em estudo. Considere um levantamento de opinio feito por telefone sobre um candidato para o conselho escolar. Dos 930 nmeros discados, 543 responderam. Daqueles que responderam, 162 pessoas concordou em participar do levantamento, e destas, 62%, pensavam, em votar no candidato. Deve ficar claro que, a partir desse levantamento, voc no pode concluir que 62% dos eleitores locais planejam votar no candidato. O levantamento no incluiu eleitores com numero de telefone fora da lista, ou que no estavam em casa, ou que no concordaram em participar do levantamento. Em casos assim, dizemos que o levantamento est tendencioso em relao queles cujos nmeros de telefones estavam na lista, que saem pouco de casa e que desejam participar de levantamentos. Questes tendenciosas de levantamento. Outro abuso comum est no uso de questes no levantamento que encorajam os participantes, quer seja intencionalmente ou no a responder de uma determinada maneira. Por exemplo, considere um levantamento sobre porte de armas. Est claro que as seguintes questes iro produzir resultados muito diferentes: (a) Voc concorda com a afirmao: As pessoas tm o direito de ter uma arma para sua prpria proteo e de sua famlia? (b) Voc concorda com a afirmao: As pessoas tm o direito de possuir armas carregadas em casa?

Pgina 11 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

2. MEDIDAS DE TENDNCIA CENTRAL


Uma medida de tendncia central um valor que representa uma entrada (observao, dado ou valor), de um conjunto de dados. As trs medidas de tendncia central mais usadas so: MDIA MEDIANA MODA 2.1 MDIA A mdia de um conjunto de dados a soma das entradas de dados dividida pelo nmero de entradas. Para encontrar a mdia de um conjunto de dados use as seguintes frmulas: Mdia da populao:

x
N

Mdia da amostra:

x=

x
n

onde a letra grega sigma maiscula indica uma soma de valores x varivel que representa uma entrada quantitativa de dados N nmero de entradas em uma populao n nmero de entradas em uma amostra a letra grega minscula mi indica a mdia da populao x - leia como x barra que a mdia da amostra. Propriedades da mdia 1. Sempre pode ser calculada. 2. Pode assumir qualquer valor real (positivo, negativo, nulo). 3. Definido o conjunto de dados, a mdia aritmtica nica. 4. uma medida sensvel a todos os valores do conjunto dos dados: qualquer mudana num deles modifica a mdia. 5. afetada pelas mudanas nas propores de elementos com certas propriedades (o salrio mdio, por exemplo, que pode ser separado por categorias). 6. Somando-se ou subtraindo-se uma constante a todos os valores de um conjunto de informaes, a mdia aritmtica ficar somada ou subtrada dessa constante. 7. Se multiplicarmos ou dividirmos cada um dos elementos por uma constante, a mdia aritmtica tambm ficar multiplicada ou dividida por uma constante. 8. uma medida que tende a se aproximar dos extremos, se estes valores forem altos, e dos pontos de grandes acmulos de valores. 2.2 MEDIANA A mediana de um conjunto de dados o dado que fica no meio quando as entradas so colocadas em ordem crescente ou decrescente. Se um conjunto de dados tiver um nmero par de entradas, a mediana ser a mdia entre os dois pontos que estiverem no meio do conjunto. Em um conjunto de dados, h um nmero igual de valores acima e abaixo da mediana. 2.3 MODA A moda de um conjunto de dados aquela entrada que ocorre com maior frequncia. Se nenhuma entrada repetida, o conjunto de dados no possui moda e chamado amodal. Se duas entradas ocorrem com a mesma frequncia elevada, cada entrada uma moda e os dados so chamados de bimodais. A moda a nica medida de tendncia central que pode ser usada para descrever dados no nvel nominal de medida.
Pgina 12 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I 2.4 MDIA PONDERADA s vezes, os conjuntos de dados contem entradas que possuem maior efeito sobre a mdia que os demais. Para encontrar a mdia de tais conjuntos, voc deve calcular a mdia ponderada. Uma mdia ponderada a mdia de um conjunto de dados cujas entradas tm pesos variveis. Uma mdia ponderada dada por:

x=

( x w) w

onde w o peso de cada entrada x EXERCCIOS 1) Os preos de um determinado eletrodomstico foram coletados nas redes de lojas especializadas atravs de uma amostragem. Pede-se determinar o preo mdio, a mediana e a moda desses valores. 500 840 470 480 420 440 440

Soluo a) Mdia

x=

x = 500 + 840 + 470 + 480 + 420 + 440 + 440 = 3.590 = 512,86


n 7 7

O preo mdio do eletrodomstico R$ 512,86 ou aproximadamente R$ 513,00. b) Mediana Para encontrar o preo mediano, ordene os dados: 1 2 3 4 5 6 7 420 440 440 470 480 500 840 Uma vez que h sete entradas (um nmero mpar), a mediana o ponto mdio, ou seja, a quarta entrada de dados. Assim o preo mediano do eletrodomstico R$ 470,00 c) Moda A partir dos dados ordenados, possvel ver que o valor 440 ocorre duas vezes, enquanto que as demais entradas de dados ocorrem uma vez. Assim, a moda dos preos do eletrodomstico R$ 440,00. 2) Suponha que a produo de eletrodomstico de preo R$ 480,00 foi suspensa. Qual o preo mediano dos aparelhos restantes? Soluo Os preos restantes ordenados so: 1 2 3 4 5 6 420 440 440 470 500 840 Uma vez que temos seis entradas (um nmero par) a mediana a mdia entre os dois pontos mdios de entrada.

Mediana =

440 + 470 = 455 2


Pgina 13 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I 3) Encontre a mdia, a mediana e a moda da seguinte amostra de idades de uma classe. Qual a medida de tendncia central que melhor descreve uma entrada tpica? 2 2 2 2 2 2 2 2 2 2 0 0 0 0 0 0 1 1 1 1 2 2 2 2 2 2 2 2 2 6 2 2 2 3 3 3 3 4 4 5 Note que a idade de 65 anos um dado estranho. Soluo: a) Mdia

x=

x = 475 = 23,75 anos


n 20 21 + 22 = 21,5 anos 2

b) Mediana

Mediana =

c) Moda A entrada que ocorre com maior frequncia 20 anos. No h nenhuma resposta certa para a questo qual a medida de tendncia central que melhor descreve uma entrada tpica de dados?. A mdia leva em conta todas as entradas, mas influenciada pelo dado estranho 65. A mediana tambm leva em conta todas as entradas, mas no afetada pelo dado estranho. Nesse caso, a moda existe, mas no parece representar uma entrada tpica.

Pgina 14 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

3. DISTRIBUIES DE FREQUNCIA
Quando um conjunto de dados possui muitas entradas, pode ser difcil identificar padres. Apresenta-se a seguir como organizar um conjunto de dados agrupando-os em intervalos chamados de classes e formando uma distribuio de frequncia. A partir dessa distribuio de frequncia sero construdos grficos. Uma distribuio de frequncia uma tabela que mostra classes ou intervalos de entrada de dados com um nmero total de entradas em cada classe. A frequncia (f) de uma classe o nmero de entrada de dados na classe. Tabela 1 Exemplo de distribuio de frequncia Class e 15 6 10 11 15 16 20 21 25 26 30 Frequnci a (f) 5 8 6 8 5 4

No exemplo acima h seis classes. As frequncias para cada uma das seis classes so respectivamente 5, 8, 6, 8, 5 e 4. Cada classe possui um limite inferior de classe, que o menor nmero que pode pertencer classe, e o limite superior da classe, que o maior nmero que pode pertencer classe. No exemplo acima os limites inferiores de classe so 1, 6, 11, 16, 21 e 26, e os limites superiores de classe so 5, 10, 15, 20, 25 e 30. A amplitude de classe a distncia entre os limites inferiores (ou superiores) das classes consecutivas. Por exemplo, a amplitude de classe nessa distribuio 6 1 = 5. Se cada classe tem mesma amplitude de distribuio de frequncia ela considerada tima. As respostas mostradas usaro o valor mnimo dos dados para o limite inferior da primeira classe. s vezes, pode ser mais conveniente escolher um valor que seja ligeiramente menor do que o valor mnimo. A distribuio de frequncia obtida ir variar ligeiramente. A diferena entre o mximo e o mnimo das entradas de dados chamada de amplitude total. Por exemplo, se a entrada mxima de dados 30 e a entrada mnima 1, a amplitude total 30 1 = 29. 3.1 DETERMINANDO FREQUNCIAS DE UM CONJUNTO DE DADOS AGRUPADOS A seguir esto orientaes para construir uma distribuio de frequncia a partir de um conjunto de dados. ORIENTAES GERAIS Construindo uma distribuio de frequncia a partir de um conjunto de dados 1. Defina o nmero de classe a serem includas na distribuio de frequncia. O nmero de classes deve estar entre 5 e 20; caso contrrio pode ser difcil identificar padres. O nmero de classes tambm pode ser definido pelas seguintes expresses: onde

k=

ou

k = 1 + 3,3 log ( N )

ou

k = 2 ln ( N )
Pgina 15 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I k nmero de classes N nmero de entradas 2. Determine a amplitude da classe da seguinte maneira. Determine a amplitude total dos dados, divida a amplitude total pelo nmero de classes e arredonde at o prximo nmero conveniente. 3. Calcule os limites das classes. Voc pode usar a entrada mnima dos dados como limite inferior da primeira classe. Para determinar os limites inferiores remanescentes, adicione a amplitude da classe ao limite inferior da classe precedente. Depois calcule o limite superior da primeira classe. Lembre que as classes no podem se sobrepor. Determine os limites superiores das classes remanescentes. 4. Marque um risco em cada entrada de dado na linha da classe apropriada. 5. Conte os riscos feitos para determinar a frequncia (f) para cada classe. 3.2 PONTO MDIO O ponto mdio de uma classe a metade da soma entre os limites inferior e superior da classe. s vezes o ponto mdio chamado de caracterstica da classe.

Ponto mdio =

lim . inf . + lim . sup . 2

3.3 FREQUNCIA RELATIVA A frequncia relativa de uma classe a poro ou porcentagem de dados nessa classe. Para determinar a frequncia relativa de uma classe, divida a frequncia (f) pelo tamanho da amostra (N).

Frequencia relativa =

Frequencia da classe tamanho da amostra

A frequncia relativa pode ser expressa de forma decimal ou de percentagem. A soma das frequncias relativas de todas as classes deve ser igual a 1 (um) ou 100%. 3.4 FREQUNCIA CUMULATIVA A frequncia cumulativa de uma classe igual soma de sua frequncia com todas as frequncias das classes anteriores. A frequncia cumulativa da ltima classe deve ser igual ao tamanho da amostra (N). 3.5 MDIA DE UMA DISTRIBUIO DE FREQUNCIA A mdia de uma distribuio de frequncia para uma amostra aproximada por

x=
EXERCCIOS

( x

f)

onde (xm) e (f) so respectivamente os pontos mdios e as frequncias de uma classe

1) O conjunto de dados amostrais a seguir fornece uma lista do nmero de minutos que 50 assinantes da Internet gastaram durante sua conexo mais recente. Construa uma distribuio de frequncia e determine a mdia do conjunto de dados agrupados.
5 0 4 4 0 7 4 1 5 1 7 7 1 1 5 7 1 2 2 7 4 4 6 2 8 3 2 1 8 1 9 5 2 3 2 3 7 3 5 1 4 5 4 3 4 2 3 8 8 2 Pgina 16 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I


1 1 8 8 2 9 6 3 4 2 5 9 6 7 3 7 7 7 3 6 9 3 9 0 3 0 0 6 2 6 5 4 9 6 7 3 3 9 6 3 1 1 5 3 9 4 4 0

SOLUO a) Nmero de classes

k = N = 50 = 7,07 7
b) Amplitude total A entrada de dados mnima 7, enquanto a entrada de dados mxima 88; logo a amplitude total

Amplitude total = entrada mxima entrada mnima = 88 7 = 81

c) Amplitude de classes Esta determinada dividindo-se a amplitude total pelo nmero de classes

Amplitude de classes =
d) Limite inferior

Amplitude total 81 = = 11,57 12 Nmero de classes 7

A entrada de dados mnima o limite inferior da primeira classe. Para encontrar os limites inferiores das seis classes remanescentes, adicione uma amplitude de classe igual a 12 ao limite inferior da classe anterior.
Clas se 1 2 3 4 5 6 7 Limite inferior 7 7 + 12 = 19 19 + 12 = 31 31 + 12 = 43 43 + 12 = 55 55 + 12 = 67 67 + 12 = 79

e) Limite superior O limite superior da primeira classe 18, o qual uma unidade a menos do que o limite inferior da segunda classe. Os limites superiores das outras classes so 18 + 12 = 30, 30 + 12 = 42 e assim por diante.
Clas se 1 2 3 4 5 6 Limite inferior 7 19 31 43 55 67 Limite superior 18 18 + 12 = 30 30 + 12 = 42 42 + 12 = 54 54 + 12 = 66 66 + 12 =
Pgina 17 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I


7 79 78 78 + 12 = 90

f) Contagem Para a primeira classe (7 18) a contagem mostrada abaixo


50 41 18 4 0 7 8 2 9 4 1 5 6 3 4 1 7 7 2 5 9 1 1 5 6 7 3 7 1 7 7 7 22 7 36 44 69 39 28 30 30 2 1 8 0 6 2 1 9 5 6 5 4 2 3 2 9 6 7 3 7 3 3 3 9 5 1 4 6 3 1 5 4 3 1 5 3 4 2 3 9 4 4 8 8 2 0

Clas se 1

Limite inferior 7

Limite superior 18

Frequncia (f) 6

Para a segunda classe (19 30) a contagem


50 41 18 4 0 7 8 2 9 4 1 5 6 3 4 1 7 7 2 5 9 1 1 5 6 7 3 7 1 7 7 7 22 7 36 44 69 39 28 30 30 2 1 8 0 6 2 1 9 5 6 5 4 2 3 2 9 6 7 3 7 3 3 3 9 5 1 4 6 3 1 5 4 3 1 5 3 4 2 3 9 4 4 8 8 2 0

Clas se 2

Limite inferior 19

Limite superior 30

Frequncia (f) 10

Para a terceira classe (31 42) a contagem


50 41 18 4 0 7 8 2 9 4 1 5 6 3 4 1 7 7 2 5 9 1 1 5 6 7 3 7 1 7 7 7 22 7 36 44 69 39 28 30 30 2 1 8 0 6 2 1 9 5 6 5 4 2 3 2 9 6 7 3 7 3 3 3 9 5 1 4 6 3 1 5 4 3 1 5 3 4 2 3 9 4 4 8 8 2 0

Clas se 3

Limite inferior 31

Limite superior 42

Frequncia (f) 13

Para a quarta classe (43 54) a contagem


5 0 4 1 1 8 4 0 7 8 2 9 4 1 5 6 3 4 1 7 7 2 5 9 1 1 5 6 7 3 7 1 7 7 7 2 2 7 3 6 4 4 6 9 3 9 2 8 3 0 3 0 2 1 8 0 6 2 1 9 5 6 5 4 2 3 2 9 6 7 3 7 3 3 3 9 5 1 4 6 3 1 5 4 3 1 5 3 4 2 3 9 4 4 8 8 2 0

Clas se

Limite inferior

Limite superior

Frequncia (f)
Pgina 18 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I


4 43 54 8

Para a quinta classe (55 66) a contagem


5 0 4 1 1 8 4 0 7 8 2 9 4 1 5 6 3 4 1 7 7 2 5 9 1 1 5 6 7 3 7 1 7 7 7 2 2 7 3 6 4 4 6 9 3 9 2 8 3 0 3 0 2 1 8 0 6 2 1 9 5 6 5 4 2 3 2 9 6 7 3 7 3 3 3 9 5 1 4 6 3 1 5 4 3 1 5 3 4 2 3 9 4 4 8 8 2 0

Clas se 5

Limite inferior 55

Limite superior 66

Frequncia (f) 5

Para a sexta classe (67 78) a contagem


5 0 4 1 1 8 4 0 7 8 2 9 4 1 5 6 3 4 1 7 7 2 5 9 1 1 5 6 7 3 7 1 7 7 7 2 2 7 3 6 4 4 6 9 3 9 2 8 3 0 3 0 2 1 8 0 6 2 1 9 5 6 5 4 2 3 2 9 6 7 3 7 3 3 3 9 5 1 4 6 3 1 5 4 3 1 5 3 4 2 3 9 4 4 8 8 2 0

Clas se 6

Limite inferior 67

Limite superior 78

Frequncia (f) 6

Para a stima e ltima classe (79 90) a contagem


5 0 4 1 1 8 4 0 7 8 2 9 4 1 5 6 3 4 1 7 7 2 5 9 1 1 5 6 7 3 7 1 7 7 7 2 2 7 3 6 4 4 6 9 3 9 2 8 3 0 3 0 2 1 8 0 6 2 1 9 5 6 5 4 2 3 2 9 6 7 3 7 3 3 3 9 5 1 4 6 3 1 5 4 3 1 5 3 4 2 3 9 4 4 8 8 2 0

A distribuio de frequncia est mostrada na tabela a seguir. Note que a soma das frequncias dever sempre ser igual ao nmero total de entradas ou observaes. Verifique sempre se a soma das frequncias igual ao nmero total de valores observados.
Clas se 1 2 3 4 5 6 7 Limite inferior 7 19 31 43 55 67 79 Limite superior 18 30 42 54 66 78 90 Frequncia (f) 6 10 13 8 5 6 2 6 + 10 + 13 + 8 + 5 + 6 + 2 = 50

Essas informaes podem ser resumidas conforme a tabela a seguir.


Class e 7 18 19 30 31 Frequnci a (f) 6 10 13
Pgina 19 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I


42 43 54 55 66 67 78 79 90 8 5 6 2

H vrios padres no conjunto de dados. Por exemplo, o intervalo de conexo mais comum foi de 31 a 42 minutos. Uma vez definida a distribuio de frequncias, calcula-se os pontos mdios das classes.
Class e 7 18 19 30 31 42 43 54 55 66 67 78 79 90 Ponto mdio Frequnci a (f) 6 10 13 8 5 6 2

7 + 18 = 12,5 2 19 + 30 = 24,5 2 31 + 42 = 36,5 2 43 + 54 = 48,5 2 55 + 66 = 60,5 2 67 + 78 = 72,5 2 79 + 90 = 84,5 2

Note que uma vez determinado o primeiro ponto mdio, os demais podem ser determinados adicionando-se o valor (12) da amplitude de classe. O clculo da frequncia relativa apresentado na tabela a seguir:
Class e 7 18 19 30 31 42 43 54 55 66 67 78 79 90 Ponto mdio 12,5 24,5 36,5 48,5 60,5 72,5 84,5 Frequnci a (f) 6 10 13 8 5 6 2 Frequncia relativa

6 = 0,12 = 12% 50 10 = 0,20 = 20% 50 13 = 0,26 = 26% 50 8 = 0,16 = 16% 50 5 = 0,1 = 10% 50 6 = 0,12 = 12% 50 2 = 0,04 = 4% 50
Pgina 20 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

n = 1 = 100%
O clculo da frequncia cumulativa mostrado na tabela a seguir
Class e 7 18 19 30 31 42 43 54 55 66 67 78 79 90 Ponto mdio 12,5 24,5 36,5 48,5 60,5 72,5 84,5 Frequnci a (f) 6 10 13 8 5 6 2 Frequncia relativa (fr.) 0,12 ou 12% 0,20 ou 20% 0,26 ou 26% 0,16 ou 16% 0,10 ou 10 % 0,12 ou 12% 0,04 ou 4% Frequncia cumulativa (fac) 6 6 + 10 = 16 16 + 13 = 29 29 + 8 = 37 37 + 5 = 42 42 + 6 = 48 48 + 2 = 50

A mdia da distribuio de frequncia dada na tabela a seguir


Class e 7 18 19 30 31 42 43 54 55 66 67 78 79 90 Ponto mdio (x) 12,5 24,5 36,5 48,5 60,5 72,5 84,5 Frequnci a (f) 6 10 13 8 5 6 2 n = 50 x.f 75,0 245,0 474,5 388,0 302,5 435,0 169,0 = 2.089,0

x=

( x f ) = 2.089 = 41,78
n 50

Assim, o tempo mdio gasto online foi de 41,78 minutos.

Pgina 21 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

4. GRFICOS
s vezes mais fcil identificar padres de um conjunto de dados analisando um grfico de distribuio de frequncia. Um desses grficos um histograma de frequncias. 4.1 HISTOGRAMA DE FREQUNCIAS Um histograma de frequncias um grfico de barras que representa a distribuio de frequncia de um conjunto de dados. Um histograma de frequncias possui as seguintes propriedades a. A escala horizontal quantitativa e mede os valores dos dados. b. A escala vertical mede as frequncias de classes. c. Barras consecutivas devem estar encostadas umas s outras. Uma vez que as barras consecutivas de um histograma de frequncias devem se encostar, elas comeam e terminam nas fronteiras de classes e no nos limites das classes. As fronteiras de classes so os nmeros que separam as classes sem deixar uma falha entre elas. Voc pode marcar a escala horizontal tanto nos pontos mdios, quanto nas fronteiras de classes, conforme ser mostrado a seguir. 4.2 POLGONO DE FREQUNCIAS Outra maneira de representar em um grfico uma distribuio de frequncia por meio do uso de um polgono de frequncia. Um polgono de frequncia um grfico em forma de linha que enfatiza a mudana contnua nas frequncias. 4.3 HISTOGRAMA OU POLGONO DE FREQUNCIAS RELATIVAS Esses tm escala horizontal igual ao histograma ou polgono de frequncia correspondente. A diferena que a escala vertical mede as frequncias relativas e no as frequncias. 4.4 GRFICO DE FREQUNCIA CUMULATIVA OU OGIVA uma linha poligonal que mostra a frequncia cumulativa de cada classe em seu limite superior. Os limites superiores so marcados sobre o eixo horizontal e as frequncias cumulativas sobre o eixo vertical. a) Construa uma distribuio de frequncia que tenha uma coluna para frequncias cumulativas. b) Especifique as escalas, vertical e horizontal. A escala horizontal consiste dos limites superiores de classe, enquanto que a vertical mede as frequncias cumulativas. c) Marque os pontos que representam os limites superiores de classe e suas respectivas frequncias cumulativas. d) Conecte os pontos em ordem, da esquerda para a direita. e) O grfico deve comear no limite inferior da primeira classe (cuja frequncia cumulativa zero) e deve terminar no limite superior da ltima classe (cuja frequncia cumulativa igual ao tamanho da amostra). 4.5 ASPECTO DAS DISTRIBUIES Um grfico revela vrias caractersticas de uma distribuio de frequncia. Uma delas o aspecto. Uma distribuio de frequncia ser SIMTRICA quando pudermos traar uma linha vertical pelo ponto mdio do grfico de distribuio e as duas metades resultantes forem aproximadamente imagens especulares. Quando uma distribuio for simtrica, a mdia, a mediana e a moda sero iguais.

Pgina 22 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

DISTRIBUIO SIMTRICA

Uma distribuio de frequncia ser UNIFORME (ou retangular) quando todas as entradas, ou classes, na distribuio tiverem frequncias iguais. Uma distribuio uniforme tambm simtrica. DISTRIBUIO UNIFORME

Uma distribuio de frequncia ser ASSIMTRICA se a cauda do grfico se prolongar mais de um lado do que do outro. Uma distribuio ser ASSIMTRICA ESQUERDA (negativamente assimtrica) se a sua cauda se prolongar para a esquerda. Se uma
Pgina 23 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I distribuio for assimtrica esquerda, a mdia ser menor do que a mediana que, por sua vez, ser geralmente menor que a moda. DISTRIBUIO ASSIMTRICA ESQUERDA

Uma distribuio ser ASSIMTRICA DIREITA (positivamente assimtrica) se a sua cauda se prolongar para a direita. Se uma distribuio for assimtrica direita, a mdia ser maior do que a mediana que por sua vez, ser geralmente maior do que a moda. DISTRIBUIO ASSIMTRICA DIREITA

A mdia sempre ir cair na direo em que a distribuio for assimtrica. Por exemplo, quando uma distribuio for assimtrica esquerda, a mdia estar esquerda da mediana.
Pgina 24 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

EXERCCIOS 1. Trace o histograma de frequncias, o polgono de frequncias, o grfico de frequncia cumulativa e o histograma de frequncia relativa para os dados de durao de conexo com a Internet. HISTOGRAMA DE FREQNCIAS
Class e 7 18 19 30 31 42 43 54 55 66 67 78 79 90 Fronteiras de classes 6,5 18,5 18,5 30,5 30,5 42,5 42,5 54,5 54,5 66,5 66,5 78,5 78,5 90,5 Ponto mdio 12,5 24,5 36,5 48,5 60,5 72,5 84,5 Frequnci a (f) 6 10 13 8 5 6 2

Utilizando as fronteiras de classes

Utilizando o ponto mdio das classes

Pgina 25 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

POLGONO DE FREQNCIAS

GRFICO DE FREQUNCIAS CUMULATIVAS


Class e 7 18 19 30 31 42 43 54 55 66 67 78 79 90 Frequnci a (f) 6 10 13 8 5 6 2 Fronteira superior da classe 18,5 30,5 42,5 54,5 66,5 78,5 90,5 Frequncia cumulativa 6 16 29 37 42 48 50

Pgina 26 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

HISTOGRAMA DE FREQUNCIA RELATIVA


Class e 7 18 19 30 31 42 43 54 55 66 67 78 79 90 Fronteiras de classes 6,5 18,5 18,5 30,5 30,5 42,5 42,5 54,5 54,5 66,5 66,5 78,5 78,5 90,5 Frequnci a (f) 6 10 13 8 5 6 2 Frequncia relativa 0,12 0,20 0,26 0,16 0,10 0,12 0,04

Pgina 27 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

5. MEDIDAS DE POSIO
Nesse captulo voc ir aprender a usar fractis para especificar a posio de um determinado valor dentro de um conjunto de dados de um levantamento estatstico. Quartis so nmeros que dividem em partes iguais um conjunto ordenado de dados. A mediana, por exemplo, um fractil, pois divide um conjunto ordenado de dados em duas partes iguais. 5.1 QUARTIL Os trs quartis Q1, Q2 e Q3 dividem aproximadamente um conjunto ordenado de dados em quatro partes iguais. Cerca de um quarto dos dados fica dentro ou abaixo do primeiro quartil Q1. Cerca de metade dos dados fica dentro ou abaixo do segundo quartil Q2 (o segundo quartil igual mediana do conjunto de dados). Cerca de trs quartos dos dados ficam dentro ou abaixo do terceiro quartil Q3. Exemplo A pontuao nos testes de 15 empregados envolvidos em um curso de treinamento est disposta a seguir. Obtenha os primeiro, segundo e terceiro quartis da pontuao de testes. 1 3 9 1 8 1 5 1 4 2 1 7 1 0 1 1 2 0 5 1 8 3 7 1 6 1 7

Em primeiro lugar ordene o conjunto de valores e obtenha a mediana Q2. Voc separou o conjunto de dados em duas metades. O primeiro quartil Q1 a mediana da metade inferior enquanto que o terceiro quartil Q3 a mediana da metade superior. Metade inferior 5 7 9 1 0 Q
1

1 1

1 3

1 4

Median a 15 Q2

Metade superior 1 6 1 7 1 8 1 8 Q
3

2 0

2 1

3 7

Voc pode verificar que cerca de 25% dos empregados obteve 10 pontos ou menos, cerca da metade ou 50% fez 15 pontos ou menos e 75% conseguiu 18 pontos ou menos. 5.2 AMPLITUDE INTERQUARTIL A amplitude interquartil de um conjunto de dados a diferena entre o terceiro e o primeiro quartil. AIQ = Q3 Q1 Essa uma medida que fornece uma ideia de quanto os 50% mdios variam. Ela pode ser utilizada para identificar dados estranhos. Qualquer valor de dado acima de 1,5 x AIQ esquerda de Q1 ou direita de Q3 estranho. No exemplo anterior a amplitude interquartil igual a AIQ = 18 10 = 8 e o valor 37 um dado estranho. 5.3 PERCENTIS E OUTROS FRACTIS Alm dos quartis, podemos usar tambm percentis e decis para especificar uma medida de posio. Os fractis mais comuns podem ser resumidos da seguinte maneira. Fractil Resumo Smbolos Quartis Divide o conjunto de dados em quatro Q1, Q2, Q3 partes iguais Decis Divide o conjunto de dados em dez partes D1, D2, iguais D3, ..... D9
Pgina 28 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I Percent Divide o conjunto de dados em cem P1, P2, P3, .... is partes iguais P99 Os percentis so frequentemente usados na educao e nos campos relacionados sade para indicar como um indivduo se compara com os outros, em um determinado grupo. Pontuaes em testes e medidas de crescimento infantil, por exemplo, so frequentemente expressos em percentis. Se o peso de um bebe de seis meses de idade estiver no 78 percentil significa que ele pesa mais que 78% de todos os bebes de seis meses de idade. Isso no significa que o bebe pese 78% de algum peso ideal.

Pgina 29 de 59

Polg ono defrequen -tem decon o Internet cia po ex


14 13 28%

12 10 10 8 8 6 6
) s t l ( a i c n u q e r F

24%

20%

16% 6
) % ( a i c n u q e r F
Pgina 30 de 59

12%

4 2 2 0 0 0,5 12,5 24,5 36,5 48,5 60,5 72,5 84,5 96,5 T empode c onex (min) o Tem de conexo po Mdia Mediana Moda 0

8%

4%

0%

H tog adefrequencia-tem decon is ram po exo Internet


30% 26% 25% 20% 16% 15% 12%
) % ( v t l a i c n u q e r F

20%

12% 10%

10%

5% 0% 0,5 12,5 24,5 36,5 48,5 60,5 72,5

4% 0% 84,5 96,5

0%

T pode c em onex (min) o

Pgina 31 de 59

Polg ono defrequen cum lativa-tem deconex Intern cia u po o et


100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 0% 6 18 30 42 54 66 78 12%
) % ( v t l m a i c n u q e r F

96% 84% 74%

100%

100%

58%

32%

90

102

T pode c em onex (min) o

Pgina 32 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

6. MEDIDAS DE VARIAO
Nesse captulo voc ir aprender diferentes maneiras de medir a variao de um conjunto de dados. Voc ser capacitado a determinar a amplitude total, o desvio, a varincia, o desvio padro e o coeficiente de variao de um conjunto de dados ou observaes. Voc tambm ir aprender a interpretar o desvio padro. 6.1 AMPLITUDE TOTAL A medida de variao mais simples a amplitude total do conjunto. Conforme j vimos no captulo de distribuies de frequncia, ela a diferena entre a entrada mxima e mnima do conjunto.

Amplitude total = ( entrada mxima ) ( entrada mnima )


Como medida de variao, a amplitude total tem a vantagem de ser facilmente calculvel. Sua desvantagem, porm, que ela usa somente duas entradas do conjunto de dados. 6.2 DESVIO O desvio de uma entrada x de um conjunto de dados de uma populao ou amostra a diferena entre a entrada e a mdia ou x do conjunto.

Desvio de x = x = x x
A soma dos desvios deve ser igual a zero. Uma vez que isso verdade para todo conjunto de dados, no faz sentido determinar a mdia dos desvios. 6.3 VARINCIA Para resolver esse problema, voc pode elevar ao quadrado cada desvio. Em um conjunto de dados de uma populao, a mdia dos quadrados dos desvios chamada varincia populacional. A desvantagem da varincia consiste no fato de suas unidades normalmente no terem sentido. A varincia populacional ( 2 letra grega sigma minscula) de um conjunto dados com (N) entradas e mdia

Varincia populacional =

( x ) =
N

A varincia amostral (s2) de um conjunto de dados com (n) entradas e mdia

x dada por

Varincia amostral = s

( x x) =
n 1

Observe que na obteno da varincia populacional voc divide por N, o nmero de entradas. Na obteno da varincia amostral, voc divide por (n-1), um a menos do que o nmero de entradas. 6.4 DESVIO PADRO

Pgina 33 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I Consideremos um conjunto de dados populacionais com (N) entradas. O desvio padro populacional a raiz quadrada da varincia populacional

Desvio padro populacional = = =


2

( x )
N

O desvio padro amostral de maneira similar ser determinado por

Desvio padro amostral = s = s =


2

( x x)
n 1

ORIENTAES GERAIS 1. Obtenha a mdia do conjunto de dados

x
N

ou

x=

x
n

2. Obtenha o desvio de cada entrada

ou ou

xx

3. Eleve ao quadrado cada desvio

( x )2

4. Some os resultados para obter a soma dos quadrados 5. Divida por N ou n-1 para obter a varincia

( x x)
2 2

SS x = ( x )
2

ou

SS x = x x
2

( x ) =
N

ou
2

( x x) =
n 1 n 1

6. Determine a raiz quadrada para obter o desvio padro

( x )
N

ou

s=

( x x)

6.5 COEFICIENTE DE VARIAO O coeficiente de variao dado pela relao entre o desvio padro e a mdia

Coeficiente de var iao =


EXERCCIOS

ou

s x

1. Duas empresas contrataram 10 pessoas com curso superior. O salrio inicial nessas companhias mostrado a seguir Empresa A Salrios em milhares de reais 41 38 39 45 47 41 Empresa B Salrios em milhares de reais 40 23 41 50 49 32 44 41 42 29 37 52 42 58

Determine a) a amplitude total dos salrios em cada empresa, b) o desvio de cada salrio em ambas as empresas,
Pgina 34 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I c) a varincia e o desvio padro populacional para as empresas, d) o coeficiente de variao dos salrios de cada empresa SOLUO Empresa A a) amplitude

Amplitude total = ( entrada mxima ) ( entrada mnima ) = 47 37 = 10


Desvio (x x) 41 - 41,5 = -0,5 38 - 41,5 = -3,5 39 - 41,5 = -2,5 45 - 41,5 = 3,5 47- 41,5 = 5,5 41 - 41,5 = -0,5 44 - 41,5 = 2,5 42 - 41,5 = -0,5 37 - 41,5 = -4,5 42 - 41,5 = 0,5 0,00

b) Desvio Entrad a 1 2 3 4 5 6 7 8 9 10 Mdia Salrio (x) 41 38 39 45 47 41 44 42 37 42 415 415 / 10 = 41,5

x
c) Varincia e desvio padro Entra da 1 2 3 4 5

Salrio (x) 41 38 39 45 47

Desvio (x x) -0,5 -3,5 -2,5 3,5 5,5

Quadrado (x x )2 0,25 12,25 6,25 12,25 30,25


Pgina 35 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I 6 7 8 9 10 41 44 41 37 42 415 41,5


2

-0,5 2,5 -0,5 -4,5 0,5 0,00

0,25 6,25 0,25 20,25 0,25 88,50

Varincia populacional =

( x ) =
N
2

88,5 = 8,85 10

Desvio padro populacional = = =

( x )
N

= 8,85 2,97

Assim a varincia populacional 8,85 e o desvio padro populacional 2,97 ou R$ 2.970,00. c) Coeficiente de variao

Coeficiente de var iao =

2,97 = = 0,067 ou 6,7% 41,5

Determine essas medidas de variao para a empresa B.

Pgina 36 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

7. DISTRIBUIO NORMAL DE PROBABILIDADE


7.1 PROPRIEDADES DE UMA DISTRIBUIO NORMAL A distribuio normal uma distribuio contnua de probabilidade de uma varivel aleatria x. Sua representao grfica chamada de curva normal. A distribuio normal tem as seguintes propriedades: a) A mdia, a mediana e a moda so iguais. b) A curva normal tem formato de sino e simtrica em torno da mdia. c) A rea total sob a curva normal igual a 1. d) A curva normal aproxima-se mais do eixo x medida que se afasta da mdia em ambos os lados, mas nunca toca o eixo. e) Entre e + (no centro da curva) o grfico curva-se para baixo. esquerda de e direita de + o grfico curva-se para cima. Os pontos nos quais a curva muda sua curvatura para cima ou para baixo so chamados de pontos de inflexo.

Pontos de inflexo

rea total = 1

Mdia Mediana Moda

0,45 0,40 0,35 3

x -

2 + + 2 + 3 Se x for uma varivel aleatria contnua e tiver uma distribuio normal, com mdia e desvio padro0,30 pode-se fazer o grfico de uma curva normal usando a seguinte equao: ,
0,25 0,20

1 ( x ) 2 / 2 2 y= e 2

0,15 A figura a seguir apresenta grfico da funo acima, gerado no Excel, para uma distribuio normal com mdia igual a 3 e desvio padro igual a 1. 0,10 0,05
Pgina 37 de 59

Frequncia

0,00 -0,5 3,0 0,0 0,5 1,0 1,5 2,0 2,5 3,5 4,0 4,5 5,0 5,5 6,0 x 6,5

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

Uma distribuio normal pode ter qualquer mdia e qualquer desvio padro positivo. Esses dois parmetros e determinam completamente o aspecto da curva normal. A mdia d a localizao do eixo de simetria e o desvio padro descreve quanto os dados se espalham em torno da mdia. B C

Observe que as curvas A e B apresentam mesmo valor mdio, embora apresentem desvios padro diferente a curva com maior desvio padro mais espalhada. As curvas B e C mostram igual desvio padro (mesma abertura), embora a mdia de cada uma delas (eixo de simetria das curvas) seja diferente. EXEMPLO 1 Compreendendo a mdia e o desvio padro Sendo dadas as curvas de distribuio normal A e B na figura a seguir, responda: a) Qual das curvas tem maior mdia? b) Qual das curvas tem desvio padro maior?

Pgina 38 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

Idem, para as curvas A, B e C da figura a seguir.

7.2 CURVAS NORMAIS E PROBABILIDADES A rea total sob uma curva normal igual a 1.A rea de uma regio sob a curva de distribuio normal representa a probabilidade de que a varivel aleatria em estudo tenha um valor no intervalo correspondente. Numa distribuio normal com mdia e desvio padro , pode-se aproximar reas sob a curva normal da seguinte maneira: 1. 68% da rea est entre e +
Pgina 39 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

0,45 0,40 0,35 0,30

68%

Frequncia

0,25 0,20 0,15 0,10 0,05 0,00 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5

0,34

0,34

2. 95% da rea est entre


0,45 0,40 0,35 0,30

e +

95%

Frequncia

0,25 0,20 0,15 0,10 0,05


0,135 0,135

0,34

0,34

0,00 0,45 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 0,40

0,35

Frequncia

3. 99,75% da rea est entre


0,25 0,20 0,15 0,10 0,05

0,30

e 99,75 + %

0,34

0,34

Pgina 40 de 59

0,00 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5
0,023 5

x
0,135 0,135

0,023 5

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

EXEMPLO As pontuaes de um teste de QI em adultos so normalmente distribudos com mdia = 100 e desvio padro = 15. Calcule a probabilidade de um adulto escolhido ao acaso ter QI entre 70 e 115.

0,030

0,025

0,020

Frequncia

0,015

0,010

0,005

0,000 50 60 80 90 100 110 120 130 140

QI

7.3 DISTRIBUIO NORMAL PADRO Existem infinitas distribuies normais, cada uma com sua prpria mdia e desvio padro. A distribuio normal com mdia 0 (zero) e desvio padro 1 (um) chamada distribuio normal padro. A escala horizontal do grfico da distribuio normal padro corresponde aos escores z. Um escore z uma medida de posio que indica o nmero de desvios padro de um valor a partir da mdia. Pode-se transformar um valor x em um escore z pela frmula:

z=

valor mdia x = desvio padro


Pgina 41 de 59

150

70

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

0,45 0,40 0,35 0,30 Frequncia 0,25 0,20 0,15 0,10 0,05 0,00 -3,5 -3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0 Escore padro (z) 3,5

EXEMPLO As contas telefnicas de uma operadora tem mdia de R$ 70,00 e desvio padro R$ 8,00. Obtenha o escore z correspondente aos valores R$ 60,00; R$ 71,00 e R$ 92,00. Propriedades da distribuio normal padro: a) a rea acumulada est prxima de zero para escores z prximos a -3,49; b) a rea acumulada cresce medida que o escore z tambm cresce; c) a rea acumulada para z = 0 0,5; d) a rea acumulada est prxima de 1 para escores z prximos a 3,49. Se cada um dos dados de uma varivel aleatria normalmente distribuda x for transformado em um escore z, o resultado ser a distribuio normal padro. Quando ocorre essa transformao, a rea que est no intervalo sob a curva normal no padronizada igual quela que est sob a curva normal padro com as correspondentes fronteiras z. Uma vez que cada distribuio normal pode ser transformada em uma distribuio normal padro, pode-se usar escores z e a curva normal padro para obter reas (e, portanto probabilidades) sob qualquer curva normal.

TABELA NORMAL PADRO OBTENDO REAS SOB A CURVA NORMAL PADRO z 3,4 3,3 3,2 3,1 3,0 0,09 0,00 02 0,00 03 0,00 05 0,00 07 0,00 10 0,08 0,00 03 0,00 04 0,00 05 0,00 07 0,00 10 0,07 0,00 03 0,00 04 0,00 05 0,00 08 0,00 11 0,06 0,00 03 0,00 04 0,00 06 0,00 08 0,00 11 0,05 0,00 03 0,00 04 0,00 06 0,00 08 0,00 11 0,04 0,00 03 0,00 04 0,00 06 0,00 08 0,00 12 0,03 0,00 03 0,00 04 0,00 06 0,00 09 0,00 12 0,02 0,00 03 0,00 05 0,00 06 0,00 09 0,00 13 0,01 0,00 03 0,00 05 0,00 07 0,00 09 0,00 13 0 0,00 03 0,00 05 0,00 07 0,00 10 0,00 13

Pgina 42 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I 2,9 2,8 2,7 2,6 2,5 2,4 2,3 2,2 2,1 2,0 1,9 1,8 1,7 1,6 1,5 1,4 1,3 1,2 1,1 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 0,00 14 0,00 19 0,00 26 0,00 36 0,00 48 0,00 64 0,00 84 0,01 10 0,01 43 0,01 83 0,02 33 0,02 94 0,03 67 0,04 55 0,05 59 0,06 81 0,08 23 0,09 85 0,11 70 0,13 79 0,16 11 0,18 67 0,21 48 0,24 51 0,27 76 0,31 21 0,34 83 0,38 59 0,42 47 0,46 41 0,00 14 0,00 20 0,00 27 0,00 37 0,00 49 0,00 66 0,00 87 0,01 13 0,01 46 0,01 88 0,02 39 0,03 01 0,03 75 0,04 65 0,05 71 0,06 94 0,08 38 0,10 03 0,11 90 0,14 01 0,16 35 0,18 94 0,21 77 0,24 83 0,28 10 0,31 56 0,35 20 0,38 97 0,42 86 0,46 81 0,00 15 0,00 21 0,00 28 0,00 38 0,00 51 0,00 68 0,00 89 0,01 16 0,01 50 0,01 92 0,02 44 0,03 07 0,03 84 0,04 75 0,05 82 0,07 08 0,08 53 0,10 20 0,12 10 0,14 23 0,16 60 0,19 22 0,22 06 0,25 14 0,28 43 0,31 92 0,35 57 0,39 36 0,43 25 0,47 21 0,00 15 0,00 21 0,00 29 0,00 39 0,00 52 0,00 69 0,00 91 0,01 19 0,01 54 0,01 97 0,02 50 0,03 14 0,03 92 0,04 85 0,05 94 0,07 21 0,08 69 0,10 38 0,12 30 0,14 46 0,16 85 0,19 49 0,22 36 0,25 46 0,28 77 0,32 28 0,35 94 0,39 74 0,43 64 0,47 61 0,00 16 0,00 22 0,00 30 0,00 40 0,00 54 0,00 71 0,00 94 0,01 22 0,01 58 0,02 02 0,02 56 0,03 22 0,04 01 0,04 95 0,06 06 0,07 35 0,08 85 0,10 56 0,12 51 0,14 69 0,17 11 0,19 77 0,22 66 0,25 78 0,29 12 0,32 64 0,36 32 0,40 13 0,44 04 0,48 01 0,00 16 0,00 23 0,00 31 0,00 41 0,00 55 0,00 73 0,00 96 0,01 25 0,01 62 0,02 07 0,02 62 0,03 29 0,04 09 0,05 05 0,06 18 0,07 49 0,09 01 0,10 75 0,12 71 0,14 92 0,17 36 0,20 05 0,22 96 0,26 11 0,29 46 0,33 00 0,36 69 0,40 52 0,44 43 0,48 40 0,00 17 0,00 23 0,00 32 0,00 43 0,00 57 0,00 75 0,00 99 0,01 29 0,01 66 0,02 12 0,02 68 0,03 36 0,04 18 0,05 16 0,06 30 0,07 64 0,09 18 0,10 93 0,12 92 0,15 15 0,17 62 0,20 33 0,23 27 0,26 43 0,29 81 0,33 36 0,37 07 0,40 90 0,44 83 0,48 80 0,00 18 0,00 24 0,00 33 0,00 44 0,00 59 0,00 78 0,01 02 0,01 32 0,01 70 0,02 17 0,02 74 0,03 44 0,04 27 0,05 26 0,06 43 0,07 78 0,09 34 0,11 12 0,13 14 0,15 39 0,17 88 0,20 61 0,23 58 0,26 76 0,30 15 0,33 72 0,37 45 0,41 29 0,45 22 0,49 20 0,00 18 0,00 25 0,00 34 0,00 45 0,00 60 0,00 80 0,01 04 0,01 36 0,01 74 0,02 22 0,02 81 0,03 51 0,04 36 0,05 37 0,06 55 0,07 93 0,09 51 0,11 31 0,13 35 0,15 62 0,18 14 0,20 90 0,23 89 0,27 09 0,30 50 0,34 09 0,37 83 0,41 68 0,45 62 0,49 60 0,00 19 0,00 26 0,00 35 0,00 47 0,00 62 0,00 82 0,01 07 0,01 39 0,01 79 0,02 28 0,02 87 0,03 59 0,04 46 0,05 48 0,06 68 0,08 08 0,09 68 0,11 51 0,13 57 0,15 87 0,18 41 0,21 19 0,24 20 0,27 43 0,30 85 0,34 46 0,38 21 0,42 07 0,46 02 0,50 00

z 0, 0 0, 1 0, 2 0, 3 0, 4 0, 5 0, 6

0,00 0,50 00 0,53 98 0,57 93 0,61 79 0,65 54 0,69 15 0,72 57

0,01 0,50 40 0,54 38 0,58 32 0,62 17 0,65 91 0,69 50 0,72 91

0,02 0,50 80 0,54 78 0,58 71 0,62 55 0,66 28 0,69 85 0,73 24

0,03 0,51 20 0,55 17 0,59 10 0,62 93 0,66 64 0,70 19 0,73 57

0,04 0,51 60 0,55 57 0,59 48 0,63 31 0,67 00 0,70 54 0,73 89

0,05 0,51 99 0,55 96 0,59 87 0,63 68 0,67 36 0,70 88 0,74 22

0,06 0,52 39 0,56 36 0,60 26 0,64 06 0,67 72 0,71 23 0,74 54

0,07 0,52 79 0,56 75 0,60 64 0,64 43 0,68 08 0,71 57 0,74 86

0,08 0,53 19 0,57 14 0,61 03 0,64 80 0,68 44 0,71 90 0,75 17

0,09 0,53 59 0,57 53 0,61 41 0,65 17 0,68 79 0,72 24 0,75 49

Pgina 43 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I 0, 7 0, 8 0, 9 1, 0 1, 1 1, 2 1, 3 1, 4 1, 5 1, 6 1, 7 1, 8 1, 9 2, 0 2, 1 2, 2 2, 3 2, 4 2, 5 2, 6 2, 7 2, 8 2, 9 3, 0 3, 1 3, 2 3, 3 3, 4 0,75 80 0,78 81 0,81 59 0,84 13 0,86 43 0,88 49 0,90 32 0,91 92 0,93 32 0,94 52 0,95 54 0,96 41 0,97 13 0,97 72 0,98 21 0,98 61 0,98 93 0,99 18 0,99 38 0,99 53 0,99 65 0,99 74 0,99 81 0,99 87 0,99 90 0,99 93 0,99 95 0,99 97 0,76 11 0,79 10 0,81 86 0,84 38 0,86 65 0,88 69 0,90 49 0,92 07 0,93 45 0,94 63 0,95 64 0,96 49 0,97 19 0,97 78 0,98 26 0,98 64 0,98 96 0,99 20 0,99 40 0,99 55 0,99 66 0,99 75 0,99 82 0,99 87 0,99 91 0,99 93 0,99 95 0,99 97 0,76 42 0,79 39 0,82 12 0,84 61 0,86 86 0,88 88 0,90 66 0,92 22 0,93 57 0,94 74 0,95 73 0,96 56 0,97 26 0,97 83 0,98 30 0,98 68 0,98 98 0,99 22 0,99 41 0,99 56 0,99 67 0,99 76 0,99 82 0,99 87 0,99 91 0,99 94 0,99 95 0,99 97 0,76 73 0,79 67 0,82 38 0,84 85 0,87 08 0,89 07 0,90 82 0,92 36 0,93 70 0,94 84 0,95 82 0,96 64 0,97 32 0,97 88 0,98 34 0,98 71 0,99 01 0,99 25 0,99 43 0,99 57 0,99 68 0,99 77 0,99 83 0,99 88 0,99 91 0,99 94 0,99 96 0,99 97 0,77 04 0,79 95 0,82 64 0,85 08 0,87 29 0,89 25 0,90 99 0,92 51 0,93 82 0,94 95 0,95 91 0,96 71 0,97 38 0,97 93 0,98 38 0,98 75 0,99 04 0,99 27 0,99 45 0,99 59 0,99 69 0,99 77 0,99 84 0,99 88 0,99 92 0,99 94 0,99 96 0,99 97 0,77 34 0,80 23 0,82 89 0,85 31 0,87 49 0,89 44 0,91 15 0,92 65 0,93 94 0,95 05 0,95 99 0,96 78 0,97 44 0,97 98 0,98 42 0,98 78 0,99 06 0,99 29 0,99 46 0,99 60 0,99 70 0,99 78 0,99 84 0,99 89 0,99 92 0,99 94 0,99 96 0,99 97 0,77 64 0,80 51 0,83 15 0,85 54 0,87 70 0,89 62 0,91 31 0,92 79 0,94 06 0,95 15 0,96 08 0,96 86 0,97 50 0,98 03 0,98 46 0,98 81 0,99 09 0,99 31 0,99 48 0,99 61 0,99 71 0,99 79 0,99 85 0,99 89 0,99 92 0,99 94 0,99 96 0,99 97 0,77 94 0,80 78 0,83 40 0,85 77 0,87 90 0,89 80 0,91 47 0,92 92 0,94 18 0,95 25 0,96 16 0,96 93 0,97 56 0,98 08 0,98 50 0,98 84 0,99 11 0,99 32 0,99 49 0,99 62 0,99 72 0,99 79 0,99 85 0,99 89 0,99 92 0,99 95 0,99 96 0,99 97 0,78 23 0,81 06 0,83 65 0,85 99 0,88 10 0,89 97 0,91 62 0,93 06 0,94 29 0,95 35 0,96 25 0,96 99 0,97 61 0,98 12 0,98 54 0,98 87 0,99 13 0,99 34 0,99 51 0,99 63 0,99 73 0,99 80 0,99 86 0,99 90 0,99 93 0,99 95 0,99 96 0,99 97 0,78 52 0,81 33 0,83 89 0,86 21 0,88 30 0,90 15 0,91 77 0,93 19 0,94 41 0,95 45 0,96 33 0,97 06 0,97 67 0,98 17 0,98 57 0,98 90 0,99 16 0,99 36 0,99 52 0,99 64 0,99 74 0,99 81 0,99 86 0,99 90 0,99 93 0,99 95 0,99 97 0,99 98

ORIENTAES GERAIS PARA OBTENO DE REAS SOB A CURVA NORMAL 1. Esboce a curva normal padro e sombreie a rea apropriada sob a curva. 2. Obtenha a rea por meio dos procedimentos a seguir para cada caso mostrado: a) Para obter a rea esquerda de z, determine a rea que corresponde a z na tabela normal padro.

Pgina 44 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

b) Para obter a rea direita de z, use a tabela normal padro para determinar a rea que corresponde a z. Subtraia ento a rea de 1.

c) Para obter rea entre dois escores z, determine a rea correspondente a cada um deles na tabela normal padro. Subtraia a rea menor da maior.

EXERCCIOS 1 Determinar a rea sob a curva normal padro: a) b)

1,2

z
-2,25 0

c)

d)
Pgina 45 de 59

-0,5 0

1,5

z
0 2

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

e) esquerda de z = 1,54 f) esquerda de z = 1,96 g) direita de z = -0,95 h) direita de z = 1,28 i) j) l) esquerda de z = -2,575 entre z = -1,96 e z = 1,96 entre z = -0,44 e z = 1,18

m) esquerda de z = -2,97 n) direita de z = 1,66 2 Uma empresa fabrica rolamentos com dimetro das esferas distribudas normalmente com mdia 3,00 e desvio padro 0,02. Determine a probabilidade de encontrar esferas com: a) d > 3,01 b) d < 2,97 c) d > 3,05 d) 2,98 < d < 3,04 3 Um levantamento efetuado em uma rede de supermercados indica que um comprador leva em media 45 minutos com desvio padro 12 minutos. Obtenha a probabilidade de um comprador ficar a) entre 24 e 54 minutos b) mais que 39 minutos c) entre 33 e 60 minutos 4 As velocidades de veculos em uma via controlada por radar tem mdia de 56 km/h com desvio padro igual a 4 km/h. Obtenha as velocidades correspondentes aos escores z = 1,96, z = 2,33 e z = 0. Supondo que o radar aplique multa para velocidades superior a 62 km/h que o volume de trafego seja de 400 veculos por hora, que o valor de cada multa seja de R$150,00 calcule o valor total das multas por dia. 5 As notas de um concurso pblico esto normalmente distribudas com media 75 e o desvio padro de 6,5. Para ser classificado o candidato precisa figurar entre os 5% melhores. Qual a menor pontuao possvel para aprovao?

Pgina 46 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I 6 A distncia de frenagem de um determinado veiculo normalmente distribuda com media 48,2 m e desvio padro 1,98 m. Determine a distncia de frenagem que corresponde as seguintes probabilidades a) 50% b) 95% c) 1% 7 Uma marca de pneus para automveis tem uma expectativa de durao de 48.000 km e desvio padro de 4.000 km. Voc deseja dar uma garantia de reposio para pneus que se desgastem rpido demais. Como estabelecer a garantia se voc tiver planos de repor aproximadamente 10% dos pneus vendidos? 8 Trs traos de concreto apresentam igual resistncia mdia aos 28 dias (f c28 = 28,2 MPa), embora apresentem diferentes desvios padro: Trao A 6,3 MPa Trao B 4,2 MPa Trao C 2,7 MPa Sabendo que a resistncia caracterstica (fck) corresponde a um valor cuja probabilidade de 5 % das amostras apresentarem resistncia inferior, determine fck de cada trao. 9 Dois concretos apresentam igual resistncia caracterstica fck = 22 MPa, embora com desvio padro distinto. Concreto 1 = 3,4 MPa Concreto 2 = 6,3 MPa Pede-se determinar qual concreto apresentar maior resistncia mdia aos 28 dias? Esboce um grfico para ilustrar essa situao. Na sua opinio qual dos dois concretos ter maior custo?

Pgina 47 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

8. CORRELAO E REGRESSO
Nesse captulo voc ir aprender a descrever e a testar a significncia da relao entre duas variveis quando os dados so apresentados como pares ordenados. Graficamente, a relao pode ser descrita desenhando uma reta chamada reta de regresso que se ajusta aos pontos da forma mais prxima possvel. 8.1 CORRELAO Uma correlao uma relao entre duas variveis. Os dados podem ser representados por pares ordenados (x, y) onde (x) a varivel independente ou varivel explanatria e (y) a varivel dependente ou resposta. Um mapa de disperso pode ser usado para determinar se existe uma correlao linear (uma reta) entre as duas variveis. Os mapas de disperso a seguir mostram alguns tipos de correlao.

EXERCCIO A evoluo do tempo dos vencedores dos 100 m rasos nos Jogos Olmpicos dada na tabela a seguir. Trace o mapa de disperso que correlaciona a evoluo ao longo dos Jogos Olmpicos do tempo gasto para percorrer os 100 m e determine o tipo de correlao. Ano Home Mulher ns es (s) (s) 192 10,80 12,20 8 193 10,30 11,90 2 193 10,30 11,50 6 194 10,30 11,90 8 195 10,40 11,50 2 195 10,50 11,50 6 196 10,20 11,00 0 196 10,00 11,40 4 196 9,95 11,00
Pgina 48 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I 8 197 2 197 6 198 0 198 4 198 8 199 2 199 6 200 0
11,0

10,14 10,06 10,25 9,99 9,92 9,96 9,84 9,87

11,07 11,08 11,60 10,97 10,54 10,82 10,94 10,75

Jogos Olmpicos - 100 m rasos

10,8

10,6

Tempo (s)

10,4

10,2

10,0

9,8

9,6 1920

1930

1940

1950

1960 Ano

1970

1980

1990

2000

2010

Homens Marque no grfico acima os dados referentes ao tempo das mulheres.

8.2 COEFICIENTE DE CORRELAO A interpretao da existncia de uma correlao usando o mapa de disperso pode ser subjetiva. Uma maneira mais precisa de se medir o tipo e o grau de uma correlao linear entre duas variveis por meio do clculo do coeficiente de correlao (r). O nome formal de (r) coeficiente de correlao dos momentos de Pearson. Esse coeficiente uma medida do grau e da direo de uma relao linear entre duas variveis e pode ser calculado pela expresso:

r=

n x 2 ( x ) n y 2 ( y )
2

n x y ( x) ( y)

onde (n) o nmero de pares ordenados. O intervalo de variao do coeficiente de correlao vai de -1 a +1. Se (x) e (y) tiverem forte correlao linear positiva (r) estar prxima de +1. Se (x) e (y) tiverem uma forte correlao linear negativa, (r) estar prximo de -1. Se no existir correlao linear ou ainda se a correlao linear for fraca, (r) estar prximo de zero. Alguns exemplos so dados a seguir. O coeficiente de correlao populacional representado pela smbolo ().
Pgina 49 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

CALCULANDO O COEFICIENTE DE CORRELAO

1. Obtenha a soma dos valores de x x 2. Obtenha a soma dos valores de y y 3. Multiplique cada valor de x por seu valor de y correspondente e x determine a soma 4. Eleve ao quadrado cada valor de x e obtenha sua soma 5. Eleve ao quadrado cada valor de y e obtenha sua soma 6. Use essas cinco somas para calcular o coeficiente de correlao r= n x y ( x) ( y)
2

y x
2

y
2

n x 2 ( x ) n y 2 ( y )

Note que x2 significa elevar ao quadrado cada valor e somar os quadrados enquanto que (x)2 significa somar todos os valores e ento elevar ao quadrado a soma. EXERCCIO Determine o coeficiente de correlao para a evoluo ao longo dos Jogos do tempo gasto para percorrer os 100 m. Ano Home ns x y x.y x2 y2 1 1928 10,8 20822, 3717184 116,64 4 2 1932 10,3 19899, 3732624 106,09 6 3 1936 10,3 19940, 3748096 106,09 8 4 1948 10,3 20064, 3794704 106,09 4 5 1952 10,4 20300, 3810304 108,16 8
Pgina 50 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I 6 7 8 9 1 0 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1956 1960 1964 1968 1972 1976 1980 1984 1988 1992 1996 2000 33.4 32 10,5 10,2 10 9,95 10,14 10,06 10,25 9,99 9,92 9,96 9,84 9,87 172,7 8 20538 19992 19640 19581, 6 19996, 08 19878, 56 20295 19820, 16 19720, 96 19840, 32 19640, 64 19740 339.71 1,3 3825936 3841600 3857296 3873024 3888784 3904576 3920400 3936256 3952144 3968064 3984016 4000000 65.755.0 08 110,25 104,04 100 99,002 5 102,81 96 101,20 36 105,06 25 99,800 1 98,406 4 99,201 6 96,825 6 97,416 9 1.757,0 99

r= r=

n x 2 ( x ) n y 2 ( y )
2 2

n x y ( x) ( y)

17 339.711,3 33.432 172,78 17 65.755.008 ( 33.432 ) 17 1.757,099 (172,78 )


2

r = 0,8279
Idem para o tempo das mulheres Ano x 1928 1932 1936 1948 1952 1956 1960 1964 1968 1972 1976 1980 1984 1988 Mulheres y 12,2 11,9 11,5 11,9 11,5 11,5 11 11,4 11 11,07 11,08 11,6 10,97 10,54
Pgina 51 de 59

x.y

x2

y2

1 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I 1 5 1 6 1 7 1992 1996 2000 10,82 10,94 10,75

r=

n x 2 ( x ) n y 2 ( y )
2

n x y ( x) ( y)

r=

r=
8.3 TESTANDO A CORRELAO PARA A POPULAO Conhecendo-se o valor do coeficiente de correlao amostral (r) pode ser necessrio determinar se existe evidncia suficiente para decidir se o coeficiente de correlao populacional () representativo para um nvel de significncia . Note que a partir de dados amostrais voc estar pretendendo tomar deciso sobre valores populacionais. Existe sempre a possibilidade que sua inferncia esteja errada. O uso de um nvel de significncia = 0,05 significa que em 5% das vezes voc estar dizendo que o coeficiente populacional significante quando realmente ele no . Uma maneira de determinar se o coeficiente de correlao populacional () significante, consiste na utilizao dos valores crticos tabelados a seguir. Nessa a primeira coluna representa o nmero de pares ordenados (n) da amostra e a segunda e a terceira coluna representam valores crticos para um nvel de significncia = 0,05 e = 0,01 respectivamente. EXERCCIO Para os dados dos tempos dos 100 m rasos nos Jogos Olmpicos, considerando um nvel de significncia de 1% (tamanho da amostra n = 17) obtemos na tabela 0,606 correspondendo ao valor crtico do coeficiente de correlao populacional. Como o valor calculado (r = 0,8279) superior ao valor crtico a correlao vlida para um nvel de significncia 1% Tabela Valores crticos para o coeficiente de correlao de Pearson

Pgina 52 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

8.4 RETAS DE REGRESSO Aps ter verificado que a correlao significante iremos determinar a equao da reta que melhor se ajusta aos valores observados. Essa denominada reta de regresso e pode ser usada para prever um valor de (y) para um dado valor de (x). Muitas retas podem ser traadas pelos pontos dos dados, mas a reta de regresso definida por critrios especficos. No mapa de disperso apresentado a seguir para cada ponto (d - resduo) representa a diferena entre o valor observado (y) e o valor definido pela equao da reta (y e). Dentre todas as retas que podem ser traadas, a reta de regresso aquela para a qual a soma dos quadrados dos resduos (d2) um mnimo. Uma reta de regresso tambm chamada de reta de ajuste timo aquela para a qual a soma dos quadrados dos resduos um mnimo. Lembre-se que a equao da reta definida por seus coeficientes angular (a) e coeficiente linear (b) y = a x + b

Pgina 53 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

Esses coeficientes so dados por

a=
onde ( y,

n x y x y n x ( x)
2 2

b = y a x =

y a x
n n

x ) so respectivamente a mdia dos valores de (y) e (x). Os demais elementos

j esto determinados no clculo do coeficiente de correlao. Observe que a reta de regresso sempre passa pelo ponto mdio do conjunto de dados que tem coordenadas

( x, y ) .

EXERCCIO 1) Determine a equao da reta de regresso para a evoluo do tempo dos 100 m rasos nos Jogos Olmpicos.

a=

n x y x y n x2 ( x) n
2

17 339 .711,3 33.432 172,78 = 0,00944 2 17 65.755.008 ( 33.432 ) 17 17

b = y a x =

y a x = 172,78 ( 0,00944 ) 33.432 = 28,73


n

A equao da reta de regresso ser

y = 0,00944 x + 28,73
2) Idem para o tempo das mulheres

a=

nx y x y n x2 ( x) n
2

b = y a x =

y a x =
n
Jogos Olmpicos - 100 m rasos 11

10,8

y = -0,0094x + 28,726
10,6

R = 0,6851

Tempo (s)

10,4

10,2

10

9,8

Pgina 54 de 59
9,6 1920 1930 1940 1950 1960 Ano 1970 1980 1990 2000 2010

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

Determine o coeficiente de correlao e a equao da reta de regresso para as seguintes situaes a) Gastos com propaganda x vendas Gastos com Vendas MR$ x.y x2 y2 propaganda MR$ (x) (y) 2,4 255 1,6 184 2,0 220 2,6 240 1,4 180 1,6 184 2,0 186 2,2 215

r=

n x 2 ( x ) n y 2 ( y )
2

n x y ( x) ( y)

r=

r= a= nx y x y n x2 ( x) n
2

b = y a x =

y a x =
n
x.y x2 y2

b) Nvel de renda x doaes Nvel de renda % de doaes MR$ (y) (x) 42 9 48 10 50 8 59 5 65 6 72 3

r=

n x 2 ( x ) n y 2 ( y )
2

n x y ( x) ( y)

r=

Pgina 55 de 59

r=

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

a=

nx y x y n x2 ( x) n
2

b = y a x =

y a x =
n

8.5 COEFICIENTE DE DETERMINAO Existem trs tipos de variao em torno de uma reta de regresso que so o desvio total, o desvio explicado e o desvio inexplicado para cada par ordenado (xi, yi) em um conjunto de dados. A figura a seguir ilustra esses desvios. Desvio total = yi -

y (valor observado menos valor mdio) y (valor estimado pela reta de regresso menos valor mdio)

Desvio explicado = ye -

Desvio inexplicado = yi ye (valor observado menos valor estimado) Uma vez calculados esses desvios para cada par de pontos (xi, yi) possvel calcular a variao total, a variao explicada e a variao inexplicada.

( y y) Variao explicada = ( y y ) Variao inexplicada = ( y y )


Variao total =
2 i 2 e i e

Variao total = Variao explicada + Variao inexplicada

Pgina 56 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

y
yi xi,yi Desvio total ye ym

RETA REGRESSO
Desvio inexplicado

DE

xi,y
e

xi,y
m

Desvio explicado

xm

xi

O quadrado do coeficiente de correlao (r) chamado coeficiente de determinao (r 2) e pode ser definido como

r2 =

Variao exp licada Variao total

Assim, por exemplo, se o coeficiente de correlao igual a (0,9), ento o coeficiente de determinao ser 0,92 = 0,81. Isso significa que 81% da variao de (y) pode ser explicada pela reta de regresso. Os 19% restantes da variao so inexplicados e podem ser devido a outros fatores ou a erros amostrais. EXERCCIO Calcule o coeficiente de determinao para as quatro situaes apresentadas anteriormente. 8.6 ERRO PADRO DA ESTIMATIVA O erro padro da estimativa (se) uma medida do desvio padro dos valores (yi) observados em torno do valor previsto (ye) para um dado valor (xi) e pode ser calculado pela expresso

se =

b y a ( x y) n2

EXERCCIO Calcule o erro padro da estimativa para as quatro situaes apresentadas anteriormente.

Pgina 57 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I

8.7 INTERVALOS DE PREVISO Uma vez que a equao de regresso determinada e supe-se que (x) e (y) tem uma distribuio normal bivariada, possvel definir um intervalo de previso para um valor verdadeiro de (y). Para construir o intervalo de previso, use uma distribuio t com n-2 graus de liberdade (veja tabela a seguir). Dada uma equao de regresso linear, um valor especfico de (x), um intervalo de previso (c) para (y)

ye E < y < ye + E
onde

1 n x x E = t c se 1 + + n n x2 ( x)2
A estimativa pontual (ye) e o erro mximo da estimativa (E). A probabilidade de que o intervalo contenha (y) (c). Tabela Distribuio t

EXERCCIO Determine o intervalo de confiana para o ponto mdio dos valores de (x) para as quatro situaes apresentadas anteriormente.
Pgina 58 de 59

ENGENHARIA CIVIL PUCPR Probabilidade e Estatstica I FUNES DO EXCEL Coeficiente de correlao =PEARSON(B3:B19(intervalo de valores de x) ;C3:C19(intervalo de valores de y)) Coeficiente angular da reta de regresso =INCLINAO(C3:C19(intervalo de valores de y);B3:B19(intervalo de valores de x)) Coeficiente linear da reta de regresso =INTERCEPO(C3:C19(intervalo de valores de y);B3:B19(intervalo de valores de x)) Erro padro da estimativa =EPADYX(C3:C19(intervalo de valores de y);B3:B19(intervalo de valores de x))

Pgina 59 de 59

S-ar putea să vă placă și