Sunteți pe pagina 1din 47

MDULO 1 INTRODUO ESTATSTICA

1. INTRODUO ESTATSTICA 1.1. HISTRIAS RELACIONADAS COM A ESTATSTICA 1. FLORENCE NIGHTINGALE Florence Nightingale (1820 1910) conhecida por muitos como a fundadora da profisso de enfermeira, mas ela tambm salvou milhares de vidas utilizando a estatstica. Ao encontrar um hospital em ms condies sanitrias e sem suprimentos, tratou de melhorar essas condies e passou a utilizar a estatstica para convencer as autoridades da necessidade de uma reforma mdica mais ampla. Elaborou grfico original para mostrar que, durante a guerra da Crimia, morreram mais soldados em conseqncia de ms condies sanitrias do que em combate. Florence Nightingale foi pioneira na utilizao no s da estatstica social como das tcnicas de grficos. 2. MOTORISTAS MAIS IDOSOS SO MAIS SEGUROS QUE OS MAIS MOOS? A American Association of Retired People AARP (Associao Americana de Aposentados) alega que os motoristas mais idosos se envolvem em menor nmero de acidentes do que os mais jovens. Nos ltimos anos, os motoristas de 16-19 anos de idade causaram cerca de 1,5 milho de acidentes, em comparao com apenas 540.000 causados por motoristas com 70 anos ou mais, de forma que a alegao da AARP parece vlida. Acontece, entretanto, que os motoristas mais idosos no dirigem tanto quanto os mais jovens. Em lugar de considerar apenas o nmero de acidentes, devemos examinar tambm as taxas de acidentes. Eis as taxas de acidentes por 100 milhes de milhas percorridas: 8,6 para os motoristas com idade de 10 a 19 anos / 4,6 para os com idade de 75 a 79 anos / 8,9 para os com idade de 80 a 84 anos / 20,3 para os motoristas com 80 anos ou mais. Embora os motoristas mais jovens tenham de fato maior nmero de acidentes, os mais velhos apresentam as mais altas taxas de acidente. 3. O VOCABULRIO DE SHAKESPEARE De acordo com Bradley Efron e Ronald Thisted, as obras de Shakespeare contm 31.534 palavras diferentes. Com o auxlio da teoria das probabilidades, concluram que Shakespeare conhecia ao menos outras 35.000 palavras que no empregou em suas obras. 4. VOC TEM MEDO DE VOAR? Muitos tendem a superestimar a probabilidade de morte em conseqncia de eventos que do manchete, como desastre de avio, crimes ou atentados terroristas. Pesquisas estatsticas mostram que, embora a dcada passada tenha sido a mais segura para a aviao dos EUA, o povo est se mostrando mais temeroso do que no passado em relao s viagens areas. Ao

viajar de Nova York para a Califrnia, sua chance de morrer de 1 em 11 milhes para um jato comercial, 1 em 900.000 para um trem, 1 em 14.000 para um automvel. 5. O CONQUISTADOR O Conquistador um filme de 1954, produzido prximo a St. George, Utah, um ano aps ter sido detonada uma bomba atmica na vizinhana. Dentre as 220 pessoas que trabalharam no filme, John Wayne e outras 97 pessoas morreram de cncer. Com o auxilio de mtodos estatsticos, pode-se mostrar que a taxa de 45% de morte por cncer significativamente mais elevada do que o que se poderia esperar em circunstancias normais. Mas no possvel utilizar mtodos estatsticos para mostrar que a causa das mortes por cncer foi exploso da bomba atmica. 6. OS TELEFONES CELULARES PODEM CAUSAR CNCER NO CREBRO? Na revista Discovery, o matemtico John Allen Paulos cita o caso de um processo movido por um cidado, sob a alegao de que o cncer no crebro de sua esposa fora causado pelo uso de um telefone celular. Esse processo despertou considervel ateno na imprensa e na TV e causaram uma baixa na cotao das aes das empresas fabricantes de telefones celulares. Paulos concluiu que, com uma taxa anual de 0,007% de incidncia de cncer no crebro e com 10 milhes de usurios de telefones celulares, podemos esperar, cada ano, cerca de 700 casos de cncer cerebral entre os usurios desses aparelhos. A concluso de Paulos foi: Como apenas uns poucos casos chamaram a ateno do pblico, deveramos concluir que os telefones celulares poderiam at mesmo eliminar o cncer cerebral. Absurdo, sem dvida, mas no mais absurdo do que o raciocnio que motivou a histeria original. Paulos cita esse caso como um exemplo dos obstculos psicolgicos compreenso racional da estatstica. 7. UM CASO DE DISCRIMINAO UTILIZA A ESTATSTICA A estatstica desempenha freqentemente papel-chave em casos de discriminao. Um desses casos envolveu Matt Perez e mais de 300 outros agentes do FBI, que ganharam uma ao, sob a alegao de que os hispnicos do FBI eram discriminados nas reas de promoo, atribuies e aes disciplinares. O queixoso contratou o estatstico Gary Lafree, que mostrou que os postos de administrao superiores do FBI tinham propores significativamente menores de empregados hispnicos. A estatstica foi fundamental para a vitria do queixoso neste caso. 8. VOLTAIRE VENCE A LOTERIA Em 1729, o filsofo francs Voltaire ficou rico elaborando um esquema para vencer a loteria de Paris. O governo havia institudo uma loteria para compensar a desvalorizao das aplices municipais. Como a cidade acrescentou grandes quantias, resultou que o valor dos prmios ultrapassava o preo de todos os bilhetes. Voltaire formou um grupo que comprava todos os bilhetes da loteria de um ms e ganhou durante quase um ano. Um apostador da loteria do estado de Nova York tentou ganhar uma parcela de um prmio excepcionalmente grande, resultante da falta de ganhadores em sorteios prvios. Ele pretendia emitir um cheque de

6.135.756,00 dlares abrangendo todas as combinaes, mas o estado no aceitou, sob a alegao de que a natureza da loteria teria sido alterada. 9. O DENTIFRCIO CREST E AMOSTRAS DEPENDENTES No final da dcada de 1950, a Procter & Gamble introduziu o dentifrcio Crest como o primeiro a conter flor. Para testar a eficcia de Crest no combate crie, pesquisadores fizeram experincias com vrios grupos de gmeos. Um dos gmeos em cada grupo usou o Crest com flor, enquanto o outro gmeo usou um dentifrcio comum, sem flor. Admitiu-se que cada par de gmeos tivesse os mesmos hbitos alimentares, de higiene bucal, e as mesmas caractersticas genticas. Os resultados que os gmeos que fizeram uso de dentifrcio Crest apresentavam um nmero de cries significativamente menor do que os que no usavam. A utilizao de gmeos como amostras dependentes permitiu que o pesquisador controlasse muito das variveis responsveis pelas cries. 10. ESTIMATIVA DO ACAR EM LARANJAS Na Flrida, a indstria ctrica utiliza amplamente mtodos estatsticos. Uma aplicao especfica envolve a maneira como os plantadores so pagos pelas laranjas usadas para fazer suco. Inicialmente, pesa-se um carregamento recebido na fbrica; em seguida, seleciona-se uma amostra aleatria de cerca de uma dzia de laranjas. Essa amostra pesada e espremida, medindo-se a quantidade de acar no suco. Com base nos resultados amostrais, estima-se a quantidade total de acar presente em todo o carregamento. O pagamento do carregamento de laranjas se baseia na estimativa da quantidade de acar, porque as laranjas mais doces tm mais valor do que as menos doces, mesmo que as quantidades de suco sejam iguais. 11. CONCENTRAO DE DOENAS Periodicamente, os meios de comunicao relatam casos de concentrao de doenas em uma localidade. Uma comunidade de New Jersey acusou 13 casos de leucemia em 5 anos, quando a taxa normal seria de 1 caso em 10 anos. A pesquisa de tal concentrao pode ser reveladora. Um estudo de concentrao de casos de cncer nas proximidades das minas de asbesto na frica levou a descoberta de que as fibras de asbesto podem ser cancergenas. Ao fazermos uma tal anlise, devemos evitar o erro de criar artificialmente (ainda que de forma no-intencional) uma concentrao, ou aglomerado, que se assemelharia a uma repartio arbitrria de zonas de influncia eleitoral, visando a uma vitria. 12. AMOSTRAGEM EM COMPANHIAS AREAS As companhias de aviao costumam utilizar um sistema contbil dispendioso para dividir a receita de bilhetes que envolviam duas ou mais companhias. Agora, as companhias aplicam um mtodo de amostragem em que se seleciona aleatoriamente uma pequena percentagem desses bilhetes fracionados; essa amostra usada para se fazer diviso de toda a receita. O erro causado por esse mtodo pode fazer com que algumas companhias recebam um pouco menos

que a sua quota exata, mas essas perdas so amplamente compensadas pela economia de mode-obra. Com o novo sistema, as companhias economizam milhes de dlares a cada ano. 13. UMA GRANDE AMOSTRA NEM SEMPRE SUFICIENTEMENTE BOA No devemos utilizar dados amostrais tendenciosos em inferncias, por maior que seja o tamanho da amostra. Por exemplo, em Women and Love: A Cultural Revolution in Progress, Shere Hite fundamenta suas concluses em 4.500 respostas recebidas atravs de 100.000 questionrios enviados a vrios grupos de mulheres. Uma amostra aleatria de 4.500 indivduos em geral daria bons resultados, mas a amostra de Hite tendenciosa. criticada por supervalorizar as mulheres que aderem a grupo e as que se sentem seguras sobre os tpicos abordados. Como a amostra de Hite tendenciosa, suas inferncias no so vlidas, mesmo que 4.500 possa parecer um tamanho de amostra suficientemente grande.

2. INTRODUO Todas as cincias tm suas razes na histria do homem. A matemtica, que considerada a cincia que une clareza do raciocnio a sntese da linguagem, originou-se do convvio social, das trocas, da contagem, com carter prtico, utilitrio, emprico. A estatstica, ramo da matemtica aplicada, teve origem semelhante. Desde a antiguidade, vrios povos j registravam o nmero de habitantes, de nascimento, de bitos, faziam estimativas das riquezas individual e social, distribuam eqitativamente terras ao povo, cobravam impostos e realizavam inquritos quantitativos por processos que, hoje, chamaramos de estatsticas. Na idade mdia colhiam-se informaes, geralmente com finalidades tributrias ou blicas. A partir do sculo XVI comearam a surgir as primeiras anlises sistemticas de fatos sociais, como batizados, casamentos, funerais, originando as primeiras tbuas e tabelas e os primeiros nmeros relativos. No sculo XVIII, o estudo de tais fatos foi adquirindo, aos poucos, feio verdadeiramente cientfica. Godofredo Achenwall batizou a nova cincia (ou mtodo) com o nome de ESTATSTICA, que provm do latim status e significa estado, determinando o seu objetivo e suas relaes com as cincias.

2. DEFINIO ESTATSTICA uma coleo de mtodos para planejar experimentos, obter dados e organizlos, resumi-los, analis-los, interpret-los e deles extrair concluses.

uma parte da matemtica aplicada que fornece metdos para coleta, organizao, descrio, anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises. A coleta, a organizao ,a descrio dos dados, o clculo e a interpretao de coeficientes pertencem ESTATSTICA DESCRITIVA, enquanto a anlise e a interpretao dos dados, associada a uma margem de incerteza, ficam a cargo da ESTATSTICA INDUTIVA ou INFERENCIAL, tambm chamada como a medida da incerteza ou mtodos que se fundamentam na teoria da probabilidade. A palavra estatstica tem dois significados diferentes, embora relacionados entre si. No sentido mais comum, uma coleo de dados numricos. EX: Nmero de nascimentos e bitos de uma cidade.

CONJUNTO DE DADOS NUMRICOS

Estatstica Descritiva (1 fase) Coleta, Organizao e Descrio dos dados. MTODO DE ANLISE Estatstica Indutiva ou Inferencial (2 fase) Anlise e Interpretao dos dados.

POPULAO: uma coleo completa de todos os elementos (valores, pessoas, medidas etc.) a serem estudados. AMOSTRA: uma subcoleo de elementos extrados de uma populao. EXEMPLO 1:

CENSO: uma coleo de dados relativos a todos os elementos de uma populao.

PARMETRO: uma medida numrica que descreve uma caracterstica de uma populao. ESTATSTICA: uma medida numrica que descreve uma caracterstica de uma amostra.

EXEMPLO 2: Em uma pesquisa com 1.015 pessoas, escolhidas aleatoriamente, somente 269 (26,5%) delas possuem computador. Podemos dizer que o nmero 26,5% trata-se de uma estatstica, pois se baseia em uma amostra e no na populao toda. Agora, se a pesquisa for feita com os 27 governadores estaduais dos Brasil onde, 20 (74%) possuem computador, dizemos que o nmero obtido (74%) um parmetro pois se baseia em toda a populao de governadores. VARIVEL: , convencionalmente, o conjunto de resultados possveis de um fenmeno. Ela pode ser qualitativa ou quantitativa. QUALITATIVA: Quando seus valores so expressos por atributos. EXEMPLO 3: Sexo, Cor da pele, Cor do cabelo, Cor dos olhos, Escolaridade, Profisso, etc. QUANTITATIVA: Quando seus valores so expressos em nmeros. Se dividem em: Varivel Discreta ou Descontnua e Varivel Contnua. EXEMPLO 4: Salrios dos operrios, Idade dos alunos de uma escola, Bibliotecas da cidade de Manaus, Casais residentes em uma cidade, etc. DISCRETA OU DESCONTNUA: Seus valores so expressos geralmente atravs de nmeros inteiros no negativos. Resulta normalmente de contagens. EXEMPLO 5: N de alunos presentes s aulas de introduo estatstica no 1 semestre de 1997: mar = 18 , abr = 30 , mai = 35 , jun = 36

CONTNUA: Resulta normalmente de uma mensurao, e a escala numrica de seus possveis valores corresponde ao conjunto R dos nmeros Reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. EXEMPLO 6: Quando voc vai medir a temperatura de seu corpo com um termmetro de mercrio o que ocorre o seguinte: O filete de mercrio, ao dilatar-se, passar por todas as temperaturas intermedirias at chegar na temperatura atual do seu corpo.

EXERCCIO - Classifique as variveis em qualitativas ou quantitativas (contnuas ou discretas): . Cor dos olhos das alunas... Resp:qualitativa . ndice de liquidez nas ndstrias capixaba... Resp:quantitativa contnua . Produo de caf no Brasil... Resp:quantitativa contnua . Nmero de defeitos em aparelhos de TV... Resp:quantitativa discreta . Comprimento dos pregos produzidos por uma empresa... Resp:quantitativa contnua . O ponto obtido em cada jogada de um dado... Resp:quantitativa discreta NVEIS DE MEDIO OU DE MENSURAO: Atribuio de nmeros ou outros smbolos a caractersticas de objetos, de acordo com certas regras predefinidas. So quatro escalas principais de medio: Nominal, Ordinal, Intervalar e Razo. NOMINAL: aquela em que os nmeros servem apenas para nomear, identificar e/ou categorizar dados sobre pessoas, objetos ou fatos. EXEMPLO 7: SEXO: 1. Masculino / 2. Feminino ESTADO CIVIL: 1. Solteiro / 2. Casado / 3. Vivo / 4. Divorciado SITUAO PROFISSIONAL: 1. Empregado / 2. Desempregado ORDINAL: aquela em que os nmeros servem para ordenar, segundo um processo de comparao, as pessoas, objetos ou fatos, em relao determinada caracterstica.

EXEMPLO 8: Queira, por favor, classificar os seguintes aparelhos de fax de 1 a 5, sendo 1 o mais preferido e 5 o menos preferido: - Panasonic ____________ - Toshiba ____________ - Sharp ____________ - Savin ____________ O pesquisador designa nmeros para refletir as classificaes relativas de uma srie de afirmaes e depois usa esses nmeros para interpretar a distncia relativa. (1) Muito certo (2) Certo (3) Neutro (4) Incerto (5) Muito incerto

EXEMPLOS NOMINAL / ORDINAL Pode-se formular uma pergunta de duas ou trs maneiras, segundo a mensurao escolhida. INFORMAO SOBRE O NVEL DE ESCOLARIDADE DO CHEFE DA FAMLIA Escala nominal: O chefe de famlia analfabeto? 1. Sim 2. No Escala ordinal: Qual o nvel de escolar do chefe de famlia? 1 grau / 2 grau / 3 grau Escala de razo: Quanto ano freqentou a escola? 5 anos NDICES: So razes entre duas grandezas tais que um no inclui a outra. EXEMPLO 10:

DENSIDADE DEMOGRFICA

Populao Superfcie Valor total da produo

PRODUO PER CAPITA

=
Renda Populao

Populao

RENDA PER CAPITA

COEFICIENTES: So razes entre o nmero de ocorrncias e o nmero total (ocorrncias e no ocorrncias).

10

EXEMPLO 11:

COEFICIENTE DE NATALIDADE

Nmero de nascimentos Populao total Nmero de bitos

COEFICIENTE DE MORTALIDADE

Populao total Nmero de alunos evadidos Nmero inicial de matrculas

COEFICIENTE DE EVASO ESCOLAR

TAXAS: So coeficientes multiplicados por um potncia de 10 (10, 100, 1.000 etc) para tornar o resultado mais inteligvel. EXEMPLO 12:
TAXA DE MORTALIDADE = TAXA DE NATALIDADE Coeficiente de mortalidade X 1.000 Coeficiente de natalidade X 1.000 Coeficiente de evaso escolar X 100

TAXA DE EVASO ESCOLAR =

11

MDULO 2 ESTATSTICA DESCRITIVA

12

SRIES ESTATSTICAS TABELA: um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemtica. De acordo com a Resoluo 886 do IBGE, nas casas ou clulas da tabela devemos colocar :

um trao horizontal ( - ) quando o valor zero; trs pontos ( ... ) quando no temos os dados; zero ( 0 ) quando o valor muito pequeno para ser expresso pela unidade utilizada; um ponto de interrogao ( ? ) quando temos dvida quanto exatido de determinado valor.

GRFICOS ESTATSTICOSGGG So representaes visuais dos dados estatsticos que devem corresponder, mas nunca substituir as tabelas estatsticas.

Caractersticas: Uso de escalas, sistema de coordenadas, simplicidade, clareza e veracidade. Grficos de informao: So grficos destinados principalmente ao pblico em geral, objetivando proporcionar uma visualizao rpida e clara. So grficos tipicamente expositivos, dispensando comentrios explicativos adicionais. As legendas podem ser omitidas, desde que as informaes desejadas estejam presentes. Grficos de anlise: So grficos que prestam-se melhor ao trabalho estatstico, fornecendo elementos teis fase de anlise dos dados, sem deixar de ser tambm informativos. Os grficos de anlise frequentemente vm acompanahdos de uma tabela estatstica. Inclui-se, muitas vezes um texto explicativo, chamando a ateno do leitor para os pontos principais revelados pelo grfico. Uso indevido de Grficos: Podem trazer uma idia falsa dos dados que esto sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, de um problema de construo de escalas. Classificao dos grficos: Diagramas, Estereogramas, Pictogramas e Cartogramas.

13

1 - Diagramas: So grficos geomtricos dispostos em duas dimenses. So os mais usados na representao de sries estatsticas. Eles podem ser :

1.1-

Grficos em barras horizontais.


N Mat.

Escola D Escola C Escola B Escola A 0 250 500 750 1000

1.2-

Grficos em barras verticais ( colunas )


N Mat.

1000 750 500 250 0 Escola A Escola B Escola C Escola D

Quando as legendas no so breves usa-se de preferncia os grficos em barras horizontais. Nesses grficos os retngulos tm a mesma base e as alturas so proporcionais aos respectivos dados. A ordem a ser observada a cronolgica, se a srie for histrica, e a decrescente, se for geogrfica ou categrica. 1.3Grficos em colunas ou ou colunas compostas.
N Matriculas por ano 1000 750 500 250 0 Escola A Escola B Escola C Escola D 0 250 500 750 1000 Escola D Escola C Escola B Escola A N Matriculas por ano

2005

2006

2005

2006

14

1.4- Grficos em colunas superpostas. Eles diferem dos grficos em barras ou colunas convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou mais atributos.
N Matriculas por ano 2000 1500 1000 500 0 Escola A Escola B 2005 Escola C 2006 Escola D

1.4-

Grficos em linhas ou lineares.


N Mat.

1000 750 500 250 0 Escola Escola Escola Escola Escola Escola A B C D E F

So frequentemente usados para representao de sries cronolgicas com um grande nmero de perodos de tempo. As linhas so mais eficientes do que as colunas, quando existem intensas flutuaes nas sries ou quando h necessidade de se representarem vrias sries em um mesmo grfico.

15

Quando representamos, em um mesmo sistema de coordenadas, a variao de dois fenmenos, a parte interna da figura formada pelos grficos desses fenmeno denomidada de rea de excesso. 1.5- Grficos em setores. Obs: As sries temporas geralmente no so representadas por este tipo de grfico.
N Mat. N Mat.

Escola A

Escola B

Escola C

Escola D

Escola A

Escola B

Escola C

Escola D

2 - Estereogramas: So grficos geomtricos dispostos em trs dimenses, pois representam volume. So usados nas representaes grficas das tabelas de dupla entrada. Em alguns casos este tipo de grfico fica difcil de ser interpretado dada a pequena preciso que oferecem.

16

DISTRIBUIO DE FREQUNCIA Distribuio de Frequncia: um tipo de tabela que condensa uma coleo de dados conforme as frequncias (repeties de seus valores). Tabela primitiva ou dados brutos: uma tabela ou relao de elementos que no foram numericamente organizados. difcil formarmos uma idia exata do comportamento do grupo como um todo, a partir de dados no ordenados. Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 ROL: a tabela obtida aps a ordenao dos dados (crescente ou decrescente). Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 Distribuio de frequncia sem intervalos de classe: a simples condensao dos dados conforme as repeties de seu valores. Para um ROL de tamanho razovel esta distribuio de frequncia inconveniente, j que exige muito espao. Veja exempo abaixo: Dados 41 42 43 44 45 46 50 51 52 54 57 58 60 Total Frequncia 3 2 1 1 1 2 2 1 1 1 1 2 2 20

Distribuio de frequncia com intervalos de classe:Quando o tamanho da amostra elevado mais racional efetuar o agrupamento dos valores em vrios intervalos de classe.

Classes Freqncias 41 |------- 45 7

17

45 49 53 57

|------- 49 |------- 53 |------- 57 |------- 61 Total

3 4 1 5 20

ELEMENTOS DE UMA DISTRIBUIO DE FREQUNCIA (com intervalos de classe): CLASSE: so os intervalos de variao da varivel e simbolizada por i e o nmero total de classes simbolizada por k. Ex: na tabela anterior k=5 e 49 |------- 53 a 3 classe, onde i=3. LIMITES DE CLASSE: so os extremos de cada classe. O menor nmero o limite inferior de classe (li) e o maior nmero, limite superior de classe(Li). Ex: em 49 |------- 53... l3= 49 e L3= 53. O smbolo |------- representa um intervalo fechado esquerda e aberto direita. O dado 53 do ROL no pertence a classe 3 e sim a classe 4 representada por 53 |------- 57. AMPLITUDE DO INTERVALO DE CLASSE: obtida atravs da diferena entre o limite superior e inferior da classe e simbolizada por hi = Li - li. Ex: na tabela anterior hi= 53 - 49 = 4. Obs: Na distribuio de frequncia c/ classe o hi ser igual em todas as classes. AMPLITUDE TOTAL DA DISTRIBUIO: a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe. AT = L(max) - l(min). Ex: na tabela anterior AT = 61 - 41= 20. AMPLITUDE TOTAL DA AMOSTRA (ROL): a diferena entre o valor mximo e o valor mnimo da amostra (ROL). Onde AA = Xmax - Xmin. Em nosso exemplo AA = 60 - 41 = 19. Obs: AT sempre ser maior que AA. PONTO MDIO DE CLASSE: o ponto que divide o intervalo de classe em duas partes iguais. .......Ex: em 49 |------- 53 o ponto mdio x3 = (53+49)/2 = 51, ou seja x3=(l3+L3)/2. MTODO PRTICO PARA CONSTRUO DE UMA DIST. DE FREQUNCIAS C/ CLASSE: 1 - Organize os dados brutos em um ROL. 2 - Calcule a amplitude amostral AA. No nosso exmplo: AA =60 - 41 =19 3 - Calcule o nmero de classes atravs da "Regra de Sturges": n 3 |-----| 5 6 |-----| 11 i= n de classes 3 4

18

12 |-----| 22 23 |-----| 46 47 |-----| 90 91 |-----| 181 182 |-----| 362

5 6 7 8 9

Obs: Qualquer regra para determinao do n de classes da tabela no nos levam a uma deciso final; esta vai depender, na realidade de um julgamento pessoal, que deve estar ligado natureza dos dados. No nosso exemplo: n = 20 dados, ento ,a princpio, a regra sugere a adoo de 5 classes. 4 - Decidido o n de classes, calcule ento a amplitude do intervalo de classe h > AA/i. No nosso exemplo: AA/i = 19/5 = 3,8 . Obs:Como h > AA/i um valor ligeiramente superior para haver folga na ltima classe. Utilizaremos ento h = 4 5 - Temos ento o menor n da amostra, o n de classes e a amplitude do intervalo. Podemos montar a tabela, com o cuidado para no aparecer classes com frequncia = 0 (zero). No nosso exemplo: o menor n da amostra = 41 + h = 45, logo a primeira classe ser representada por ...... 41 |------- 45. As classes seguintes respeitaro o mesmo procedimento. O primeiro elemento das classes seguintes sempre sero formadas pelo ltimo elemento da classe anterior.

REPRESENTAO GRFICA DE UMA DISTRIBUIO Histograma, Polgono de frequncia e Polgono de frequncia acumulada Em todos os grficos acima utilizamos o primeiro quadrante do sitema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos os valores da varivel e na linha vertical (eixo das ordenadas), as frequncias. Histograma: formado por um conjunto de retngulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos mdios coincidam com os pontos mdios

19

dos intervalos de classe. A rea de um histograma proporcional soma das frequncias simples ou absolutas. Frequncias simples ou absolutas: so os valores que realmente representam o nmero de dados de cada classe. A soma das frequncias simples igual ao nmero total dos dados da distribuio. Frequncias relativas: so os valores das razes entre as frequncias absolutas de cada classe e a frequncia total da distribuio. A soma das frequncias relativas igual a 1 (100 %). Polgono de frequncia: um grfico em linha, sendo as frequncias marcadas sobre perpendiculares ao eixo hotizontal, levantadas pelos pontos mdios dos intervalos de classe. Para realmente obtermos um polgono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos mdios da classe anterior primeira e da posteior ltima, da distribuio. Polgono de frequncia acumulada: traado marcando-se as frequncias acumuladas sobre perpendiculares ao eixo horzontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. Frequncia simples acumulada de uma classe: o total das frequncias de todos os valores inferiores ao limite superior do intervalo de uma determida classe. Frequncia relativa acumulada de um classe: a frequncia acumulada da classe, dividida pela frequncia total da distribuio.
...CLASSE.. 50 |-------- 54 54 |-------- 58 58 |-------- 62 62 |-------- 66 66 |-------- 70 70 |-------- 74 Total fi 4 9 11 8 5 3 40 xi 52 56 60 64 68 72 fri 0,100 0,225 0,275 0,200 0,125 0,075 1,000 Fi 4 13 24 32 37 40 Fri 0,100 0,325 0,600 0,800 0,925 1,000

Exerccio: (Com base na tabela acima) Sendo fi= freq. simples; xi= ponto mdio de classe; fri= freq. relativa simples; Fi= freq. acumulada e Fri= freq. relativa acumulada. Construa o histograma, polgono de frequncia e polgono de freq. acumulada: Obs: uma distribuio de frequncia sem intervalos de classe representada graficamente por um diagrama onde cada valor da varivel representado por um segmento de reta vertical e de comprimento proporcional respectiva frequncia.

20

MEDIDAS DE POSIO Introduo So as estatsticas que representam uma srie de dados orientando-nos quanto posio da distribuio em relao ao eixo horizontal do grfico da curva de frequncia. As medidas de posies mais importantes so as medidas de tendncia central ou promdias (verifica-se uma tendncia dos dados observados a se agruparem em torno dos valores centrais). As medidas de tendncia central mais utilizadas so: mdia aritmtica, moda e mediana. Outros promdios menos usados so as mdias: geomtrica, harmnica, quadrtica, cbica e biquadrtica.

21

As outras medidas de posio so as separatrizes, que englobam: a prpria mediana, os decis, os quartis e os percentis.

MDIA 1. MDIA ARITMTICA = igual ao quociente entre a soma dos valores do conjunto e o nmero total dos valores. ......onde xi so os valores da varivel e n o nmero de valores.

Dados no-agrupados: Quando desejamos conhecer a mdia dos dados no-agrupados em tabelas de frequncias, determinamos a mdia aritmtica simples. Exemplo: Sabendo-se que a venda diria de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 kilos, temos, para venda mdia diria na semana de: .= (10+14+13+15+16+18+12) / 7 = 14 kilos

Desvio em relao mdia: a diferena entre cada elemento de um conjunto de valores e a mdia aritmtica, ou seja:.. di = Xi No exemplo anterior temos sete desvios:... d1 = 10 - 14 = - 4 , ...d2 = 14 - 14 = 0 , ...d3 = 13 14 = - 1 , ...d4 = 15 - 14 = 1 ,... d5 = 16 - 14 = 2 ,... d6 = 18 - 14 = 4 ...e... d7 = 12 - 14 = - 2. Propriedades da mdia 1 propriedade: A soma algbrica dos desvios em relao mdia nula. No exemplo anterior : d1+d2+d3+d4+d5+d6+d7 = 0 2 propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma varivel, a mdia do conjunto fica aumentada ( ou diminuida) dessa constante. Se no exemplo original somarmos a constante 2 a cada um dos valores da varivel temos: Y = 12+16+15+17+18+20+14 / 7 = 16 kilos ou

22

Y=

.+ 2 = 14 +2 = 16 kilos

3 propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante (c), a mdia do conjunto fica multiplicada ( ou dividida) por essa constante. Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da varivel temos: Y = 30+42+39+45+48+54+36 / 7 = 42 kilos ou Y= x 3 = 14 x 3 = 42 kilos

Dados agrupados: Sem intervalos de classe Consideremos a distribuio relativa a 34 famlias de quatro filhos, tomando para varivel o nmero de filhos do sexo masculino. Calcularemos a quantidade mdia de meninos por famlia: N de meninos 0 1 2 3 4 total frequncia = fi 2 6 10 12 4 34

Como as frequncias so nmeros indicadores da intensidade de cada valor da varivel, elas funcionam como fatores de ponderao, o que nos leva a calcular a mdia aritmtica ponderada, dada pela frmula:

..xi. 0 1 2 3 4 total

..fi. 2 6 10 12 4 34

..xi.fi . 0 6 20 36 16 78

onde 78 / 34 = 2,3 meninos por famlia

23

Com intervalos de classe Neste caso, convencionamos que todos os valores includos em um determinado intervalo de classe coincidem com o seu ponto mdio, e determinamos a mdia aritmtica ponderada por meio da frmula: ..onde Xi o ponto mdio da classe. Exemplo: Calcular a estatura mdia de bebs conforme a tabela abaixo.
Estaturas (cm) 50 |-----------54 54 |-----------58 58 |-----------62 62 |-----------66 66 |-----------70 70 |-----------74 Total frequncia = fi 4 9 11 8 5 3 40 ponto mdio = ..xi.fi. xi 52 56 60 64 68 72 208 504 660 512 340 216 2.440

Aplicando a frmula acima temos: 2.440 / 40.= 61. logo... 2. MDIA GEOMTRICA a raiz n-sima do produto de todos eles.

= 61 cm

2.1. Mdia Geomtrica Simples:

ou . Exemplo - Calcular a mdia geomtrica dos seguintes conjuntos de nmeros:E a) { 10, 60, 360 }........ no excel : = (10*60*360)^(1/3) ....R: 60 b) { 2, 2, 2 }........ no excel : = (2*2*2)^(1/3) ....R: 2 c) { 1, 4, 16, 64 }........ no excel : =(1*4*16*64)^(1/4) ....R: 8

24

2.2. Mdia Geomtrica Ponderada :

ou .. Exemplo - Calcular a mdia geomtrica dos valores da tabela abaixo:


...xi... 1 3 9 27 total ...fi... 2 4 2 1 9

No excel.......=(1^2*3^4*9^2*27^1)^(1/9)........R: 3,8296

Propriedades da Mdia Geomtrica 1 propriedade: O produto dos quocientes de cada valor de um conjunto de nmeros pela mdia geomtrica do conjunto = 1. Exemplo - Comprovar a 1 propriedade da mdia geomtrica com os dados { 10, 60, 360 } g = 60... onde... 10/60 x 60/60 x 360/60 = 1

2 propriedade: Sries que apresentam o mesmo nmero de elementos com o mesmo produto tm a mesma mdia geomtrica. Exemplo - Comprovar a 2 propriedade da mdia geomtrica com os dados: a = {8 e 12,5}.........b = {2 e 50} ga = 10 ..................... gb = 10

25

3 propriedade: A mdia geomtrica menor ou igual a mdia aritmtica. A desigualdade g < ..sempre se verifica, quando os valores da srie forem positivos e nem todos iguais. Se entre eles houver um ou mais zeros, a mdia geomtrica ser nula. A igualdade g= ..s ocorrer quando todos os valores da srie forem iguais.

4 propriedade: Quanto maior a diferena entre os valores originais maior ser diferena entre as mdias aritmtica e geomtrica. Veja na tabela abaixo: conjunto X = 2} {2, mdia aritmtica 2 15 10 26 mdia geomtrica 2 14,97 9,8 10

Y = {14, 16} W = {8, 12} Z = 50} {2,

Aplicaes da Mdia Geomtrica a) Mdia de Relaes


Empresa A B Capital lquido 2.500 1.000 Dvida 1.000 2.000 Capital lquido/Dvida 2,5 0,5

g = no excel.............=(2,5*0,5)^(1/2)........R: 1,1180 Obs: Se, para uma determinada empresa, se deseja estabelecer uma relao do tipo capital/dvida que seja independente da dvida ou do capital das diferentes empresas envolvidas, recomendvel o uso da mdia geomtrica. Se o que se deseja saber a relao capital/dvida de um certo nmero de empresas, aps a consolidao, a cifra correta ser obtida atravs da mdia aritmtica. b) Mdia em distribuies assimtricas ( veremos em captulo especial )

26

c) Mdia de taxas de variao Exemplo: Suponhamos que um indivduo tenha aplicado um capital de R$ 500,00 em 1995. Aps um ano de aplicao, essa importncia chegou a R$ 650,00. Reaplicando essa ltima quantia, ao final de mais um ano seu montante situava-se em R$ 910,00. Qual a taxa mdia de aumento de capital ?
Perodo Taxa

1995 a 1996 650/500 = 1,3 1996 a 1997 910/650 = 1,4

A taxa mdia ser no excel..=(1,3*1,4)^(1/2) ou a raiz quadrada do produto de 1,3 e 1,4. Resposta: 1,3491

3. MDIA HARMNICA o inverso da mdia aritmtica dos inversos.

3.1. Mdia Harmnica Simples:.(para dados no agrupados)

..

ou

Exemplo - Calcular a mdia harmnica simples dos seguintes conjuntos de nmeros: a) { 10, 60, 360 }. Resp:.. 3/(1/10+1/60+1/360) = 25,12 b) { 2, 2, 2, 2 } . Resp:... . 4/(1/2+1/2+1/2+1/2) = 2....

3.2. Mdia Harmnica Ponderada : (para dados agrupados em tabelas de frequncias)

27

.. Exemplo - Calcular a mdia harmnica dos valores da tabela abaixo:


classes ....fi.. ....xi.. ........fi/xi.... .. .. .... 2 4 6 8 10 2/2 = 1,00 4/4 = 1,00 8/6 = 1,33 4/8 = 0,50 2/10 = 0,20 4,03

1 |--------- 3 2 3 |--------- 5 4 5 |--------- 7 8 7 |--------- 9 4 9 11 |--------2 20

total

Resp: 20 / 4,03 = 4,96

Propriedades da mdia harmnica 1 propriedade: A mdia harmnica menor que a mdia geomtrica para valores da varivel diferentes de zero. h< g.. e por extenso de raciocnio podemos escrever :.. h < g<

OBS: A mdia harmnica no aceita valores iguais a zero como dados de uma srie. A igualdade g= h.= ....s ocorrer quando todos os valores da srie forem iguais.

OBS: Quando os valores da varivel no forem muito diferentes, verifica-se aproximadamente a seguinte relao: g = ( .+ h ) /.2

Demonstraremos a relao acima com os seguintes dados: z = { 10,1 ; 10,1 ; 10,2 ; 10,4 ; 10,5 } Mdia aritmtica = 51,3 / 5 = 10,2600

28

Mdia geomtrica = 10,2587 Mdia harmnica = 5 / 0,4874508 = 10,2574 Comprovando a relao: 10,2600 + 10,2574 / 2 = 10,2587 = mdia geomtrica

4. MDIA QUADRTICA a raiz quadrada da mdia aritmtica dos quadrados

4.1. Mdia Quadrtica Simples: (para dados no agrupados)

Exemplo - Calcular a mdia quadrtica simples do seguinte conjunto de nmeros: a = { 2 , 3 , 4 , 5 } ....Resp: 3,67 . 4.2. Mdia Quadrtica Ponderada: Quando os valores da varivel estiverem dispostos em uma tabela de frequncias, a mdia quadrtica ser determinada pela seguinte expresso:

Exemplo - Calcular a mdia quadrtica dos valores da tabela abaixo:


classes ....fi.. ....xi.. ... .. .. 3 5 7 9 11 9 25 49 81 121 ... fi 45 250 588 810 605 2298 .

2 |--------- 4 5 4 |--------- 6 10 6 |--------- 8 12 8 |--------- 10 10 10 12 total |-------5 42

No excel ....=( 2298/42 )^(1/2) ....Resp: 7,40

29

ou aplica-se a raiz quadrada sobre 2298/42 OBS:

Sempre que os valores de X forem positivos e pelo menos um dado diferente vlida a seguinte relao: q> > g> h

A igualdade entre as mdias acima se verifica quando os valores da varivel forem iguais (constantes) A mdia quadrtica largamente utilizada em Estatstica, principalmente quando se pretende calcular a mdia de desvios ( x - .) , em vez de a mdia dos valores originais. Neste caso, a mdia quadrtica denominada desvio-padro, que uma importante medida de disperso.

MODA o valor que ocorre com maior frequncia em uma srie de valores. Mo o smbolo da moda. Desse modo, o salrio modal dos empregados de uma fbrica o salrio mais comum, isto , o salrio recebido pelo maior nmero de empregdos dessa fbrica. A Moda quando os dados no esto agrupados

A moda facilmente reconhecida: basta, de acordo com deinio, procurar o valor que mais se repete.

Exemplo: Na srie { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda igual a 10.

H sries nas quais no exista valor modal, isto , nas quais nenhum valor aparea mais vezes que outros.

Exemplo: { 3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie amodal.

.Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos, ento, que a srie tem dois ou mais valores modais.

30

Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A srie bimodal. . A Moda quando os dados esto agrupados a) Sem intervalos de classe Uma vez agrupados os dados, possvel determinar imediatamente a moda: basta fixar o valor da varivel de maior frequncia. Exemplo: Qual a temperatura mais comum medida no ms abaixo:
Temperatur Frequnci as a 0 C 1 C 2 C 3 C 3 9 12 6

Resp: 2 C a temperatura modal, poi a de maior frequncia. . b) Com intervalos de classe A classe que apresenta a maior frequncia denominada classe modal. Pela definio, podemos afirmar que a moda, neste caso, o valor dominante que est compreendido entre os limites da classe modal. O mtodo mais simples para o clculo da moda consiste em tomar o ponto mdio da classe modal. Damos a esse valor a denominao de moda bruta. Mo = ( l* + L* ) /2 onde l* = limite inferior da classe modal e L*= limite superior da classe modal. Exemplo: Calcule a estatura modal conforme a tabela abaixo.
Classes (em Frequnci cm) a 54 |------------ 58 58 |------------ 62 62 |------------ 66 66 |------------ 70 9 11 8 5

Resp: a classe modal 58|-------- 62, pois a de maior frequncia. l*=58 e L*=62 Mo = (58+62) / 2 = 60 cm ( este valor estimado, pois no conhecemos o valor real da moda). .Mtodo mais elaborado pela frmula de CZUBER: Mo = l* + (d1/(d1+d2)) x h*

31

l*= limite inferior da classe modal..... e..... L*= limite superior da classe modal d1= frequncia da classe modal - frequncia da classe anterior da classe modal d2= frequncia da classe modal - frequncia da classe posterior da classe modal h*= amplitude da classe modal Obs: A moda utilizada quando desejamos obter uma medida rpida e aproximada de posio ou quando a medida de posio deva ser o valor mais tpico da distribuio. J a mdia aritmtica a medida de posio que possui a maior estabilidade.

MEDIANA A mediana de um conjunto de valores, dispostos segundo uma ordem ( crescente ou decrescente), o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo nmero de elementos. Smbolo da mediana: Md A mediana em dados no-agrupados Dada uma srie de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 } De acordo com a definio de mediana, o primeiro passo a ser dado o da ordenao (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 } O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9. . Mtodo prtico para o clculo da Mediana Se a srie dada tiver nmero mpar de termos: O valor mediano ser o termo de ordem dado fela frmula : .( n + 1 ) / 2 Exemplo: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 2, 5 } 1 - ordenar a srie { 0, 0, 1, 1, 2, 2, 3, 4, 5 } n = 9 logo (n + 1)/2 dado por (9+1) / 2 = 5, ou seja, o 5 elemento da srie ordenada ser a mediana A mediana ser o 5 elemento = 2 .Se a srie dada tiver nmero par de termos:

32

O valor mediano ser o termo de ordem dado fela frmula :.... .[( n/2 ) +( n/2+ 1 )] / 2
Obs: n/2 e (n/2 + 1) sero termos de ordem e devem ser substitudos pelo valor correspondente.

Exemplo: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 } 1 - ordenar a srie { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 } n = 10 logo a frmula ficar: [( 10/2 ) + (10/2 + 1)] / 2 [( 5 + 6)] / 2 ser na realidade (5 termo+ 6 termo) / 2 5 termo = 2 6 termo = 3 A mediana ser = (2+3) / 2 ou seja, Md = 2,5 . A mediana no exemplo ser a mdia aritmtica do 5 e 6 termos da srie. Notas:

Quando o nmero de elementos da srie estatstica for mpar, haver coincidncia da mediana com um dos elementos da srie. Quando o nmero de elementos da srie estatstica for par, nunca haver coincidncia da mediana com um dos elementos da srie. A mediana ser sempre a mdia aritmtica dos 2 elementos centrais da srie. Em um srie a mediana, a mdia e a moda no tm, necessariamente, o mesmo valor. A mediana, depende da posio e no dos valores dos elemntos na srie ordenada. Essa uma da diferenas marcantes entre mediana e mdia ( que se deixa influenciar, e muito, pelos valores extremos). Vejamos:

Em { 5, 7, 10, 13, 15 } a mdia = 10 e a mediana = 10 Em { 5, 7, 10, 13, 65 } a mdia = 20 e a mediana = 10 isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por influncia dos valores extremos, ao passo que a mediana permanece a mesma. . A mediana em dados agrupados a) Sem intervalos de classe Neste caso, o bastante identificar a frequncia acumulada imediatamente superior metade da soma das requncias. A mediana ser aquele valor da varivel que corresponde a tal frequncia acumulada. Exemplo conforme tabela abaixo:

33

Varivel Frequnci Frequncia xi a fi acumulada 0 1 2 3 4 total 2 6 9 13 5 35 2 8 17 30 35

Quando o somatrio das frequncias for mpar o valor mediano ser o termo de ordem dado fela frmula :.

Como o somatrio das frequncias = 35 a frmula ficar: ( 35+1 ) / 2 = 18 termo = 3.. .. Quando o somatrio das frequncias for par o valor mediano ser o termo de ordem dado fela frmula :.

Exemplo - Calcule Mediana da tabela abaixo:


Varivel Frequnci Frequncia xi a fi acumulada 12 14 15 16 17 20 total 1 2 1 2 1 1 8 1 3 4 6 7 8

Aplicando frmula acima teremos:[(8/2)+ (8/2+1)]/2 = (4 termo + 5 termo) / 2 = (15 + 16) / 2 = 15,5 b) Com intervalos de classe Devemos seguir os seguintes passos: 1) Determinamos as frequncias acumuladas ; 2) Calculamos ;

34

3) Marcamos a classe correspondente frequncia acumulada imediatamente superior . Tal classe ser a classe mediana ; 4) Calculamos a Mediana pela seguinte frmula:..... l* + [( - FAA ) x h*] / f* , onde:

l* = o limite inferior da classe mediana. FAA = a frequncia acumulada da classe anteior classe mediana. f* = a frequncia simples da classe mediana. h* = a amplitude do intervalo da classe mediana.

Exemplo:
classes 50 |-----------54 54 |-----------58 58 |-----------62 62 |-----------66 66 |-----------70 70 |-----------74 total frequncia = fi 4 9 11 8 5 3 40 Frequncia acumulada 4 13 24 32 37 40

= 40 / 2 =.20........... logo.a classe mediana ser 58 |---------- 62 l* = 58........... FAA = 13........... f* = 11........... h* = 4 Substituindo esses valores na frmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 OBS: Esta mediana estimada, pois no temos os 40 valores da distribuio. Emprego da Mediana

Quando desejamos obter o ponto que divide a dsitribuio em duas partes iguais. Quando h valores extremos que afetam de amneira acentuada a mdia aritmtica. Quando a varivel em estudo salrio.

35

SEPARATRIZES Alm das medidas de posio que estudamos, h outras que, consideradas individualmente, no so medidas de tendncia central, mas esto ligadas mediana relativamente sua caracterstica de separar a srie em duas partes que apresentam o mesmo nmero de valores. Essas medidas - os quartis, os decis e os percentis - so, juntamente com a mediana, conhecidas pelo nome genrico de separatrizes. . 1. QUARTIS Denominamos quartis os valores de uma srie que a dividem em quatro partes iguais. Precisamos portanto de 3 quartis (Q1 , Q2 e Q3 ) para dividir a srie em quatro partes iguais. Obs: O quartil 2 ( Q2 ) sempre ser igual a mediana da srie. Quartis em dados no agrupados O mtodo mais prtico utilizar o princpio do cculo da mediana para os 3 quartis. Na realidade sero calculadas " 3 medianas " em uma mesma srie. Exemplo1: Calcule os quartis da srie: { 5, 2, 6, 9, 10, 13, 15 } O primeiro passo a ser dado o da ordenao (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 }

36

O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9 que ser = Q2. Temos agora {2, 5, 6 } e {10, 13, 15 } como sendo os dois grupos de valores iguais proporcionados pela mediana ( quartil 2). Para o cculo do quartil 1 e 3 basta calcular as medianas das partes iguais provenientes da verdadeira Mediana da srie (quartil 2). Logo em { 2, 5, 6 } a mediana = 5 . Ou seja: ser o quartil 1 em {10, 13, 15 } a mediana =13 . Ou seja: ser o quartil 3 Exemplo2: Calcule os quartis da srie: { 1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13 } A srie j est ordenada, ento calcularemos o Quartil 2 = Md = (5+6)/2 = 5,5 O quartil 1 ser a mediana da srie esquerda de Md : { 1, 1, 2, 3, 5, 5 } Q1 = (2+3)/2 = 2,5 O quartil 3 ser a mediana da srie direita de Md : {6, 7, 9, 9, 10, 13 } Q3 = (9+9)/2 = 9 Quartis para dados agrupados em classes Usamos a mesma tcnica do clculo da mediana, bastando substituir, na frmula da mediana,
E fi / 2.... por

... k . E fi / 4 ... sendo k o nmero de ordem do quartil.

Assim, temos: Q1 = . l* + [(E fi / 4 - FAA ) x h*] / f* Q2 = . l* + [(2.E fi / 4 - FAA ) x h*] / f* Q3 = . l* + [(3.E fi / 4 - FAA ) x h*] / f* Exemplo3 - Calcule os quartis da tabela abaixo:
classes 50 |-----------54 54 |-----------58 58 |-----------62 62 |-----------66 66 |-----------frequncia = fi 4 9 11 8 5 Frequncia acumulada 4 13 24 32 37

37

70 70 |-----------74 total 3 40 40

O quartil 2 = Md , logo: = 40 / 2 =.20........... logo.a classe mediana ser 58 |---------- 62 l* = 58........... FAA = 13........... f* = 11........... h* = 4 Substituindo esses valores na frmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 O quartil 1 : E fi / 4 = 10 Q1 = 54 + [ (10 - 4) x 4] / 9 = 54 + 2,66 = 56,66 .O quartil 3 : 3.E fi / 4 = 30 Q3 = 62 + [ (30 -24) x 4] / 8 = 62 + 3 = 65

2. DECIS A definio dos decis obedece ao mesmo princpio dos quartis, com a modificao da porcentagem de valores que ficam aqum e alm do decil que se pretende calcular. A fmula bsica ser : k .E fi / 10 onde k o nmero de ordem do decil a ser calculado. Indicamos os decis : D1, D2, ... , D9. Deste modo precisamos de 9 decis para dividirmos uma srie em 10 partes iguais. De especial interesse o quinto decil, que divide o conjunto em duas partes iguais. Assim sendo,o quinto decil igual ao segundo quartil, que por sua vez igual mediana. Para D5 temos : 5.E fi / 10 = E fi / 2 Exemplo: Calcule o 3 decil da tabela anterior com classes. k= 3 onde 3 .E fi / 10 = 3x40/10 = 12. Este resultado corresponde a 2 classe. D3 = 54 + [ (12 - 4) x 4] / 9 = 54 + 3,55 = 57,55

3. PERCENTIL ou CENTIL

38

Denominamos percentis ou centis como sendo os noventa e nove valores que separam uma srie em 100 partes iguais. Indicamos: P1, P2, ... , P99. evidente que P50 = Md ; P25 = Q1 e P75 = Q3. O clculo de um centil segue a mesma tcnica do clculo da mediana, porm a frmula ser : k .E fi / 100 onde k o nmero de ordem do centil a ser calculado. Exemplo: Calcule o 8 centil da tabela anterior com classes . k= 8 onde 8 .E fi / 100 = 8x40/100 = 3,2. Este resultado corresponde a 1 classe. P8 = 50 + [ (3,2 -0) x 4] / 4 = 50 + 3,2 = 53,2

Disperso ou Variabilidade: a maior ou menor diversificao dos valores de uma varivel em torno de um valor de tendncia central ( mdia ou mediana ) tomado como ponto de comparao. A mdia - ainda que considerada como um nmero que tem a faculdade de representar uma srie de valores - no pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compem o conjunto. Consideremos os seguintes conjuntos de valores das variveis X, Y e Z: X = { 70, 70, 70, 70, 70 } Y = { 68, 69, 70 ,71 ,72 } Z = { 5, 15, 50, 120, 160 } Observamos ento que os trs conjuntos apresentam a mesma mdia aritmtica = 350/5 = 70 Entretanto, fcil notar que o conjunto X mais homogneo que os conjuntos Y e Z, j que todos os valores so iguais mdia. O conjunto Y, por sua vez, mais homogneo que o conjunto Z, pois h menor diversificao entre cada um de seus valores e a mdia representativa. Conclumos ento que o conjunto X apresenta disperso nula e que o conjunto Y apresenta uma disperso menor que o conjunto Z.

39

MEDIDAS DE DISPERSO ABSOLUTA Amplitude total : a nica medida de disperso que no tem na mdia o ponto de referncia. Quando os dados no esto agrupados a amplitude total adiferena entr o maior e o menor valor observado: AT = X mximo - X mnimo. Exemplo: Para os valores 40, 45, 48, 62 e 70 a amplitude total ser: AT = 70 - 40 = 30 Quando os dados esto agrupados sem intervalos de classe ainda temos : AT = X mximo - X mnimo.

Exemplo: xi 0 1 3 4 fi 2 6 5 3

AT = 4 - 0 = 4 Com intervalos de classe a amplitude total a diferena entre o limite superior da ltima classe e o limite inferior da primeira classe. Ento AT = L mximo - l mnimo

40

Exemplo:
Classes 4 |------------- 6 6 |------------- 8 8 |------------10 fi 6 2 3

AT = 10 - 4 = 6 A amplitude total tem o incoveniente e s levar em conta os dois valores extremos da srie, descuidando do conjunto de valores intermedirios. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia, no controle de qualidade ou como uma medida de clculo rpido sem muita exatido. Desvio quartil Tambm chamado de amplitude semi-interquatlica e baseada nos quartis. Smbolo: Dq e Observaes: 1 - O desvio quartil apresenta como vantagem o fato de ser uma medida fcil de calcular e de interpretar. Alm do mais, no afetado pelos valores extremos, grandes ou pequenos, sendo recomendado, por conseguinte, quando entre os dados figurem valores extremos que no se consideram representativos. 2- O desvio quartil dever ser usado preferencialmente quando a medida de tendncia central for a mediana. 3- Trata-se de uma medida insensvel distribuio dos itens menores que Q1, entre Q1 e Q3 e maiores que Q3. Exemplo: Para os valores 40, 45, 48, 62 e 70 o desvio quartil ser: Q1 = (45+40)/2 = 42,5 Q3 = (70+62)/2 = 66 Dq = (66 - 42,5) / 2 = 11,75 a Frmula: Dq = (Q3 - Q1) / 2

Desvio mdio absoluto Para dados brutos a mdia aritmtica dos valores absolutos dos desvios tomados em relao a uma das seguintes medidas de tendncia central: mdia ou mediana. Smbolo = Dm

41

Frmula : para a Mdia = E | Xi -

| /n

Frmula : para a Mediana = E | Xi - Md | / n As barras verticais indicam que so tomados os valores absolutos, prescindindo do sinal dos desvios. Exemplo: Calcular o desvio mdio do conjunto de nmeros { - 4 , - 3 , - 2 , 3 , 5 } = - 0, 2 e Md = - 2

Tabela auxiliar para clculo do desvio mdio


Xi -4 -3 -2 3 5 | Xi | 3,8 2,8 1,8 3,2 5,2 16,8 Xi - Md (- 4) - (-2) = 2 (- 3) - (-2) = 1 (- 2) - (-2) = 0 3 - (-2) = 5 5 - (-2) = 7 E= | Xi - Md | 2 1 0 5 7 15

Xi (- 4) - (-0,2) = -3,8 (- 3) - (-0,2) = -2,8 (- 2) - (-0,2) = -1,8 3 - (-0,2) = 3,2 5 - (-0,2) = 5,2 E=

Pela Mdia : Dm = 16,8 / 5 = 3,36

Pela Mediana : Dm = 15 / 5 = 3

Desvio mdio para Dados Tabulados Se os valores vierem dispostos em uma tabela de frequncias, agrupados ou no em classes, sero usadas as seguintes frmulas: Clculo pela mdia: Dm = (E |Xi |. fi ) / E fi

Clculo pela mediana: Dm = (E |Xi - Md |. fi ) / E fi Exemplo de clculo pela mdia:

42

Xi 3 4 5 6

fi 2 2 3 3

Xi . f i 6 8 15 18 47

Xi 4,7 - 1,7 4,7 - 0,7 4,7 4,7 0,3 1,3

| Xi | 1,7 0,7 0,3 1,3 E=

| Xi i 3,4 1,4 0,9 3,9 9,6

|.f

E = 10

Dm = 9,6 / 10 = 0,96

Para o cculo do Desvio mdio pela mediana segue-se o mesmo raciocnio.


Xi 3 4 5 6 E= fi 2 2 3 3 10 Md 5 5 5 5 Xi - Md -2 -1 0 1 | Xi - Md | 2 1 0 1 E= | Xi - Md | . f i 4 2 0 1 7

Dm = 7 / 10 = 0,70 Obs: Apesar de o desvio mdio expressar aceitavelmente a disperso de uma amostra, no to frequentemente empregado como o desvio-padro. O desvio mdio despreza o fato de alguns desvios serem negativos e outros positivos, pois essa medida os trata como se fossem todos positivos. Todavia ser preferido o uso do desvio mdio em lugar do desvio-padro, quando esse for indevidamente influenciado pelos desvios extremos.

DESVIO PADRO a medida de disperso mais geralmente empregada, pois leva em considerao a totalidade dos valores da varivel em estudo. um indicador de variabilidade bastante estvel. O desvio padro baseia-se nos desvios em torno da mdia aritmtica e a sua frmula bsica pode ser traduzida como : a raiz quadrada da mdia aritmtica dos quadrados dos desvios e representada por S .

43

A frmula acima empregada quando tratamos de uma populao de dados no-agrupados.

Exemplo: Calcular o desvio padro da populao representada por - 4 , -3 , -2 , 3 , 5


Xi -4 -3 -2 3 5 - 0,2 - 0,2 - 0,2 - 0,2 - 0,2 - 3,8 - 2,8 - 1,8 3,2 5,2 E= 14,44 7,84 3,24 10,24 27,04 62,8

Sabemos que n = 5 e 62,8 / 5 = 12,56. A raiz quadrada de 12,56 o desvio padro = 3,54 Obs: Quando nosso interesse no se restringe descrio dos dados mas, partindo da amostra, visamos tirar inferncias vlidas para a respectiva populao, convm efetuar uma modificao, que consiste em usar o divisor n - 1 em lugar de n. A frmula ficar ento:

Se os dados - 4 , -3 , -2 , 3 , 5 representassem uma amostra o desvio padro amostral seria a raiz quadrada de 62,8 / (5 -1) = 3,96

44

O desvio padro goza de algumas propriedades, dentre as quais destacamos: 1 = Somando-se (ou subtraindo-se) uma constante a todos os valores de uma varivel, o desvio padro no se altera. 2 = Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante (diferente de zero), o desvio padro fica multiplicado ( ou dividido) por essa constante.

Quando os dados esto agrupados (temos a presena de frequncias) a frmula do desvio padro ficar :

ou Exemplo: Calcule o desvio padro populacional da tabela abaixo:


Xi 0 1 2 3 4 Total fi 2 6 12 7 3 30 Xi . f i 0 6 24 21 12 63 2,1 2,1 2,1 2,1 2,1 -2,1 -1,1 -0,1 0,9 1,9

quando se trata de uma amostra

.fi 4,41 1,21 0,01 0,81 3,61 E= 8,82 7,26 0,12 5,67 10,83 32,70

Sabemos que E fi = 30 e 32,7 / 30 = 1,09. A raiz quadrada de 1,09 o desvio padro = 1,044 Se considerarmos os dados como sendo de uma amostra o desvio padro seria : a raiz quadrada de 32,7 / (30 -1) = 1,062

45

Obs: Nas tabelas de frequncias com intervalos de classe a frmula a ser utilizada a mesma do exemplo anterior.

VARINCIA o desvio padro elevado ao quadrado e simbolizado por S2 A varincia uma medida que tem pouca utilidade como estatstica descritiva, porm extremamente importante na inferncia estatstica e em combinaes de amostras * EXERCCIOS * 1- Considere os seguintes conjuntos de nmeros: A = { 10, 20, 30, 40, 50 } B = { 100, 200, 300, 400, 500 }

Que relao existe entre os desvios padres dos dois conjuntos de nmeros ?

2- Dados os conjuntos de nmeros: A = { 220, 230, 240, 250, 260 } B = { 20, 30, 40, 50, 60 }

Que relao existe entre os desvios padres dos dois conjuntos de nmeros ?

3- Dados os conjuntos de nmeros: A = { -2, -1, 0, 1, 2 }

B = { 220, 225, 230, 235, 240 }

Podemos afirmar, de acordo com as propriedades do desvio padro, que o desvio padro de B igual: a) ao desvio padro de A; b) ao desvio padro de A, multiplicado pela constante 5; c) ao desvio padro de A, multiplicado pela constante 5, e esse resultado somado a 230; d) ao desvio padro de A mais a constante 230.

MEDIDAS DE DISPERSO RELATIVA CVP: Coeficiente de Variao de Pearson

46

Na estatstica descritiva o desvio padro por si s tem grandes limitaes. Assim, um desvio padro de 2 unidades pode ser considerado pequeno para uma srie de valores cujo valor mdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito. Alm disso, o fato de o desvio padro ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais sries de valores, relativamente sua disperso ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ou variabilidade dos dados em termos relativos a seu valor mdio, medida essa denominada de CVP: Coeficiente de Variao de Pearson ( a razo entre o desvio pado e a mdia referentes a dados de uma mesma srie). A frmula do CVP = (S / ) x 100 ( o resultado neste caso expresso em percentual, entretanto pode ser expresso tambm atravs de um fator decimal, desprezando assim o valor 100 da frmula). Exemplo: Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivduos:
Discrimina o ESTATURAS PESOS MDIA 175 cm 68 kg DESVIO PADRO 5,0 cm 2,0 kg

Qual das medidas (Estatura ou Peso) possui maior homogeneidade ? Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultado menor ser o de maior homogeneidade ( menor disperso ou variabilidade). CVPestatura = ( 5 / 175 ) x 100 = 2,85 % CVPpeso = ( 2 / 68 ) x 100 = 2,94 %. Logo, nesse grupo de indivduos, as estaturas apresentam menor grau de disperso que os pesos.

CVT: Coeficiente de Variao de Thorndike igual ao quociente entre o desvio padro e a mediana. CVT = S / Md ou CVT = (S / Md) x 100 quando queremos o resultado em %.

47

CVQ: Coeficiente Quartlico de Variao Esse coeficiente definido pela seguinte expresso: CVQ = (Q3 - Q1) / (Q3 + Q1) ou [(Q3 - Q1) / (Q3 + Q1)] x 100 para resultado em %.

Desvio quartil Reduzido: Dqr = (Q3 - Q1) / 2Md ou [(Q3 - Q1) / 2Md ] x 100 para resultado em %.

EXERCCIOS 1- A renda mdia mensal na localidade A de R$ 750,00 e na localidade B de R$ 500,00. Os desvios padres so R$ 100,00 e R$ 80,00. Faa uma anlise comparativa quanto ao grau de homogeneidade da renda nestas duas localidades: 2- O risco de uma ao de uma empresa pode ser devidamente avaliado atravs da variabilidade dos retornos esperados. Portanto, a comparao das distribuies probabilsticas dos retornos, relativas a cada ao individual, possibilita a quem toma decises perceber os diferentes graus de risco. Analise, abaixo, os dados estatsticos relativos aos retornos de 5 aes e diga qual a menos arriscada :
Discriminao Valor esperado Desvio padro Coeficiente de variao Ao Ao Ao Ao Ao E A B C D 15 % 6% 0,40 12 % 0,55 5% 0,50 10 % 3% 0,30 4% 2,6 % 0,65 6,6 % 2,5 %

3- Um grupo de 85 moas tem estatura mdia 160,6 cm, com um desvio padro igual a 5,97 cm. Outro grupo de 125 moas tem uma estatura mdia de 161,9 cm, sendo o desvio padro igual a 6,01 cm. Qual o coeficiente de variao de cada um dos grupos ? Qual o grupo mais homogneo ? 4- Um grupo de 196 famlias tem renda mdia de 163,8 dlares, com um coeficiente de variao de 3,3%. Qual o desvio padro da renda desse grupo ? 5- Uma distribuio apresenta as seguintes estatsticas: S = 1,5 e CVP = 2,9 % . Determine a mdia da distribuio: 6- Numa pequena cidade, 65 famlias tem a renda mdia de 57,5 dlares e o desvio padro de 5,98 dlares. A variabilidade relativa das famlias foi de : a) 0,104 dlares b) 10,4 dlares c) 0,104 % d) 10,4 % e) 0,104 famlias

S-ar putea să vă placă și