Documente Academic
Documente Profesional
Documente Cultură
Educao
Carlos Augusto de Medeiros
Cuiab - MT
2013
ISBN 978-85-230-0990-8
I. Carlos Augusto de Medeiros Ttulo. II.III. Ttulo. IV. Srie.
CDU 519.2:37(81)
EQUIPE DE REVISO
Universidade Federal de Mato Grosso UFMT
Coordenao Institucional
Carlos Rinaldi
Coordenao de Produo de Material Didtico Impresso
Pedro Roberto Piloni
Designer Educacional
Marta Magnusson Solyszko
Diagramao
Tatiane Hirata
Reviso de Lngua Portuguesa
Livia de Sousa Lima Pulchrio Monteiro
Reviso Final
Marta Magnusson Solyszko
Reviso Cientfica
Joo Antnio Cabral de Monlevade
Projeto Grfico
Rede e-Tec Brasil/UFMT
11
12
Mensagem do Professor-autor
Me
de
Primeiramente, meus parabns por voc estar no Programa do Profuncionrio. Meus parabns, tambm,
por estar revendo sua prtica a partir das reflexes
que estamos propondo.
d e i ro s
Caro(a) estudante,
g
C a rl o s A u
us
Nessa linha, gostaria de lembrar que o presente mdulo de Estatstica Aplicada Educao foi pensado para ajud-lo/la a pensar sua
prtica, considerando essa valiosa ferramenta social. Por vezes, os
estudos iro exigir ateno redobrada, mas a compensao vir em
forma de melhor ordenamento da fora de trabalho na escola e em
tomada de deciso mais racional.
Anime-se, pois o retorno vir tambm em forma de acertos nas suas
decises. Nesse percurso, voc contar com a ajuda de vrios profissionais dedicados a acompanhar seu sucesso.
13
14
Apresentao da Disciplina
Sou professor! No h outra atividade profissional em minha vida. Iniciei minha carreira h, aproximadamente, 15 anos, como professor de Matemtica,
no Ensino Fundamental, na Rede Pblica de Ensino do Distrito Federal.
Nos ltimos cinco anos, tenho-me dedicado docncia no nvel superior,
atuando em cursos de formao para docentes, basicamente, com componentes como Metodologia Cientfica; Metodologia da Pesquisa; Mtodos e
Tcnicas de Pesquisa; Organizao da Educao Brasileira e Planejamento e
Polticas Educacionais.
Fiquei muito feliz com o convite para escrever este Mdulo de Estatstica
Aplicada Educao. bem verdade que, como professor de Matemtica,
sei por experincia prpria que trabalhar com clculos repele mais do que
atrai o leitor. Mas, tambm, da forma como tm sido trabalhadas as cincias
exatas nas escolas, no de se estranhar.
Foi nesse contexto que resolvi apresentar aos Funcionrios da Educao
uma ferramenta valiosa, fincada na Matemtica, que auxilia na interpretao
da realidade. Sem ela, nossas aes se pautam por bases outras que no a
cincia. E isso implica acertar, algumas vezes, mas errar, outras tantas vezes.
claro que no h receita segura para o acerto, isso todos sabemos. Mas,
existem ferramentas que, por fora do nosso percurso individual, vo sendo
oferecidas a alguns poucos que se tornam detentores dos saberes e isso no
posso aceitar. Dentre essas ferramentas, a Estatstica figura como (quem
sabe!) uma dessas que, se no observada, confina nossas aes ao campo
da sorte.
Mas, ainda assim, reconhecendo sua importncia, preciso lidar com as resistncias e limitaes de todos ns, com o traquejo algbrico, isto , com
nmeros, nmeros e nmeros.
Pois bem, estava ciente disso tudo quando escrevi este Mdulo. Tudo que
escrevi buscou responder seguinte pergunta: o que da Estatstica Descritiva
pode ser oferecido aos Trabalhadores da Educao de modo que os auxilie
em suas atividades diuturnas, construindo uma educao de qualidade?
15
16
Indicao de cones
Os cones so elementos grficos utilizados para ampliar as formas de
linguagem e facilitar a organizao e a leitura hipertextual.
Ateno: indica pontos de maior relevncia no texto.
Saiba mais: remete o tema para outras fontes: livro, revista, jornal,
artigos, noticirio, internet, msica etc.
Dicionrio: indica a definio de um termo, palavra ou expresso
utilizados no texto.
Em outras palavras: apresenta uma expresso de forma mais simples.
Pratique: so sugestes de: a) atividades para reforar a compreenso
do texto da Disciplina e envolver o estudante em sua prtica; b) atividades para compor as 300 horas de Prtica Profissional Supervisionada
(PPS), a critrio de planejamento conjunto entre estudante e tutor.
Reflita: momento de uma pausa na leitura para refletir/escrever/
conversar/observar sobre pontos importantes e/ou questionamentos.
Post it: anotao lateral que tem a inteno de apresentar uma informao adicional, lembrete ou reforo de algo j dito.
17
Sumrio
Unidade 1 - Introduo ao estudo da Estatstica
21
31
53
19
Unidade 1
Introduo ao estudo
da Estatstica
A populao mundial
est estimada hoje em
mais de sete bilhes,
cento e quatorze milhes,
seiscentos e sessenta e
quatro mil e setecentos
(7.114.664.700) pessoas,
em 30 de setembro de
2013. Para daqui a trinta
anos, est estimada uma
populao de mais de
oito bilhes e meio de
habitantes no planeta
(8.547.874.779).
Disponvel em < http://
www.census.gov>
Acesso em: 04 nov.2013.
22
23
Herdoto (gr. H)
o mais importante dos
historiadores gregos mais
antigos. Foi o primeiro
prosador a reunir diversas
narrativas histricas ou
quase histricas em um
relato coerente e vivo
e , por isso, considerado o
pai da Histria.
Pepino, no ano de 758, e Carlos Magno, em 762, realizaram estatsticas sobre as terras que eram propriedade
da Igreja. Essas foram as nicas estatsticas importantes
desde a queda do Imprio Romano.
Segunda Fase
Terceira Fase
Quarta Fase
24
25
1. Coleta de dados
Aps a definio do problema a ser estudado e o estabelecimento
do planejamento do trabalho (forma de coleta dos dados, cronograma das atividades, custos envolvidos, levantamento das informaes
disponveis, delineamento da amostra etc.), o passo seguinte o da
coleta de dados, que consiste na busca ou compilao dos dados das
variveis, componentes do fenmeno a ser estudado (CLEMENTE,
2003, p. 4).
26
27
Talvez, o uso constante da matemtica assuste alguns de ns. Eu compreendo que a Matemtica tem sido considerada uma cincia que
promove a excluso social, em virtude de sua ainda rgida forma de
trabalho nos bancos escolares. No entanto, ainda assim, no posso
concordar que, de maneira definitiva, ela sentencie a populao completa ignorncia, como se s a alguns fosse permitida sua apropriao.
Pensando nisso, esforcei-me para que esse Mdulo tornasse a Estatstica (e a Matemtica) acessveis a todos, explicando fundamentos,
apresentando frmulas e metodologias apropriadas para as resolues, tudo isso porque o que nos interessa so anlises consistentes
que levem melhoria de nossas aes.
Nosso estudo se inicia na Unidade II: Conceitos Matemticos com
uma breve retomada daqueles conceitos matemticos que diretamente condicionam o aprendizado da Estatstica. Assim, na seo 1, estudaremos um pouco as razes e as propores; na seo 2, estudaremos medidas e grandezas, com enfoque na chamada regra de trs
simples; depois, na seo 3, retomaremos o conceito de porcentagem;
na seo 4, veremos uma aplicao direta do conceito de porcentagem em coeficientes, taxas e ndices; com a seo 5, retomaremos o
importante sistema de coordenadas cartesianas e encerraremos, na
seo 6, com uma tcnica de arredondamento de nmeros.
Depois, na Unidade III: Variveis, Tabelas e Grficos, estudaremos
na seo 1, populao e amostra; na seo 2, examinaremos mais
detidamente os conceitos de Estatstica Indutiva e Estatstica Dedutiva;
na seo 3, estudaremos sobre variveis; nas sees 4 e 5, veremos
como apresentar de maneira prtica nossos dados por meio de tabelas
e grficos, respectivamente.
Na Unidade IV: Distribuio de Frequncia, estudaremos a organizao dos dados. Primeiro, na seo 1, identificaremos dados brutos e
dados organizados (rol); depois, na seo 2, veremos uma especificidade da organizao dos dados a chamada distribuio de frequncia;
a seguir, na seo 3, realizaremos um exerccio completo envolvendo
os contedos de toda a unidade de estudo; por fim, na seo 4, apenas
para conhecimento, apresentaremos alguns tipos de curvas possveis,
muito utilizadas em apresentaes de dados organizados com essa natureza especfica distribuio de frequncia.
28
Resumo
Chegamos ao fim da Primeira Unidade Introduo ao estudo da estatstica. Nela, vimos, brevemente, o histrico do termo estatstica,
a evoluo de seu significado at optarmos por uma definio. Para
ns, a estatstica coleta, organiza, descreve, analisa e interpreta dados com vistas a auxiliar diferentes processos de tomada de deciso.
Aproveitamos nessa unidade para apresentar a sequncia do nosso
estudo.
29
Unidade 2
Conceitos
matemticos
Fonte: autor
Uma diviso nada mais do que uma simplificao de fraes. Observe que 10 5 o mesmo que 10 Essa diviso fcil: 10 = 2
5
32
Voc reparou que para cada elemento do conjunto B existe um elemento do conjunto A? Reparou, ainda, que sobraram 5 elementos do
conjunto A? Pois bem, a comparao dos conjuntos A e B, da Figura
2, acima, indica que:
10
= 10
=
5 2
5
Dizemos que a comparao dos 10 elementos do conjunto A com os
5 elementos do conjunto B a razo de 10 para 5. De outra forma,
para os 5 elementos de B existem 5 elementos mais 5 elementos de A,
existem, portanto, 2 vezes elementos em A comparados a B.
Vejamos outro exemplo: suponha que voc possua R$ 2,00 e eu R$
8,00. Qual a razo do que voc possui para o que eu possuo?
Figura 3: Razo: Exerccio
Fonte: autor
Desse modo, dizemos que 2 est para 8 ou 1 est para 4. A Figura
4, abaixo, talvez ajude a compreender que 2/8 representa a mesma
proporo que 1/4. Quando isso ocorre, dizemos que as razes so
semelhantes.
33
Fonte: autor
Propores, por sua vez, so tambm comparaes. Mas so comparaes entre duas razes. Veja a figura 5, abaixo:
Figura 5: Propores: Conceito
Fonte: autor
34
Fonte: autor
Escala =
Distncia no desenho
Distncia real
35
Assim, supondo que voc v em linha reta do Edifcio 1 at a Escola e a distncia no desenho de 12 cm, qual a distncia real? Fcil:
Soluo:
1
12
=
300.000 x
=
x
12x 300.000
= 3.600.000
1
x = 3.600.000cm
x = 36km
Fonte: autor
36
Fonte:autor
Medir comparar grandezas de mesmo tipo. Professores de Matemtica adoram dizer: no se pode somar laranjas com limes!.
Eles tm razo: s podemos operar com grandezas iguais. Isso quer
dizer que no posso somar 2 horas com 2 km, pois, as grandezas so
diferentes (no primeiro caso, a grandeza tempo; no segundo, comprimento).
Quando eu tomo a medida do comprimento de uma mesa, por exemplo, eu digo: a mesa possui 1 metro de comprimento. Isso quer dizer
que eu comparei a unidade metro com o comprimento da mesa. Observe a figura 9, abaixo:
Figura 9: Medida de comprimento: segmento de reta
Fonte: autor
37
Litros de gasolina
Preo (R$)
2,59
55
Note que conhecemos trs nmeros e queremos conhecer um nmero: x. Esse quarto nmero conhecido como quarta proporcional e,
para encontr-lo, utilizamos o procedimento conhecido como regra
de trs.
Solucionando nosso problema, temos que:
38
Tempo
(em dias)
10
Observe que utilizamos duas setas: uma para o nmero de pedreiros e outra para o tempo. A seta para cima indica que o nmero
de pedreiros aumentou (de 3 para 6); a seta para baixo indica que o
tempo diminuiu (de 10 para x). Veja que, mesmo eu no sabendo,
ainda, quanto tempo ser, eu posso garantir que o tempo ser menor
do que 10 dias, se com 3 pedreiros eu preciso de 10 dias, com mais
pedreiros eu precisarei de menos de 10 dias, no mesmo? Quando
as setas esto orientadas para sentidos diferentes, estamos diante de
grandezas inversamente proporcionais. Na prtica, isso mudar nossa
proporo:
39
Fonte: autor
Seo 3: Porcentagem
Porcentagem uma razo com o denominador sempre igual
a100.
Desse modo, 25/100, por exemplo, uma porcentagem e pode ser
expressa como 25% (vinte e cinco por cento).
Na prtica, calculamos as porcentagens em diversas situaes. Suponha que meu salrio seja de R$ 400,00 e eu receberei um aumento de
12%. Quanto passarei a receber?
40
Soluo:
12% de 400 =
12x400
= 48
100
7% de
=
32
7x32
= 2,24
100
Total
Homens
Mulheres
Total
190.732.694
93.390.532
97.342.162
Para responder a essa pergunta, tenho que ter clareza de que a populao total brasileira corresponde a 100%. Assim, 100% = 190.732.694
O que quero descobrir qual a porcentagem desse total que corresponde a 93.390.532. Veja:
Porcentagem
Populao
100
190.732.694
93.390.532
41
100 190732694
=
x
93390532
190732694 x = 100x93390532
x=
100x93390532
190732694
x = 49,0
Assim, no Brasil, a populao de homens corresponde a 49,0% da
populao total.
Os coeficientes so
razes entre o nmero
de ocorrncias e o
nmero total (nmero
de ocorrncias e
nmero de no
ocorrncias). (CRESPO,
1995, p. 34).
As taxas so
os coeficientes
multiplicados por uma
potncia de 10 (10,
100, 1.000 etc.) para
tornar o resultado mais
inteligvel. (CRESPO,
1995, p. 35).
42
Os ndices so razes
entre duas grandezas
tais que uma no inclua
outra. (CRESPO, 1995,
p. 34).
Unidade da
Federao
Brasil
Total
Federal
Estadual
Municipal
Privada
26.368.619
23.172
9.752.502
13.434.669
3.158.276
Essa Tabela apresenta o total de alunos aprovados no ensino fundamental brasileiro, por dependncia administrativa. Vamos calcular coeficiente e taxa utilizando essa Tabela.
43
Primeiro: qual o coeficiente de aprovao no ensino fundamental dos alunos que frequentam escolas da rede municipal?
Assim,
coeficiente de aprovao
=
da rede municipal
13.434.669
= 0,5
total de aprovados no Brasil
Unidade
da Federao
Brasil
Total
Federal
Estadual
Municipal
Privada
2.589.688
14.980
940.039
1.110.132
524.537
44
1.110.132
= 0,08
13.434.669
Unidade da
Federao
Total
Federal
Estadual
Municipal
Privada
Brasil
4.085.448
499
499.117
3.553.931
31.901
Fonte: autor
45
Dizem que ele estava descansando na cama, quando viu uma mosca
pousada na parede. A mosca voou, mas Descartes ficou pensando.
Como poderia explicar a uma outra pessoa qual era a posio exata
da mosca na parede? (JAKUBOVIC; LELLIS, 1995, p. 210).
Esse teria sido o incio do sistema de coordenadas cartesianas.
Descartes imaginou duas retas: uma horizontal e outra vertical. Se ele
marcasse nmeros nessas retas, ficaria fcil localizar a mosca. Veja a
figura 13, abaixo:
Figura 13: Sistema de Coordenadas Cartesianas: Eixos
Fonte: autor
46
Fonte: autor
De maneira mais completa, podemos localizar qualquer ponto no plano: o ponto A se encontra em (6; 6), isto , x 6 e y vale 6; o ponto
B (4; 2); e assim por diante. Viu? Na prtica, usamos o sistema de coordenadas cartesianas em diversas situaes diferentes quando queremos localizar um ponto em um plano. Veja a Figura 15, abaixo:
Figura 15: Sistema de Coordenadas Cartesianas: Exerccio
Fonte: autor
47
Seo 6: Arredondamento
Com essa Seo 6 encerramos nossa Unidade II.
Entendemos por arredondamento de dados a tcnica utilizada
para suprimir unidades inferiores, isto , arredondar um nmero significa reduzir a quantidade de algarismos aps a vrgula.
Na Matemtica, muitas
vezes, deparamo-nos com
situaes nas quais o
clculo nunca d certo se
no transformarmos esse
nmero em frao.
Fonte: autor
48
49
4,24 =
6,829 =
24,65 =
328,35 =
5,550 =
0,351 =
2,97 =
89,99 =
2. Arredonde cada um dos valores abaixo para o centsimo mais prximo (CRESPO, 1995, p. 174):
46,727 =
253,65 =
28,255 =
123,842 =
299,951 =
37,485 =
Resumo
Chegamos ao fim da segunda unidade Conceitos Matemticos. Todos sabemos que a Matemtica tem sido responsvel pelo trauma
de uma massa incontvel de estudantes. Algum duvida? Mas, no
estamos interessados em aprender matemtica simplesmente. Antes
nos detivemos nos conceitos essenciais para o estudo da Estatstica.
Assim, recapitulamos conceitos como razo e proporo; grandezas
e medidas; e porcentagem com a finalidade de utilizarmos todos eles
50
51
Unidade 3
Variveis, tabelas e
grficos
Uma populao pode ser finita (isto , possuir fim) ou infinita (no
possuir fim). Por exemplo, a populao dos alunos de sua escola
finita e a populao constituda de todos os resultados (cara ou coroa)
em sucessivos lances de uma moeda infinita.
Se uma amostra representativa de uma populao, podemos obter
concluses importantes sobre a populao. Mas, tambm, podemos
analisar e descrever um certo grupo sem tirar concluses ou inferncias sobre um grupo maior e, nesse caso, a parte da Estatstica que
se preocupa com isso a chamada estatstica descritiva ou estatstica
dedutiva .
Vamos realizar um exerccio. Observe a Tabela 5, abaixo.
Tabela 5: Populao Escolar: Sexo
Escolas
N de estudantes
Masculino
Feminino
80
95
102
120
110
92
134
228
150
130
300
290
Fonte:Adaptado de CRESPO(1995,p.24).
54
Muitas vezes, a
populao se divide em
subpopulaes chamadas
estratos. A amostragem
proporcional estratificada
considera os estratos para
a amostra, de maneira
anloga Tabela 6, ao
lado.
Populao
10%
Amostra
M=80
10x80
=8
100
A
F=95
10x95
100
9,5
M=102
10x102
= 10,2
100
10
F=120
10x120
= 12
100
12
M=110
10x110
= 11
100
11
F=92
10x92
= 9,2
100
D
E
F
Procedendo assim, temos que, na escola A, devemos considerar 8 alunos e 9 alunas; na escola B, 10 alunos e 12 alunas; na escola C, 11
alunos e 9 alunas.
Complete a Tabela 6, acima, e registre o resultado em seu memorial.
55
da estatstica descritiva. Observe que cumpridas essas etapas, ainda no possvel tirar concluses muito seguras, mas possvel, por
exemplo, conhecer a realidade da escola, bem como conhecer seus
problemas.
O passo seguinte consiste na estatstica indutiva ou inferencial.
Basicamente, nessa etapa, ocorre a anlise e a interpretao do fenmeno em estudo, com o intuito de tirar concluses e fazer previses
(CRESPO, 1995, p. 15). Agora, possvel formular solues consistentes sobre os problemas levantados de uma dada realidade.
A Estatstica, portanto, comea com a descrio para, s depois, chegar a concluses. Veja:
Figura 18: Estatstica dedutiva e estatstica indutiva: fluxograma
Fonte: autor
56
Seo 3: Variveis
Se consideramos o fenmeno sexo, haveria, pois, dois resultados
possveis: masculino ou feminino. O fenmeno total de filhos tambm possui um nmero determinado: 0, 1, 2, 3... Mas o fenmeno
estatura apresenta uma situao diferente: 1m 64cm, 1m 58cm,
1m 75cm...
Chamamos de varivel o conjunto de resultados possveis de um fenmeno (CRESPO, 1995, p. 17). A varivel pode ser qualitativa (masculino-feminino) ou quantitativa (expressa por nmeros: salrios, idade etc.).
A varivel quantitativa pode ser contnua ou discreta. Por exemplo,
o nmero de crianas de uma famlia pode ser 0, 1, 2, 3... Mas, jamais,
pode ser 2,5 ou 3,842. Chamamos essa varivel de discreta. J a altura
de um indivduo pode ser 1,65 m,1,662 m ou 1,6722 m, conforme a
preciso da medida, e uma varivel contnua (SPIEGEL, 1975, p. 2).
Assim:
Uma varivel quantitativa que pode assumir, teoricamente,
qualquer valor entre dois limites recebe o nome de varivel
contnua; uma varivel que s pode assumir valores pertencentes a um conjunto enumervel recebe o nome de varivel discreta (SPIEGEL, 1975; CRESPO, 1995).
57
Veja:
Figura 19: Variveis: definies
Fonte: autor
Explicando melhor, a figura acima mostra que varivel corresponde aos resultados possveis de um conjunto. Ser varivel qualitativa, quando seus valores forem expressos por atributos (qualidades),
como, por exemplo, sexo, cor da pele etc. e ser varivel quantitativa quando seus valores forem expressos por nmeros. Nesse ltimo caso, varivel quantitativa, poder ser discreta, quando assumir,
apenas, um dos valores do conjunto como, por exemplo, o nmero
de alunos de uma escola. Ser uma varivel quantitativa contnua,
quando puder assumir qualquer valor entre dois limites, por exemplo,
peso, estatura etc. (CRESPO, 1995).
De modo geral, as medies do origem a variveis quantitativas contnuas e as contagens ou numeraes, a variveis discretas (CRESPO, 1995, p. 18). Alm disso, comum designar as letras x, y e z para
representar as variveis. Por exemplo:
Sejam 2, 3, 5 e 8 todos os resultados possveis de um dado
fenmeno. Fazendo uso da letra x para indicar a varivel relativa ao fenmeno considerado, temos: x {2, 3, 5, 8}(CRESPO,
1995, p. 18). Isso significa que x pertence ao conjunto.
Vamos realizar um exerccio? Complete o Quadro 2, na pgina a seguir,
classificando as variveis em qualitativas ou quantitativas (contnuas ou
discretas).
58
Varivel
Nmero de filhos
Varivel quantitativa discreta.
As jogadas de um dado.
Coluna 2
(1) varivel qualitativa
(2) varivel quantitativa discreta
(3) varivel quantitativa contnua
59
Seo 4: Tabelas
As tabelas apresentam
informaes tratadas
estatisticamente, conforme
IBGE (1993) (BRASIL, 2002).
60
Federal
Estadual
Municipal
Privada
13.629.874
18.183
7.386.348
4.664.840
1.560.503
Fonte: MEC/Inep
Matrculas na Pr-Escola
2002
2003
2004
Acre
21.737
21.682
23.148
Alagoas
57.671
57.981
73.741
Distrito Federal
71.985
76.926
81.786
So Paulo
1.276.434
1.325.507
1.391.238
Conjugando duas ou
mais sries em uma nica
tabela, obtemos uma
tabela de dupla entrada.
Em uma tabela desse tipo
ficam criadas duas ordens
de classificao: uma
horizontal (linha) e uma
vertical (coluna) (CRESPO,
1995, p. 28).
61
Essa uma tpica tabela conjugada de dupla entrada. Observe que ela
possui uma srie histrica (2002, 2003 e 2004) e uma srie geogrfica (Acre, Alagoas, Distrito Federal e So Paulo). Podemos dizer que a
horizontal (linha) e a vertical (coluna) formam duas ordens de classificao. Por exemplo, no Distrito Federal (linha horizontal srie geogrfica), o nmero total de alunos matriculados na pr-escola variou
no perodo de 2002 a 2004 (colunas verticais srie histrica). Sem
dvida, estamos diante de uma tabela conjugada de dupla entrada.
Visite o stio do Inep e procure a Tabela de Matrcula no Ensino
Fundamental de 5 8 srie (ou outra Tabela qualquer) do seu
municpio e identifique os componentes dessa tabela. Monte
duas tabelas: uma simples e uma de dupla entrada.
Seo 5: Grficos
Conhea o stio do Inep : http://
www.inep.gov.br
Unidade da
Federao
Brasil
Total
Federal
Estadual
Municipal
Privada
8.824.397
56.464
7.528.326
149.917
1.089.690
62
63
Diagramas
Os diagramas, normalmente, possuem duas dimenses, onde fazemos uso do sistema de coordenadas cartesianas (Ver Unidade 2: Conceitos matemticos, Seo 5: Sistema de coordenadas cartesianas).
Podem ser dos seguintes tipos: grfico em linha ou em curva; grfico em colunas ou em barras; grfico em colunas ou em barras
mltiplas; grfico em setores.
Vejamos um exemplo de grfico em linha. Consideremos a seguinte
srie histrica apresentada na tabela abaixo:
1999
2000
2001
2002
2003
2004
Creche
831.978
916.864
1.093.347
1.152.511
1.237.558
1.348.237
Pr-Escola
4.235.278
4.421.332
4.818.803
4.977.847
5.155.676
5.555.525
Fonte: MEC/Inep
Vamos construir o grfico em linha, por exemplo, do nmero de alunos matriculados na pr-escola, no perodo considerado. Para isso,
precisaremos montar o sistema de coordenadas cartesianas. muito
simples, pois, como j vimos, nesse sistema, para cada ano do eixo x,
encontraremos uma quantidade de matrculas correspondente y, formando, assim, o par ordenado (x; y). Em 1999, temos 4.235.278 matrculas, formando o par ordenado (1999; 4.235.278); em 2000, o par
ordenado ser (2000; 4.421.332); e assim sucessivamente. Pronto, a
tarefa est realizada! Veja o resultado, na pgina ao lado.
64
Fonte: MEC/Inep
Fonte: MEC/Inep
65
Vamos juntar as duas informaes, a evoluo das matrculas na creche e na pr-escola, em um s grfico? Para isso, iremos considerar,
novamente, a srie estatstica representada pela Tabela 11. Observe o
resultado:
Grfico 4: Evoluo das matrculas na educao infantil: creche e pr-escola: Brasil:
1999-2004
Fonte: MEC/Inep
66
Brasil
Federal
Estadual
Municipal
Privada
447.847
324
81.482
363.994
2.047
447.847
100
324
447.847
=
x 324 x100
=
x
32400
= 0,072%
447.847
67
447.847
100
81.482
447.847 100
=
81.482
x
3 etapa: resolvendo a equao
447.847
x x 81.482x100
=
=
x
8.148.200
= 18,19%
447.847
68
Cartogramas
Cartogramas so representaes sobre uma carta geogrfica.
Eles so muito teis quando queremos relacionar dados estatsticos com reas geogrficas ou polticas. Essas representaes so muito teis para expressarem populao e densidade
(CRESPO, 1995, p. 46).
Vejamos um exemplo:
Grfico 6: O despovoamento da Amaznia
69
Pictogramas
Os pictogramas so os processos grficos de maior aceitao
pblica por sua forma atraente e sugestiva (CRESPO, 1995, p.
48).
Em sua representao, encontram-se figuras, desenhos etc. Veja a
srie estatstica abaixo:
Tabela 13: Pictograma: Exerccio
Vtimas Fatais
Local
Brasil
Idade (anos)
0a9
10 a 12
13 a 17
18 a 29
30 a 59
60 e mais
Ignorado
808
307
891
5006
6950
1666
3249
Fonte: autor
70
Estamos conseguindo avanar. No desanime, pois agora estamos verdadeiramente entrando no mundo da Estatstica. Vale lembrar: todo
esse esforo dever converter-se em ferramenta para tomada de deciso no seu dia a dia. Vamos em frente. Fique atento aos procedimentos e exercite-se bastante. Bom trabalho!
71
Unidade 4
Distribuio de
frequncia
5,0
3,0
3,5
4,0
10,0
5,6
3,0
2,5
1,5
9,5
7,5
6,3
6,6
7,8
4,0
2,5
5,0
7,0
8,0
10,0
9,8
9,7
3,5
3,8
5,0
3,7
4,9
5,4
6,8
6,3
7,8
8,5
6,6
9,9
10,0
2,6
2,9
5,2
8,8
Observe que, nesta tabela, as notas no esto numericamente organizadas. Este tipo de tabela denomina-se tabela primitiva (CRESPO,
1995, p. 54). Partindo desta tabela, difcil identificar o comportamento das notas, isto : onde se concentram? Qual a maior? Qual a
menor? Quantos alunos esto abaixo ou acima de uma determinada
nota?
Esses dados esto, de fato, desorganizados e, por isso, vamos organiz-los. A maneira mais simples realizando uma ordenao (crescente ou decrescente). Aps essa ordenao dos dados, a tabela recebe o nome de rol. Veja como fica:
Tabela 15: Exemplo de rol
Notas de 40 alunos de uma disciplina
74
1,5
2,9
3,5
4,0
5,0
6,3
6,8
7,8
8,8
9,9
2,5
3,0
3,7
4,9
5,2
6,3
7,0
8,0
9,5
10,0
2,5
3,0
3,8
5,0
5,4
6,6
7,5
8,0
9,7
10,0
2,6
3,5
4,0
5,0
5,6
6,6
7,8
8,5
9,8
10,0
De fato, com os dados assim organizados, podemos saber, com facilidade, qual a menor nota (1,5) e qual a maior (10,0). E, tambm,
podemos encontrar a amplitude de variao, isto , a diferena entre
o maior valor e o menor valor: 10,0 1,5 = 8,5. Alm dessas informaes, com um pequeno esforo, podemos ainda identificar que as
notas se concentram em dois valores (5,0 e 10,0) e que 6,0 o valor
que divide as notas. Convm destacar que os dados so teis, apenas, se conseguirmos transform-los em informao. Mais frente,
discutiremos essas medidas.
Enfim,
Dados brutos so aqueles que no foram numericamente organizados e rol um arranjo de dados numricos brutos em
ordem: crescente ou decrescente. Em um rol, a diferena entre
o maior e o menor nmero chama-se amplitude total.(SPIEGEL,
1975, p. 43).
Frequncia
Notas
Frequncia
Notas
Frequncia
1,5
5,0
8,0
2,5
5,2
8,5
2,6
5,4
8,8
2,9
5,6
9,5
3,0
6,3
9,7
3,5
6,6
9,8
3,7
6,8
9,9
3,8
7,0
10,0
4,0
7,5
4,9
7,8
Total: 40
75
A tabela de distribuio
de frequncia uma
tabela como outra
qualquer, mas que
apresenta o nmero de
repetio dos valores
ao invs de repeti-los
integralmente. Por
exemplo, ao invs de
expor 2, 2, 2 ,2 e 3, em
uma tabela de frequncia
colocamos 2 (4 vezes)
e 3.
Notas
0,0-4,9
14
5,0-6,9
11
7,0-8,9
9,0-10,0
7
Total: 40
76
77
Notas
0,0 2,0
2,1 4,1
12
4,2 6,2
6,3 8,3
11
8,4 10,0
9
Total: 40
Histograma
Vejamos um modelo de histograma.
78
Polgono de frequncia
Polgono de frequncia um grfico de linha (Veja Unidade 3: Variveis, tabelas e grficos, Seo 5: Grficos, diagramas). Na verdade,
essa representao grfica nada mais do que a unio dos pontos de
frequncia das variveis. Observe abaixo:
Figura 22: Polgono de frequncia: esboo
Fonte: autor
79
O polgono de frequncia um grfico de linha, sendo as frequncias marcadas sobre perpendiculares ao eixo horizontal,
levantadas pelos pontos mdios dos intervalos de classe (CRESPO, 1995, p. 70).
80
Mesmo depois de ter organizado os dados, Ana Maria sentiu necessidade de diminuir os espaos. Essa foi a tarefa da prxima etapa.
81
3 Etapa: construo da tabela de frequncia. Ana Maria percebeu que trabalhar com o rol era melhor que trabalhar com a tabela primitiva. Mas, mesmo assim, sentiu necessidade de diminuir
ainda mais a quantidade de dados. Para isso, ela construiu uma
tabela de frequncia, j que percebeu que diversas notas se repetiam. Veja o resultado, abaixo:
Tabela 21: Exerccio: Tabela de Frequncia
Notas dos alunos do professor Paulo
Notas
Frequncia
14
16
15
13
13
15
13
24
26
19
10
0
Total 168
82
De posse da amplitude total, Ana Maria decidiu que seu estudo teria
5 classes. Portanto, o intervalo de classe deveria ser:
Intervalo de classes =
amplitude total 9
= =1,8=2
Node classes
5
Naquele momento, Ana Maria estava pronta para elaborar sua nova
tabela de frequncia com intervalo de classes. O resultado foi:
Convm reforar que se um intervalo de 0 a 2 e outro intervalo de 2 a 4, como fazer para no contar o 2 duas vezes?
A sada considerar aquilo que na matemtica se chama pontos abertos e fechados. Assim, no caso de 0 a 2, consideraremos
fechado esquerda e aberto direita; vale dizer: o zero entra
e o 2 no.
Da mesma forma, no intervalo de 2 a 4, o 2 entra e o 4 no; e
assim sucessivamente.
Tabela 22: Exerccio: Tabela de Frequncia com intervalos de classe
Notas dos alunos do professor Paulo
Notas
Frequncia
0a2
30
2a4
28
4a6
28
6a8
37
8 a 10
45
Total 168
Organizados os dados em uma tabela de frequncia com intervalos de classe, Ana Maria pde identificar, ao contrrio do que as
pessoas andavam conversando, que as notas se concentravam no intervalo de 8 a 10. Alm disso, a segunda maior concentrao das
notas de seus alunos pertencia ao intervalo de 6 a 8. Os resultados do
seu estudo, at aqui, demonstraram uma situao diferente do que
poderia parecer primeira vista.
83
Fonte: autor
84
Os dados coletados
podem, usualmente,
ser considerados como
pertencentes a uma
amostra extrada de
grande populao.
Como se dispe de
muitas observaes
da populao,
teoricamente possvel
(para dados contnuos)
a escolha de intervalos
de classe muito
pequenos e ter, at,
nmeros convenientes
de observaes que
se situam dentro de
cada classe. Assim,
seria possvel contar
com um polgono de
frequncia [...] para
uma grande populao
que tenha tantos
pequenos segmentos
de linha quebrada que
se aproximem bastante
de uma curva que ser
denominada curva
de frequncia [...]
(SPIEGEL, 1975, p. 49).
Fonte: autor
85
A curva simtrica
caracteriza-se por
apresentar o valor mximo
no ponto central e os
pontos equidistantes [
mesma distncia] desse
ponto terem a mesma
frequncia. (CRESPO,
1995, p. 74).
86
1. Feita a coleta de dados das estaturas de150 alunos, os resultados foram disponibilizados como abaixo (em centmetros). A
partir de 145 cm, com intervalos de classe de 5 cm, exponha o resultado em uma Tabela.
159
150
170
155
162
148
168
156
150
153
165
162
155
165
153
157
159
152
155
164
146
155
163
147
152
150
149
157
167
154
157
156
151
159
163
146
157
162
157
158
152
152
146
160
171
156
147
156
154
159
166
156
152
147
166
148
152
153
177
148
162
150
150
162
159
154
148
150
160
156
148
160
153
159
161
156
156
155
178
151
161
154
156
160
146
172
158
153
150
151
147
148
157
146
163
159
155
159
167
151
163
158
167
157
160
154
158
163
158
161
148
158
153
153
161
161
147
158
157
154
174
159
168
147
151
168
169
158
151
154
147
155
155
151
151
157
155
152
164
164
158
164
164
149
163
152
169
149
164
153
--
--
87
Unidade 5
Medidas de resumo
Nessa Unidade 5 Medidas de resumo finalizaremos nossos estudos. Medidas de resumo so resultados de processos com objetivos de
resumir informaes. Ao final da unidade, voc ser capaz de identificar as principais medidas, bem como realizar seus clculos para uma
anlise responsvel da situao desejada. Vamos a elas!
Seo 1: Introduo
Numa comparao
grosseira, como se
a mensurao fosse o
processo de fotografar
e medida, a fotografia
resultante (COSTA,
2004, p. 36).
preciso iniciar nossa ltima unidade de estudo, fazendo a importante distino entre mensurao e medida. Mensurao processo do
qual resulta uma medida; medida valor, nmero resultante do processo de mensurao (COSTA, 2004, p. 36). Medir algo , portanto,
atribuir um nmero.
H quatro nveis de medidas:
Quadro 3: Nveis de medidas
Os nveis de medidas
Nveis
Variveis
1 Nvel
2 Nvel
3 Nvel
Intervalar. Aqui, faz sentido quantificar. Na escala intervalar, adio e subtrao so permitidas (mas multiplicao e diviso no). Escalas termomtricas so um
bom exemplo.
4 Nvel
Racional ou de razo. Nesse nvel, todas as operaes matemticas so permitidas. Medidas tomadas
com rgua, fita mtrica, balana, litro so bons exemplos,
pois o medido corresponde ao real e no a uma correspondncia.
Pelos nveis de medidas acima, fcil notar que um professor, ao atribuir uma nota bimestral a um aluno, est, na verdade, lidando com
uma varivel ordinal. Assim, ele est, apenas, indicando em uma escala, por exemplo, de 0 a 10, onde o aluno se encontra. Essa nota
bimestral no , portanto, uma medida racional, isto , no possui
a qualidade de uma medida obtida com uma fita mtrica em que o
resultado expressa a realidade.
90
91
No nosso estudo, nesta Unidade V, enfocaremos algumas dessas medidas. Comearemos com as medidas de tendncia central; nessa parte, seo 2, estudaremos a mdia e a mdia aritmtica ponderada, a
mediana, a moda e, por fim, a relao entre mdia, mediana e moda.
Depois, na seo 3, estudaremos as medidas de disperso, especialmente, os conceitos de disperso e variao, desvio padro e coeficiente de variao. Por ltimo, na seo 4, estudaremos as medidas
de posio conhecidas como quartis, decis e percentis.
Bom estudo a todos!
92
Mdia Aritmtica
=
x = Mdia aritmtica
x = Valores da Varivel
xi
i
x=
,onde
n
xi =Soma Total dos Valores da Varivel
n=Nmero Total de Valores
93
2002
2003
2004
2005
35
38
32
40
37
+ 38 + 32 + 40 + 37
xi 35
=
x=
= 36,4
n
5
Ento, x =36,4
Voc notou que no existe o nmero 36,4 no conjunto de
dados? Quando isso acontece, dizemos que a mdia no tem
existncia concreta (CRESPO, 2004, p. 80). O que esse valor significa? Significa que, considerando todas as grandezas,
dentro do conjunto de dados ordenados, esse valor tende a
uma posio central, por isso, a mdia uma medida de tendncia central.
Vejamos, agora, como se calcula a mdia aritmtica para dados
agrupados. Os dados agrupados podem-se apresentar sem intervalos de classe ou com intervalos de classes (Veja unidade 4:
Distribuio de frequncia, particularmente, a Seo 2: Distribuio de frequncia e aprofundamento: regras para a elaborao de uma distribuio de frequncia).
Vamos calcular a mdia aritmtica para dados agrupados sem
intervalos de classe. Considere a distribuio de frequncia abaixo, relativa a 34 famlias de quatro filhos, tomando como varivel o nmero de filhos do sexo masculino (CRESPO, 1995, p. 82).
Tabela 24: Distribuio de Freqncia: Exerccio
Nmero de filhos do sexo masculino
N de meninos
Freqncia (fi)
10
12
4
=34
94
Quando na tabela
aparece, por exemplo,
que para 1 menino
a frequncia 6, o
mesmo que dizer que
existem 1+1+1+1+1+1
meninos ou 6 vezes
1. Viu? Ponderar
nada mais do que
considerar as repeties.
x=Mdia Aritmtica
xifi ,onde xi =Valores da Varivel
x=
i
fi
f=Frequncia
xif=Ponderao
i
Frequncia ( fi )
xifi
10
20
12
36
16
= 34
= 78
95
x f = 78 e f = 34
i i
x=
x f x=
f
i i
i
78
= 2,29 x = 2,3
34
x=
x f , em que x
f
i i
Dessa forma, o raciocnio o mesmo para a mdia aritmtica ponderada sem intervalos de classe.
Vamos realizar um exerccio. Voc se lembra do professor Paulo? Bem,
vamos retornar s notas dos alunos dele.
Tabela 26: Distribuio de frequncia: exerccio: ponderao: ponto mdio
Notas dos alunos do professor Paulo
Notas
fi
xi
xifi
0a2
30
30
2a4
28
84
4a6
28
140
6a8
37
259
8 a 10
45
405
= 168
= 918
A Tabela 26, acima, recuperou a distribuio de frequncia do professor Paulo, acrescentando, apenas, o ponto mdio dos intervalos de
classe (xi ) e a ponderao, isto , o produto dos pontos mdios pela
frequncia (xifi ). Bem, sabemos, portanto, que:
96
x f = 918 e f = 168
i i
Logo, utilizando a frmula 2 para o clculo da mdia aritmtica ponderada, temos que:
x=
x f x=
f
i i
i
918
= 5,46 x= 5,5
168
O que isso indica? Indica que temos que mudar nossa opinio sobre o trabalho do professor Paulo. E por qu? Porque
a anlise que realizamos, naquele momento, nos levou a
afirmar que o resultado do trabalho do professor Paulo
satisfatrio, pois h mais alunos com notas acima do intervalo
de 4 a 6 do que abaixo dele. Voc se lembra?
Vtimas de acidentes
Distrito Federal
11.256
Braslia
6.747
Gois
22.383
Goinia
9.567
Mato Grosso
Cuiab
7.346
Campo Grande
3.071
97
Mediana e mdia
Em um conjunto ordenado, o ponto central que divide esse conjunto
em dois subconjuntos com o mesmo nmero de elementos chama-se
mediana. Aqui, diferentemente da mdia (que nos fornece a concentrao dos dados), a mediana nos fornece a posio que divide,
exatamente, um conjunto em funo da quantidade de seus elementos. Por exemplo:
Vamos considerar o conjunto dos nmeros
3, 4, 4, 5, 6, 8, 8, 8, 10
Quem est no meio do conjunto?
6
Ento, os elementos antes de 6 so:
3, 4, 4 e 5
E depois de 6:
8, 8, 8 e 10
Observe que temos a mesma quantidade de elementos antes e depois
de 6. A mediana indica isso: o nmero que divide o conjunto ao
meio, isto , a quantidade antes e depois dele a mesma. Assim,
A mediana [...] definida como o nmero que se encontra no
centro de uma srie de nmeros, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem de grandeza,
o valor situado de tal forma no conjunto que o separa em dois
subconjuntos de mesmo nmero de elementos. (CRESPO, 1995,
p. 93).
Para dados no agrupados, como no exemplo acima, calcula-se a
mediana de duas maneiras:
98
=
x
=
i
1+ 2 + 3 + 4 + 4 + 5 + 6 + 8 + 68 + 145
= 24,6
10
Mediana
Para conjunto de dados par, realizar a mdia dos dois pontos centrais:
md
=
4 +5
= 4,5
2
99
fi
2
Observe que, para
frequncia, utilizamos
o smbolo fi . Quando
queremos nos referir
frequncia acumulada,
utilizamos Fi.
100
fi
Fi
10
18
12
30
34
= 34
Fonte: CRESPO (1995, p. 95).
f =
i
34
fi 34
= 17
2
=
2
Pela Frmula 3, a mediana 17. Na Tabela existe frequncia acumulada 17? No. Caso existisse, aquela seria a linha em se encontraria a
mediana. Mas, no caso de no existir, como proceder? Simples, veja:
As frequncias acumuladas so 2, 8, 18, 30 e 34. Qual a imediatamente superior a 17? Isso mesmo, 18. Ento, vamos destacar a linha:
Figura 25: Linha mediana
Fonte: autor
101
Fonte: autor
102
Moda
Em um conjunto de nmeros, chamamos de moda o valor que
ocorre com maior frequncia, isto , o valor mais comum.
assim que podemos dizer que o salrio modal dos empregados de uma indstria o salrio mais comum, isto , o salrio
recebido pelo maior nmero de empregados dessa indstria.
(CRESPO, 1995, p. 89). Spiegel (1975, p. 74) nos d exemplos:
a) O conjunto 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 tem moda 9;
b) O conjunto 3, 5, 8, 10, 12, 15, 16 no tem moda;
c) O conjunto 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 tem duas modas, 4 e 7.
Nesse caso chamado bimodal.
Para dados agrupados sem intervalos de classe, possvel determinar imediatamente a moda, como nos exemplos acima. Mas, por
exemplo, a Tabela 28, p. 91, indica que a moda 3. Por qu? Porque
o valor que mais se repete aquele que possui maior frequncia simples, no mesmo?
103
ainda possvel encontrar a moda para dados agrupados com intervalos de classe, mas deixaremos esse estudo para uma outra
oportunidade.
Fonte: autor
104
Fonte: autor
Fonte: autor
105
106
x=Mdia Aritmtica
x
x=
Ento,
Para X= x=
70 + 70 + 70 + 70 + 70 350
= = 70
5
5
x=
68 + 69 + 70 + 71+ 72 350
= = 70
5
5
Para Y=
Para Z= x=
Disperso e variao
Disperso (ou variabilidade) de um conjunto refere-se maior
ou menor diversificao dos valores de uma varivel em torno
de um valor de tendncia central tomado como ponto de comparao (Veja Seo 2: Medidas de tendncia central).
No nosso exerccio acima, os conjuntos X, Y e Z apresentam como
ponto de tendncia central para fins de comparao a mdia. Essa
mdia a mesma para os trs conjuntos: 70. Assim, o conjunto X
107
apresenta disperso nula, pois no h variao dos valores do conjunto em relao a essa mdia; o conjunto Y apresenta disperso menor
que o conjunto Z; isso porque os valores de Y esto mais prximos
que os do conjunto Z.
Em resumo, a estatstica recorre s medidas de disperso (ou de
variabilidade) quando deseja qualificar os valores de uma varivel,
ressaltando a maior ou menor disperso entre esses valores e a sua
medida de posio. Dessas medidas de disperso,estudaremos apenas o desvio padro e o coeficiente de variao.
A lista de medidas de disperso longa. Para Spiegel (1975), essas medidas so: a amplitude total; o desvio mdio; a amplitude semi-interquartlica ou o desvio quartlico; o desvio-padro;
a varincia; o coeficiente de variao.
Desvio-padro
O desvio-padro a medida da variao, da disperso, de um
conjunto.
Assim, quanto maior for o desvio-padro, maior ser a heterogeneidade entre os valores que esto sendo analisados. Isso significa, portanto, que quanto maior for o desvio-padro, maior ser a variao entre
os valores. Vamos entender melhor isso.
Conjuntos mais
homogneos apresentam
desvios-padro menores.
s=
Muita ateno
diferena abaixo:
x
n
2
i
xi
2
i
xi
s o desvio padro
-
,onde
n a soma das frequncias
n
2
Matematicamente, os
parnteses alteram tudo.
Acompanhe o exerccio
para detectar a diferena.
108
Tabela Y
Tabela Z
xi
xi
xi
xi
xi
xi2
70
4900
68
4624
25
70
4900
69
4761
15
225
70
4900
70
4900
50
2500
70
4900
71
5041
120
14400
70
4900
72
5184
160
25600
=350
=24500
=350
=24510
=350
=42750
xi =350
2
xi =24500
Ento,
s=
x
n
2
i
2
xi
24500 350
-
-
=
= 4900-4900=0
5
5
n
2
Para o conjunto Y:
xi =350
2
xi =24510
Ento,
s=
x
n
2
i
2
xi
24510 350
-
=
= 4902-4900= 2=1,4
n
5
5
109
Para o conjunto Z:
xi =350
2
xi =42750
Ento,
x
s=
n
2
i
2
xi
42750 350
-
-
=
= 8550-4900= 3650=60,4
5
5
n
2
110
II
III
Fonte: autor
111
s=
fx
2
i i
2
fx
fx
i i
i i o produto do quadrado dos valores pela frequncia
-
,onde
i i o produto dos valores pela frequncia
fx
n
2
fi
12
3
= 30
fi
fixi
xi2
fixi2
12
24
48
21
63
12
16
= 30 = 63
48
= 165
n= f=30
i
2
fx
i i =165
Sabendo que:
fx
i i =63
112
Ento,
s=
fx
2
i i
2
fx
165 63
i i
-
- = 5,5-4,41= 1,09=1,044
=
30 30
n
2
Relembrando: Se n
quantidade de valores
por que deu 30 se os
valores so 0, 1, 2, 3 e
4? Ou seja, por que n
no 5?
Simples! Porque, na
verdade, a tabela indica
que temos os seguintes
valores: 0, 0, 1, 1, 1, 1,
1, 1, 2, 2, 2, 2, 2, 2, 2,
2, 2, 2, 2, 2, 3, 3, 3, 3,
3, 3, 3, 4, 4 e 4. Isso
que a frequncia (fi).
Temos, portanto, 30
valores organizados por
frequncias.
fx
2
i i
2
fx
fx
i i
i i o produto do quadrado dos valores pela frequncia
-
,onde
i i o produto dos valores pela frequncia
fx
n
2
fi
150154
154158
158162
11
162166
166170
170174
Por exemplo, no
intervalo 150154, os
valores podem assumir
de 150 cm at 154 cm:
esses so os valores de
mnimo e de mximo.
= 40
Fonte: CRESPO (1995, p. 116)
113
fi
xi
fixi
xi2
150-154
154-158
158-162
162-166
152
608
23.104
92.416
156
1.404
24.336
219.024
11
160
1.760
25.600
281.600
164
1.312
26.896
215.168
166-170
168
840
28.224
141.120
170-174
172
516
29.584
88.752
= 40
= 6.440
fixi2
= 1.038.080
n= f=40
i
2
Sabendo que fx
i i =1.038.080
fx
i i =6.440
Ento,
s=
fx
2
i i
2
fx
1.038.080 6.440
i i
-
-
=
= 25.952-25.921= 31=5,567
40
40
n
2
fi
8 10 11 16 13 5 1
114
fi
450550
550650
10
650750
11
750850
16
850950
13
9501.050
1.0501.150
xi
fixi
xi2
fixi2
Coeficiente de variao
At aqui, nossos esforos tm-se voltado para caracterizar, com o
maior rigor possvel, a disperso dos conjuntos. O coeficiente de variao uma medida muito til para essa inteno.
O coeficiente de variao (CV) est sempre relacionado ao valor mdio
de um conjunto porque, como j vimos, a disperso uma medida
sempre relacionada a uma determinada mdia.
Sua frmula bastante simples:
CV=
desvio padro
x100
mdia
s o desvio padro
s
CV= x100,onde
x
x a mdia
O coeficiente de variao (CV) uma medida expressa em porcentagem e, por isso, est multiplicado por 100.
Vamos realizar um exerccio completo. Suponha que queiramos estudar a variao das idades de dois grupos, abaixo relacionados (PEREIRA, 2004, p. 24):
G1:
7 7 7 7 7 7
G2: 8 9 10 11 19 22
115
x=
Ento
Para G1: x=
x = 7+7+7+7+7+7 =7anos
i
x 8+9+10+11+19+22
Para G2: x= i =
=aproximadamente, 13 anos.
n
6
xi2 xi
s=
-
n n
Ento, antes do uso da frmula, como estamos fazendo sempre, vamos colocar em uma tabela os dados que sero utilizados.
G1
G2
xi
xi2
xi
xi2
49
64
49
81
49
10
100
49
11
121
49
19
361
49
22
484
=42
=294
=79
=1211
Dessa forma,
Para G1
n=6
xi =42
116
Ento
s=
xi
n
294 42
= 49 49 = 0
6
6
Para G2:
n=6
2
Sabendo que
xi =1.211
xi =79
Ento,
s=
x
n
2
i
2
xi2
1.211 79
-
=
- = 201,8-173,3
=
n
6 6
=
28,4 5,3
Aproximadamente, 5 anos.
At aqui, podemos sintetizar da seguinte forma:
G1
G2
13
s
5
CV= x100= x100=38%
x
13
Isso significa que podemos afirmar que G2 um grupo cujas idades
variaram mais do que as idades de G1. E, ainda, essa variao foi de
38%. Viu? A CV mede a variao.
O Departamento Intersindical de Estatstica e Estudos Socioeconmicos (Dieese) divulgou a seguinte informao sobre a
117
1998
1999
2000
2001
2002
2003
2004
2004
15,9
17,9
17,8
18,3
18,1
20,0
19,3
16,7
118
so medidas de posio), preferem chamar de medidas de tendncia central. Os autores no concordam quanto melhor maneira de
consider-las. Em nosso estudo, fizemos uma escolha. Optamos por
chamar os quartis, os decis e os percentis de medidas de posio, mesmo sabendo que isso no agrada a todos (Veja Seo 1: Introduo).
Assim, nesta seo 4, estudaremos os quartis, os decis e os percentis
que, a despeito de onde se encontram teoricamente, todos concordam com a forma de encontr-los. E isso, no momento, o que mais
nos importa, no mesmo?
Bom estudo para todos!
Quartis
Voc se lembra de que deixamos de calcular a mediana em conjuntos
com dados agrupados em intervalo de classe? Pois bem, chegou
a hora de lidarmos com essa valiosa ferramenta.
Na verdade, estrategicamente, deixamos para calcular a mediana de
conjuntos com essas caractersticas (dados agrupados com intervalos
de classe) para esse momento, porque a mediana nada mais do que
uma particularidade no estudo dos quartis. Mas, vamos por partes.
119
Fonte: autor
k fi
k fi
-F(ant)
h*
4
Q=l*+
f*
Onde
K o nmero de ordem do quartil (1,2 ou 3);
l* o limite inferior da classe mediana;
F(ant) a frequncia acumulada da classe anterior classe mediana;
f* a frequncia simples da classe mediana;
h* a amplitude do intervalo da classe mediana.
120
fi
Fi
[150,154[
[154,158[
13
[158,162[
11
24
[162,166[
32
[166,170[
37
40
[170,174[
=40
Fonte: CRESPO (1995, p.97)
k fi
4
l*
F(ant)
h*
f*
resultado
Q1
Q2
Q3
121
2 etapa: Posio
k fi
valores que dividem os conjuntos em 4 partes iguais. O resultado encontrado com a ajuda da Frmula 7: medidas de posio: dados no
agrupados: quartil (p. 112), lamentavelmente, no nos fornece, de
imediato, a posio do quartil, mas nos indica em que linha de classe
ele se encontra. Vamos explicar isso melhor, mas antes, que tal encontrar a posio do primeiro, do segundo e do terceiro quartis?
Para isto, basta utilizarmos a Frmula 7, vista anteriormente.
Como se pode notar, teremos trs resultados, porque queremos encontrar a posio dos trs quartis. Assim,
Soluo:
Sabemos que
f=40
i
Ento,
Primeiro quartil (k=1),
1x fi
4
40
=10
4
2x fi
4
80
=20
4
3x fi 120
=
=30
4
4
122
k fi
4
" com os
k fi
4
Q1
10
Q2
20
Q3
30
l*
F(ant)
h*
f*
resultado
123
Agradeo ao amigo e
professor de Estatstica,
Adolfo Dani, pela
seguinte considerao:
preciso tomar cuidado
para no pensar que
todos os elementos
do intervalo de classe
tenham o mesmo
tamanho, como as
esferas parecem sugerir.
Eu posso ter, por
exemplo, no intervalo
150154, alguns
elementos com 150
cm, outros com 151
cm, outros com 152
cm e, portanto, eles
podem no possuir
a mesma altura.
verdade! Ainda assim,
mantive a metfora da
reunio das esferas,
pois ela feliz em
seu objetivo central:
mostrar a posio em
uma distribuio com
frequncia acumulada.
Mas, estamos atentos!
A Figura 31, acima, representa a tabela de distribuio do nosso exerccio, mas construda de maneira mais amigvel. Vamos entend-la
por meio de uma metfora: a reunio das esferas.
Em um planeta distante, os habitantes eram esferas. Existiam somente 6 tipos
Intervalo de classe de
150 cm a 154 cm e
frequncia igual a 4.
Intervalo de classe de
154 cm a 158 cm e
frequncia igual a 9.
124
fi
Fi
[150,154[
[154,158[
13
[158,162[
11
24
[162,166[
32
[166,170[
37
40
[170,174[
=40
fi
Fi
[154,158[
13
125
k fi
4
l*
Q1
10
154
Q2
20
158
Q3
30
162
F(ant)
h*
f*
Resultado
Quartil
k fi
Q1
10
126
l*
F(ant)
154
Q2
20
158
13
Q3
30
162
24
h*
f*
Resultado
5 etapa: Amplitude do intervalo (h *). A determinao da amplitude do intervalo de classe tambm imediata. Localizada a
linha quartil, basta subtrair o maior valor do menor valor do intervalo de classe.
Desse modo, como Q1 pertence 2a linha e o intervalo de classes
[154,158[, a amplitude do intervalo ser dada por 158 154 = 4.
Efetuando o mesmo clculo para Q2 e Q3, encontraremos o mesmo
resultado. Transportando esses resultados para a tabela-resposta, temos:
Tabela 40: Medidas de posio: quartis: exerccio:tabela-resposta: preenchimento:
5 etapa
Tabela- Resposta:Quartis
Quartil
k fi
4
l*
F(ant)
h*
Q1
10
154
Q2
20
158
13
Q3
30
162
24
f*
Resultado
k fi
4
l*
F(ant)
h*
f*
Q1
10
154
Q2
20
158
13
11
Q3
30
162
24
Resultado
127
7 etapa. Resultado. Chegamos ltima etapa. Passo a passo, fomos encontrando todos os dados que precisamos para a utilizao
da Tabela 35: Medidas de posio: quartis: exerccio: tabela-resposta, p. 113. Consultando a tabela-resposta, basta substituirmos os
valores e pronto!
Vamos aos clculos:
Soluo:
Primeiro quartil.
k fi
-F(ant) h*
4
=154+ [10-4]x4 =156,66
Q1=l*+
f*
9
Segundo quartil.
k fi
-F(ant) h*
4
=158+ [20-13]x4 =160,54
Q2 =l*+
f*
11
Terceiro quartil.
k fi
-F(ant)
h*
4
=162+ [30-24]x4 =165
Q3 =l*+
f*
8
128
fi
Fi
[450,550[
[550,650[
10
18
[650,750[
11
29
[750,850[
16
45
[850,950[
13
58
[950,1050[
63
[1050,1150[
64
= 64
Fonte: CRESPO (1995, p. 103)
k fi
4
l*
F(ant)
h*
f*
Resultado
Q1
Q2
Q3
Decis e percentis
Decis e percentis so encontrados de maneira anloga aos quartis.
Se quartis dividem o conjunto de dados em 4 partes iguais, decis dividem o conjunto em 10 partes e percentis em 100 partes. Se podemos
encontrar 3 quartis (Q1, Q2 e Q3), podemos encontrar 9 decis (D1, D2,
D3. .... D9) e 99 percentis (P1,P2, P3. .... P9).
Para encontrar as posies dos decis e dos percentis utilizamos frmulas semelhantes s da mediana e dos quartis para dados no agrupados. Veja:
Frmula 9: Medidas de posio: dados no agrupados: decil
k fi
10
129
k fi
100
Um exemplo ser o suficiente para mostrar que quartis, decis e percentis so calculados da mesma maneira. Vamos a ele:
Considerando a tabela de distribuio de frequncia utilizada no exerccio de quartis (abaixo, reproduzida), calcule o oitavo percentil.
Altura dos alunos da Turma A
Estaturas (cm)
fi
Fi
[150,154[
[154,158[
13
[158,162[
11
24
[162,166[
32
[166,170[
37
[170,174[
40
=40
Soluo:
Obedecendo s etapas, construiremos a tabela-resposta, antes de
mais nada.
Tabela 43: Medidas de posio: percentil: tabela-resposta
Tabela- Resposta:Quartis
Percentil
k fi
100
l*
F(ant)
h*
f*
Resultado
P8
k fi
100
k fi
4
"). Isso se
130
k fi
-F(ant) h*
100
P=l*+
f*
Comparando-se as frmulas do quartil e do percentil, temos que:
Quadro 4: Quartil e percentil: frmula geral: comparao
Comparao: frmula geral: quartil e percentil
Quartil
k fi
-F(ant) h*
Q=l*+
f*
Percentil
k fi
-F(ant) h*
100
P=l*+
f*
Observe com a comparao acima que se trata apenas de uma adaptao, mas as frmulas so as mesmas. Como j dissemos, so apenas
duas alteraes: de Q passou a P (isto , de quartil passou a percentil)
e de 4 passou para 100 (isto , diviso do quartil 4 e diviso do
percentil 100 ).
Vamos, ento, encontrar a classe percentil:
k fi
100
8x40
=3,2
100
131
k fi
P8
3,2
100
l*
F(ant)
h*
f*
Resultado
k fi
-F(ant) h*
100
P=l*+
f*
P8 =150+
[3,2-0] x4 = 153,2
4
132
Palavras Finais
Ufa! Chegamos ao final.
Aqui, no poderia deixar de agradecer pela oportunidade que tive de
apresentar aos trabalhadores em educao minhas opinies sobre a
Estatstica. Aproveito tambm para agradecer a todos os colegas que
fizeram a leitura prvia do texto, contribuindo, assim, para torn-lo
melhor.
Ao longo de todo esse Mdulo, fixei-me, principalmente, em um objetivo: desmistificar a Matemtica. Considerando que a Estatstica
uma aplicao da Matemtica, procurei mostrar a vocs, colegas da
educao, que, com certa disciplina, possvel fazer uso da Estatstica, mesmo com alguma dificuldade na Matemtica. Por isso, aps o
chamamento para o estudo (na Introduo), demos a partida para a
jornada, apresentando, brevemente, aqueles conceitos principais da
Matemtica, sem os quais seria impossvel a compreenso da Estatstica.
Depois, mergulhamos na estatstica descritiva, o que significa que
passamos a olhar com ateno tabelas e grficos to presentes em
nossas vidas. Nosso objetivo foi apresentar ao leitor metodologias de
organizao e exposio de dados como ferramenta para a leitura da
realidade.
Com foco ainda na estatstica descritiva, no momento seguinte, buscamos aprimorar a organizao e exposio de dados a partir de modelos j consagrados pelo uso.
Depois, mudamos de foco. Passamos a manipular os dados, vale dizer: samos da organizao e exposio para a manipulao de dados.
Nesse momento do estudo, procuramos organizar informaes j manipuladas por todos ns, em nossas atividades profissionais, mas que
mereciam ateno especial. A partir desse instante, adentramos ao
mundo da estatstica inferencial, pois j podemos propor solues a
133
134
Guia de Solues
Unidade 2
(p. 36)
I proporcional a II que proporcional a III. Os trs so proporcionais,
pois:
45
30
15
= = = 1,125
40 26,67 13,33
(p. 40)
Altura do co (cm)
160
1 4
160
4x=160 x=
x=40
=
x 160
4
O co mede 40 cm.
(p. 42)
Populao
100
30 940 542
169872856 100
3094054200
=
169872856x=30940542x10 x=
x=18,21%
30940542
x
169872856
No Brasil, a populao em idade escolar (dos 6 aos 14 anos), corresponde a 18,21% da populao total.
(p. 45)
Coeficiente=0,007 / Taxa = 0,7% ou 7%. (Repare que o smbolo mudou. Significa que o denominador 1000. Nesse caso, lemos: sete por
mil).
135
(p. 48)
(Rua 0; Avenida 1) / (Rua 0; Avenida 2) / (Rua 1; Avenida 0) / (Rua 1;
Avenida 2) / (Rua 2; Avenida 0) / (Rua 2; Avenida 1) / (Rua 3; Avenida
1) / (Rua 3; Avenida 2)
(p. 50)
1. a. 2,4 / b. 24,6 / c. 0,4 / d. 4,2 / e. 328,4 / f. 3,0 / g. 6,8 / h. 5,6 / i.
90,0
2. a. 46,73 / b. 123,84 / c. 253,65 / d. 299,95 / e. 28,26 / f. 37,48
Unidade III
(p. 55)
Escolas
Populao
D
E
10%
Amostra
M = 134
13
F = 228
23
M = 150
15
F = 130
13
M = 300
30
10x300
=30
100
29
F = 290
10x290
= 29
100
(p. 59)
Universo
Varivel
As jogadas de um dado.
(p. 61)
1/3/2/2/3/1/3/3/2/2/3
(p. 62)
Cabealho: Unidade da Federao / Matrculas no Ensino Fundamen-
136
Unidade IV
(p. 87)
1.
Estatura: 150 alunos
Estatura (cm)
fi
145 a 150
22
150 a 155
38
155 a 160
45
160 a 165
27
165 a 170
12
170 a 175
175 a 180
Total 150
137
2.
Unidade V
(p. 97)
x=7546,25
(p. 105)
Conjunto A: mdia = 8,9 / mediana = 9 / moda = 7 Conjunto B: mdia
= 6,4 / mediana = 6 / moda = 4, 5, 6, 8 e 10 (5 modas; polimodal).
(p. 111)
Conjunto A: 4,87
Conjunto B: 3,87
Note que o Conjunto B apresenta disperso menor que o Conjunto A
(p. 114)
s = R$ 154,00
(p. 117)
138
(p. 129)
Q1= 630, Q2= 768 e Q3= 873. Significa que 25% do custovaria de R$
450,00 a prximo de R$ 630,00; 50% menor que R$ 768,00 e 75%,
menor que R$ 873,00.
(p. 132)
Tabela- Resposta:Quartis
Percentil
k fi
P8
3,2
100
l*
F(ant)
h*
f*
150
Resultado
(p. 132)
D1= 154 e D9= 169,2. Significa que 10% possuem estatura inferior a
154 cm e 90%, inferior a 169,2 cm. Ou, ainda, apenas 10% possuem
altura superior a 169, 2 cm.
139
Referncias
ARANHA, Carla. Ramss II, o fara guerreiro. Aventuras na Histria:para viajar
no tempo, 11. ed. So Paulo: Editora AbrilS.A., 2006. Disponvel em: <http://
historia.abril.com.br/edico-es/11/capa/conteudo_historia_42675.shtml>. Acesso
em: 30 ago.2006.
ARENDT, Hanna. A condio humana. 10. ed. Traduo de Roberto Raposo,
posfcio de Celso Lafer. Rio de Janeiro: Forense Universitria, 2005.
BRASIL. MEC. INEP. Censo Escolar 2003. Disponvel em: <http://www.inep.gov.
br/basica/censo/Escolar/resultados. htm>. Acesso em: 10 ago. 2006.
______ . Censo Escolar 2004. Disponvel em: <http://www. inep.gov.br/basica/
censo/Escolar/resultados.htm> Acesso em: 10 ago. 2006.
______ . Censo Escolar 2005. Disponvel em: <http://www. inep.gov.br/basica/
censo/Escolar/resultados.htm> Acesso em: 10 ago. 2006.
______ . Resultados do Censo Escolar. Disponvel em: <http:// www.inep.
gov.br/basica/censo/Escolar/resultados.htm>. Acesso em: 10 ago. 2006.
______ . NBR 14724: Informao e documentao: trabalhos acadmicos:
apresentao. Rio de Janeiro, ago. 2002.
______. Emenda 1. Rio de Janeiro, 30 dez. 2005.
______. Ministrio das Cidades. Departamento Nacional de Trnsito Denatran.
Coordenao-Geral de Informatizao e Estatstica CGIE. Anurio Estatstico
de Acidentes de Trnsito 2002. Disponvel em: <http://www.denatran.gov.br/
aciden-tes.htm> Acesso em: 31 ago.2006.
CASTRO, Lauro Sodr Viveiros de. Exerccios de Estatstica. 9. ed. Rio de Janeiro:
Editora Cientfica, 1964.
CLEMENTE, Rosana Giovanni Pires. Apostila de Estatstica, Taubat.
Universidade de Taubat, 2003.
COSTA, Srgio Francisco. Estatstica aplicada pesquisa em educao.
Braslia: Plano Editora, 2004.
140
CRESPO, Antnio Arnot. Estatstica fcil. 13. ed. So Paulo: Saraiva, 1995.
DANTE, Luiz Roberto. Tudo matemtica. 6a srie. So Paulo: tica, 2003.
DEPARTAMENTO Intersindical de Estatstica e Estudos Socioeconmicos (DIEESE).
Pesquisas e Anlises do Dieese. Disponvel em: <http://turandot.dieese.org.
br/icv/TabelaPed? tabela =5> Acesso em: 28 ago. 2006.
FELIX NETO, Jos Luiz. O despovoamento do territrio amaznico. Disponvel
em: <http://www.abep.nepo.unicamp.br/encontro2006/docspdf/ABEP2006_434.
pdf> Acesso em: 12 ago. 2006
HERDOTO. Disponvel em: <http://greciantiga.org>. Acesso em: 30 ago. 06. ISSN
91679-5709.
HISTRIA da Estatstica. Disponvel em: <http://www.estatisti-capr.hpg.ig.com.br/
historia.html> Acesso em: 03 ago. 2006.
JAKUBOVIC, Jos; LELLIS, Marcelo. Matemtica na medida certa, 6asrie. 3.
ed. So Paulo: Scipione, 1995.
OS IMPERADORES Yao e Yun. Disponvel em: <http:// po.chinabroadcast.cn/
chinaabc/chapter17/chapter170104. htm> Acesso em: 30 ago.2006.
PARENTE, Eduardo Afonso de Medeiros; CARIB, Roberto. Matemtica
comercial e financeira: 145 exerccios resolvidos,262 exerccios propostos com
respostas, 99 testes de concursos e vestibulares. So Paulo: FTD, 1996.
PEREIRA, Paulo Henrique. Noes de estatstica: com exerccios para
administrao e cincias humanas (dirigidos a pedagogia e turismo). Campinas:
Papirus, 2004.
SEARS, Francis; ZEMANSKY, Mark W.; YOUNG, Hugh D. Fsica 1: mecnica da
particular e dos corpos rgidos. 2. ed. rev. traduo de Jean Pierre von der Weid. Rio
de Janeiro: LTC Livros Tcnicos e Cientficos Editora Ltda., 1985.
SPIEGEL, Murray Ralph. Estatstica: resumo da teoria, 875 problemas resolvidos,
619 problemas propostos. Traduo de Pedro Cosentino. ed. rev. por Carlos Jos
Pereira de Lucena. So Paulo: McGraw-Hill do Brasil, 1975.
UNITED STATES. Census Bureau. People.Disponvel em: <http://www.census.
gov> Acesso em: 04 nov. 2013.
141
Obras Consultadas
DESCARTES, Ren. Discurso do mtodo; As paixes da alma;Meditaes;
Objees e respostas. Introduo de Gilles Gaston Granger. Prefcio e notas de
Gerard Lebrun. Traduo J. Guinsburg e Bento Prado Jnior. 5. ed. So Paulo: Nova
Cultural, 1991. (Os pensadores).
JOHNSTON, Ian. Section Four: The Beginnings of Modern Probability Theory. In:
______ . And Still We Evolve: A Handbook on the History of Modern Science.
Disponvel em: <http:// www.mala.bc.ca/~johnstoi/darwin/sect4.htm> Acesso
em: 04 ago. 2006.
SOARES, Tufi Machado. Utilizao da Teoria da Resposta ao Item na
produo de Indicadores Socioeconmicos. Disponvel em: <http://www.
scielo.br/pdf/pope/v25n1/24252.pdf> Acesso em: 13 ago. 07.
142
Currculo do Professor-autor
Carlos Augusto de Medeiros
Licenciado em Matemtica, mestre e doutor em Educao.
Exerceu atividades de docncia na educao bsica e superior, bem
como cargos de gesto nessa ltima.
Atualmente, trabalha na mantenedora dos cursos de medicina e enfermagem do DF, e docncia em instituies de ensino superior privadas.
143