Documente Academic
Documente Profesional
Documente Cultură
Srie Livro-Texto
mtodos estatsticos
e a administrao
Catalogao na Publicao:
Biblioteca Universitria Mario Osorio Marques Uniju
F897m
Sumrio
Conhecendo os Professores............................................................................................7
Apresentao............................................................................................................................9
EaD
Conhecendo os Professores
EaD
Apresentao
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
10
EaD
Unidade 1
Seo 1.1
A Estatstica e a Administrao
Iniciamos com observaes sobre cada uma das cincias para depois entender como se
estabelecem os links entre elas.
11
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
EaD
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Segundo Arajo (2004), entende-se como caractersticas do gestor suas funes, habilidades
e competncias: planejar, organizar, liderar e controlar. O planejamento envolve a determinao no
presente do que se espera para o futuro da organizao, incluindo quais as decises que devero
ser tomadas para que as metas e propsitos sejam alcanados. As metas organizacionais adaptam
as funes aos recursos da empresa e aos recursos humanos necessrios para concretiz-los. O
gestor precisa conduzir o processo de forma a influenciar todas as pessoas a trabalharem em
torno de objetivos comuns, suscitando participao e adeso, gerenciando democraticamente o
processo. O controle integra as aes para o acompanhamento do processo em busca do sucesso
do empreendimento. Estas caractersticas do conta de que somente a unio de todos permite
atingir com sucesso os objetivos.
Vamos agora abordar a cincia Estatstica, como ela se organiza no tratamento de dados.
EaD
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
b. Estatstica Inferencial: observamos que o termo inferncia provm do verbo inferir, quer
dizer, que pretendemos olhar um quadro de resultados e projet-los para um universo maior.
A inferncia rene um conjunto de mtodos que permitem fazer essas projees com garantia
e conhecimento da margem de erro mxima inerente s inferncias realizadas com base em
uma amostra. Como podemos projetar o sucesso do lanamento de um novo produto no mercado sem antecipar seu potencial de vendas? Para tal busca impossvel represar o lanamento
esperando que se conhea qual a fatia do mercado que se interessaria pela sua aquisio,
portanto um caso tpico para inferir o resultado populacional mediante uma amostra dos
possveis clientes.
c. Estatstica Aplicada: nos dois itens anteriores passamos uma ideia sobre a existncia de um
conjunto de mtodos e tcnicas estatsticas, construindo descries e inferncias dos dados.
Aps o uso das mesmas, estando aptos a traar um perfil descritivo do nosso conjunto de dados,
vamos aplicar algumas tcnicas que revelam relaes entre variveis de forma a mostrar o que
est por trs dessas relaes descritivas. Podemos descobrir, por exemplo, que as mulheres
compram preferencialmente determinados produtos; podemos conhecer o quanto a idade pode
estar relacionada quantidade de gastos com multas de trnsito; podemos avaliar os limites
permitidos de dimetro de uma determinada pea; podemos avaliar a resposta em termos de
volume de vendas com o passar dos meses...
Ns, seres humanos, e at mesmo os animais e as plantas, temos diferentes formas de nos
expressar. Dependendo da situao, empregamos as mesmas palavras para expressar diferentes
ideias. O mesmo se d nas diversas Cincias. A palavra populao na Demografia expressa
os habitantes de uma determinada regio; j na Estatstica sob a idia de populao agregamos
todos os indivduos, animais, objetos, lugares, perodos ou mquinas, etc., que apresentam caractersticas comuns predefinidas que constituem o nosso universo de informantes. Na seo a
seguir vamos apresentar os principais conceitos da Estatstica.
Seo 1.2
Ajustando a Linguagem por meio dos Conceitos Bsicos da Estatstica
Os principais conceitos da Estatstica dizem respeito aos informantes e s informaes que
formam as bases do tratamento estatstico. Os mtodos estatsticos aparecem, ento, intimamente
relacionados com esse contexto, pois permitem conhecer e explorar os fenmenos. Dois so os
mbitos da perspectiva estatstica: INFORMANTES E INFORMAES.
16
EaD
1.2.1 INFORMANTES
O que queremos dizer com Informantes?
Trata-se da provenincia dos dados, quem os fornece. Nossos informantes podem ser as
empresas, os trabalhadores, os produtos... Eles so a origem das informaes. Ao analisar as
empresas posso obter delas uma srie de informaes que constituiro o objeto da estatstica.
Os informantes podem se constituir numa populao ou numa amostra.
a. POPULAO: o conjunto de todas as unidades que reunimos a partir de caractersticas
que as definem e que so o espao temtico de nosso estudo. Segundo o dicionrio Aurlio:
Populao o conjunto de habitantes de um territrio, de um pas, de uma regio, de uma
cidade, etc.
Ainda no Dicionrio Aurlio (1995, p. 1.115): Estat. Conjunto, em geral infinito ou com
um grande nmero de membros, cujas propriedades se investigam por meio das caractersticas
dos subconjuntos que lhes pertencem, universo.
Segundo a Wikipdia Portugus:
Genericamente, uma populao o conjunto de pessoas ou organismos de uma mesma espcie que
habitam uma determinada rea, num espao de tempo definido. O termo populao tem, consoante
a disciplina a que se refere, distintas definies. Em Biologia define-se como um grupo de indivduos
que acasalam uns com os outros, produzindo descendncia. Em Estatstica chama-se populao ao
conjunto de todos os valores que descrevem o fenmeno que interessa ao investigador (grifo nosso).
Em Sociologia define-se como um conjunto de pessoas adscritas a um determinado espao, num dado
tempo (p. 1.115).
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
por meio de um censo, em que nenhuma das unidades fique de fora. As caractersticas tornam
nico aquele conjunto de dados, de forma que se distingue logo se uma unidade pertence ou
no quela populao.
Vejamos no Quadro 1 alguns exemplos de populao:
Tr a b a l h a d o r e s
Caractersticas
Tamanho
Pe s s o a s c o m 1 0 a n o s o u m a i s q u e
N = 1.875
mil pessoas
d e Po r t o A l e g r e m a r o d e 2 0 0 8 .
Da construo de Iju registradas
Empresas
n o C a d a s t r o d a Pr e f e i t u r a M u n i -
N = 121
2 mil itens
Definio
x : { x (1, 2, 3,
...., 1.875.000}
x : { x (1, 2, 3,
...., 121}
x : { x (1, 2, 3,
...., 2000}
Reunindo todos os resultados do Dicionrio Aurlio (1995, p. 88), que se referem ao conceito
estatstico observamos que amostra
18
EaD
Subconjunto de uma populao por meio do qual se estabelecem ou estimam as propriedades ou caractersticas dessa populao (...) Amostra acidental, obtida por meio de um processo de amostragem
casual; (...) Amostra pequena que tem um nmero de elementos insuficientes para permitir fazer uma
estimativa no viciada1 dos parmetros2 da populao; (...) Amostra representativa que foi obtida por
um processo isento de vcio.
A partir destas explicaes podemos constatar que em quase todas as reas do conhecimento a amostra apresenta finalidades que tm suas bases apoiadas no sentido estatstico, isto
, pretende de forma sinttica, rpida, menos custosa e eficiente conhecer, estimar o comportamento da populao. Em Estatstica, pretendemos obter uma amostra que tenha um potencial
comprovado de fazer essas inferncias, de modo que dependemos de um bom delineamento
amostral: dimensionamento formal (por meio de frmula) do tamanho necessrio de unidades
amostrais, seleo aleatria e representatividade das caractersticas do perfil que interessa manter,
tais como por sexo (50% de mulheres e 50% de homens se for esta a composio da populao),
faixa etria, escolaridade...
Exemplificando: uma auditoria numa empresa identificou telefonemas dados a sua principal concorrente, e como foi constatado que algumas das promoes planejadas pela empresa
vazaram antes de serem postas em prtica, h necessidade de rapidamente detectar de qual(is)
linha(s) interna(s) partiu (partiram) as chamadas e verificar a demanda e o responsvel por elas.
Entendeu-se que inicialmente o processo por amostragem seria o mais rpido de realizar. Na
empresa existem 240 ramais telefnicos, e foram constatadas ligaes em 15% deles. Neste caso
definimos como:
Populao: Ramais com ligaes efetuadas para o principal concorrente
N = 36 ramais, N: tamanho da populao
Dimensionamento da amostra: n = 20
Numerados os ramais de U1 a U60, procedemos ao sorteio das unidades amostrais
Unidades amostrais conforme sorteio:
No viciada uma expresso estatstica que significa no tendenciosa, isto , um resultado confivel, que no sofreu interferncias
externas que o deturpassem.
Parmetros so os nmeros tpicos, tipo mdia aritmtica, obtidos em dados populacionais, enquanto que estatsticas so estimativas
destes parmetros obtidos num processo amostral.
19
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Ramal
Ordem
Ramal
Ordem
RESERVAS
Ramal
Ordem
Ramal
Ordem
Ramal
13
11
21
16
28
21
17
15
12
22
17
29
22
16
13
23
18
30
23
24
10
19
14
25
19
31
12
10
20
15
27
20
35
Na seo seguinte vamos conhecer o outro lado do tratamento estatstico. Se por um lado
precisamos dos informantes, por outro necessitamos saber quais as informaes sobre a populao/amostra nos interessam e que so importantes para tirarmos concluses que respondam
as nossas perguntas/hipteses.
1.2.2 INFORMAES
Por informaes entendemos os prprios dados que sero trabalhados estatisticamente
com os mtodos estatsticos. O tema a ser investigado, as hipteses e os objetivos que definem
quais so as informaes de interesse nesse campo. Estas informaes so denominadas de
varivel aleatria.
Sorteio realizado com o auxlio do Excel por meio da funo: Aleatrio ()*36, que gerou 20 ns entre os 36 ramais da Populao e mais
3 para reserva em caso de problemas de acesso ao ramal sorteado.
20
EaD
dores envolvidos na produo, locais e formas de comercializao, durabilidade... Estas, portanto, so variveis envolvidas no produto. Observamos que algumas delas apresentam respostas
quantitativas e outras qualitativas.
Se considerarmos o exemplo utilizado para explicar a questo da amostra, podemos considerar que a metodologia a ser empregada na obteno dos dados a de quebra do sigilo telefnico nos ramais sorteados (este procedimento deve ser previamente autorizado). Sero colhidas
algumas informaes como: X1: autor da ligao, X2: cargo do autor da ligao, X3: tempo de
servio na empresa e X4: destinatrio da ligao; X5: cargo do destinatrio da ligao na empresa
concorrente, X6: data e X7: tempo da ligao; X8: assunto abordado na ligao, X9: abordagem
de assunto relacionado com os pr-lanamentos, X10: n de ligaes realizadas para a empresa
concorrente, X11: n total de ligaes, X12: frequncia de realizao, X13: relao das datas com
perodos de pr-lanamento de produtos, etc. Algumas respostas so categricas (qualitativas)
outras so numricas (quantitativas).
a. Variveis aleatrias qualitativas: so informaes cujas respostas so categricas que podem
apresentar uma ordem ou no entre as diferentes categorias de respostas. Permitem que se
codifique as diferentes alternativas possveis, so obtidas por meio de contagem de suas repeties, chamadas de frequncias (fi). Entre as variveis relacionadas anteriormente encontramos
como varivel qualitativa (VA Qualitativa):
Quadro 3: Exemplos de varivel qualitativa e sua classificao estatstica
Varivel
Cor
Funo dos trabalhadores envolvidos na produo
Durabilidade
Categorias
Classificao
melha...
No Ordenvel
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Va l o r es
C u s t o de pr o d u o
X > R$ 00,00
N de t ra b a l ha d o r e s e n vo l v ido s n a pr o d u o
X ( 0, 1, 2, 3, .....)
C la ssi fi ca o
Varivel Aleatria Quantitativa
C o nt nua
Varivel Aleatria Quantitativa
Di screta
Com esse Quadro 4 conclumos a apresentao da base necessria para constituir um trabalho estatstico, isto , seu objeto e seu objetivo, construdos na tica de buscar os informantes
e por meio deles obter as informaes necessrias para conhecer de forma ampla a temtica de
nosso interesse. Com as aplicaes pretendemos abrir um espao de uso desse contedo de forma
que possa alargar os horizontes do conhecimento estatstico. Lembre-se de que esta adequao
inicial em termos de linguagem, conceitos, identificaes, vo permitir que o seu tratamento dos
dados seja adequado e pertinente.
Seo 1.3
Aplicaes
a. Considere o exemplo dos ramais, as variveis sugeridas, complementando-as e classificandoas organizando um quadro como os utilizados anteriormente.
b. Organize trs estudos definindo:
A temtica, populao, N, amostra, n, sorteio, variveis e sua classificao.
No banco de dados (Inep/IBGE/PNAD) a seguir, defina Temtica, Populao, N, Variveis
e sua classificao:
22
EaD
Tabela 1: Rendimento mdio mensal e nmero de profissionais por tipo de profisso segundo regies geogrficas e Brasil 2001
(Em R$ 1,00)
N de
profissionais
Brasil
Norte
Nordeste
Sudeste
Sul
Centro
Oeste
201.232
422,78
388,89
232,79
522,44
435,87
749,61
Professor de 1a a 4a srie
881.623
461,67
443,17
293,18
599,19
552,72
567,38
Professor de 5a a 8a srie
521.268
599,85
600,99
372,81
792,82
633,92
593,52
139.575
849,16
753,20
549,60
1.092,85
738,27
834,86
348.831
866,23
826,28
628,08
979,16
804,32
872,20
517.038
868,73
817,55
723,52
986,19
747,23
910,93
Professor-pesquisador no E.
Superior
6.448
898,80
215,33
1.150,16
946,56
712,65
875,47
316.761
911,82
661,40
679,31
1.072,50
926,14
1.103,37
Administrador de empresas
502.895
1.202,86
986,87
774,85
1.411,18
1.057,85
1.123,93
421.318
1.310,56
1.053,94
794,02
1.586,97
1.308,30
1.876,79
Policial civil
72.743
1.510,64
1.344,46
1.320,40
1.457,90
1.488,02
2.087,23
89.387
2.091,53
2.129,41
1.674,46
2.250,53
1.949,68
2.321,03
Economista
44.772
2.254,66
1.700,77
2.009,08
2.227,19
1.641,35
3.592,64
Auditor
68.870
2.408,40
3.512,94
1.584,94
2.588,47
1.986,32
3.133,88
Advogado
271.241
2.496,76
3.893,83
2.245,35
2.431,04
2.597,39
2.768,25
136.977
2.565,47
1.800,30
2.252,08
3.086,95
2.122,77
2.190,10
Delegado/Perito
13.973
2.660,52
2.753,91
1.347,25
2.650,73
3.714,45
5.969,61
Mdico
257.414
2.973,06
4.429,82
2.576,78
2.801,77
3.260,41
4.110,87
Juiz
10.036
8.320,70
5.905,38
8.038,88
9.018,42
9.750,00
7.331,08
Obs. No estamos enfatizando o processo amostral nestas aplicaes da Unidade 1, posto que
esta ser tratada mais detalhadamente na Unidade 4.
23
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
RESUMO DA UNIDADE 1
Esta uma unidade essencial, pois nela conhecemos termos e significados que vo acompanhar nossos estudos at o final deste livro
e muito alm. Aprendemos que a Estatstica basicamente utiliza Informantes (Populao e Amostra) e Informaes (Variveis aleatrias
quantitativas e qualitativas) para descrever (Estatstica Descritiva),
projetar (Estatstica Inferencial) e estabelecer relaes (Estatstica
Aplicada). Neste curso vamos trabalhar esses trs nveis de conhecimento estatstico.
Referncias que consultamos especificamente para esta Unidade e sugerimos aos alunos
que consultem:
CHIAVENATO, Idalberto. Introduo Teoria Geral da Administrao. 4. ed. So Paulo:
Makron, 1993.
DRUCKER, Ferdinand P. A profisso de administrador. So Paulo: Pioneira Thompson
Learning, 1998.
FERREIRA, Aurlio Buarque de Holanda. Dicionrio da Lngua Portuguesa. Rio de Janeiro:
Nova Fronteira, 1995.
LACOMBE, F. J. M.; Heilborn, G. L. J. Administrao: princpios e tendncias. 1. ed. So Paulo:
Saraiva, 2003.
MONTANA, Patrick J. Administrao. 2. ed. So Paulo: Saraiva, 2003.
ARAJO, Luis Csar G. Teoria geral da Administrao: aplicao e resultados nas empresas
brasileiras. So Paulo: Ed. Atlas, 2004.
RIEGEL, John. Employee interest in company success-how can it be stimulated and maintained?
Address on industrial relations. Bureau of Industrial Relations; University of Michigan; Ann
Arbor, 1955. p. 25.
24
EaD
Unidade 2
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Seo 2.1
Banco de Dados
Para dar incio ao tratamento estatstico necessitamos coletar dados que provm das perguntas que nos fazemos em relao nossa populao dentro da temtica que nos interessa.
Assim, se formos estudar a distribuio dos municpios da Microrregio de Trs Passos,
suas potencialidades econmicas e capacidade de atender demanda na regio em que est
estabelecida, podemos buscar dados sobre:
Pareados significa que todos os dados apresentados numa mesma linha referem-se mesma unidade e no podem ser isolados nem
misturados, pertencem quela unidade. Por exemplo, se temos idade, sexo, escolaridade, data de admisso na empresa, estas so sempre
informaes particulares do sujeito e no podem desconectar-se dele.
26
EaD
N de ordem do municpio
X1
Mun
Municpio
X2
POP
X3
PIB_cap
X4
Cls_PIB
Classificao do PIB per capita Varivel aleatria qualitativa ordenvel [1) Pobre:
<7 mil dlares /ano; 2) Em desenvolvimento: de 7 a 24,99 mil dlares/ano; 3) Rico: >
25 mil dlares/ano ou mais]
N_agFin
Valor_
FPM
tiva contnua
X7
Valor_ITR
X8
Ind_Res
X5
X6
Cls_ind
X10
rea
X11
Cls_rea
na < 200 km; 2) Mdio 200 a 500 km; 3) Grande 501 a 1000 km; 4) Extenso >
1000 km]
X12
Densidade
X13
Cls_Dens
[1) Alta densidade: > 1000 hab./km; 2) Grande densidade: 501 a 1000 hab./km; 3)
mdia densidade: 100 a 500 hab./km; 4) baixa densidade: < 100 hab./km]
Nossa populao so todos os municpios da Microrregio de Trs Passos. Isso se constitui no nosso N, numeradas de 1 a N. Todas as informaes que obtivermos s nossas perguntas
constituiro nossas variveis. As informaes referem-se a cada um dos municpios, portanto
constituem informaes casadas, relacionadas, e no podem ser misturadas, pois cada uma est
ligada a um municpio em particular.
Trata-se, portanto, de uma relao de dados obtidos por meio de uma pesquisa, de um
levantamento de dados e contm todas as informaes que foram levantadas e as transformaes que foram realizadas para conseguir ampliar a base das mesmas. No banco de dados n 1,
27
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
as variveis bsicas so X1, X2, X3, X5, X6, X7, X8, X10. Com estas variveis foram feitas algumas
transformaes que resultaram nas variveis X4, X9, X11, X12, X13. Assim, o banco de dados vai se
constituindo com as variveis originais e as que so geradas a partir das mesmas.
As informaes dos municpios entraro nas linhas e as variveis nas colunas. O total de
municpios o N = 20, neste caso
Quadro 2: Banco de dados n 1 Municpios da Microrregio de Trs Passos
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10
Mun
POP
PIB_
cap
Cls_
PIB
N_
agFin
Valor_FPM
Valor_
ITR
Ind_
Res
Clsind Area
Barra do
Guarita
2.969
6.508
2.797.615,36
533,7
6.468
10.114
2.797.615,36
1.902,02
17
2.441
7.338
2.797.615,36
2.369,08
3.826
6.984
2.797.615,36
4.145,13
5.581
9.658
14.726
3.378
9.687
8.957
1
1
5.494
10.597
3.445
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Boa Vista do
Buric
Bom Progresso
Braga
Campo
Novo
Crissiumal
Derrubadas
Dr Maurcio
Cardoso
Esperana
do Sul
Horizontina
Humait
Miragua
Nova Candelria
Redentora
So Martinho
Sede Nova
Tenente
Portela
Tiradentes
do Sul
Trs Passos
Vista Gacha
X11
X12
X13
X1
Cls
area
DenCls
sidadens
de
65
45,7
109
59,3
89
27,4
129
29,7
2.810.105,39
15.989,17 7
222
25,1
3
0
5.267.727,46
2.410.580,60
5.417,75
4.060,42
8
1
3
1
362
361
2
2
40,7
9,4
5
1
3.512.012,00
7.660,00
256
21,5
7.821
2.798.876,06
1.724,62
148
23,3
18.305
4.923
4.869
19.805
11.774
6.473
2
1
1
4
1
1
5.595.230,83 8.291,42
2.797.615,36 2.519,68
2.797.615,36 1.324,74
8
8
4
3
3
2
229
135
130
2
1
1
79,9
36,5
37,5
5
4
4
2.739
12.368
2.797.615,39
946,85
98
27,9
9.600
5.122
2.810.105,36
6.674,59
303
31,7
5.853
10.212
2.797.615,36
5.514,40
10
172
34,0
2.968
11.782
2.797.615,36
4.554,22
119
24,9
13.906
7.301
4.340.091,71
3.703,25
338
41,1
6.928
6.765
2.797.615,36
2.944,97
234
29,6
23.467
12.755
9.657.490,50
5.196,27
268
87,6
2.713
9.920
2.797.615,76
922,33
89
30,5
Fonte: IBGE/cidades.
O banco de dados na verdade uma listagem de todas as informaes obtidas, sejam elas
originais ou transformaes.
Nos casos em que as variveis forem qualitativas, utilizamos um cdigo para representar as
diversas categorias de resposta, como fizemos com a varivel Classificao do PIB per capita,
na qual utilizamos os seguintes cdigos, com as respectivas classificaes e faixa de dados:
28
EaD
Seo 2.2
TABELAS SIMPLES Univariadas e Bivariadas Com Variveis Qualitativas
A tabela univariada apresenta uma nica varivel e tambm chamada de tabela simples.
utilizada para representar variveis qualitativas, cujas respostas so nominais, so categorias. A
estatstica neste caso est limitada a descrever o que ocorreu em termos de repeties. As partes
da tabela so: ttulo, barra de informaes, dados obtidos, barra de totais e fonte das informaes.
Nenhuma dessas partes pode faltar para que o trabalho estatstico tenha validade, seja feita uma
leitura das informaes obtidas e possam ser compreendidas.
1) Uma tabela deve apresentar um ttulo que apresenta a varivel que est sendo apresentada,
populao, local e tempo em que os dados foram coletados.
2) Na parte superior da tabela simples existe uma barra de informaes, em que constam todos
os tipos de informaes que sero apresentadas ou trabalhadas na tabela.
3) No corpo da tabela contabilizamos as repeties das respostas e calculamos o valor percentual.
As repeties so nmeros reais e absolutos, permitem avaliar a importncia das diferentes
categorias, no entanto s podemos comparar com outras variveis se o nmero de dados for
igual. Nesse caso, se a inteno fazer comparaes temos de utilizar um valor relativo, que
a porcentagem.
29
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
%=
N
*100
n
% vlido: o valor relativo calculado sobre o total de respostas vlidas, isto , n* = n NR,
N
no respostas. % =
*100, n* = n NR , ou seja:
n*
%.
%..vlido
f i*100
;
f i*100 ; % =
n NI
%=
n
NI :.mis sin g
Na parte inferior, uma barra com os totais, ou seja, as somatrias das colunas do N (fi) que
no caso representa o n, Total de dados, ( fi = n) e dos percentuais, cuja soma deve ser 100%.
Neste clculo vrios arredondamentos so possveis de serem utilizados: a) em primeiro
lugar, optamos por trabalhar com duas casas aps a vrgula para que os arredondamentos no
possuam efeito muito drstico, capaz de alterar a interpretao do resultado; b) utilizamos, preferencialmente, os seguintes critrios: se a 3 casa for um n no intervalo de 0 a 4, eliminamos
(exemplo % = 5/26*100 = 19,23077 19,23); se a 3 casa for um n no intervalo de 5 a 9, eliminamos e aumentamos um ponto na 2 casa (exemplo % = 6/26*100 = 23,07692 23,08).
Fonte: informa a provenincia dos dados, potencializando que se busquem mais informaes,
que as atualizemos e tambm referem a credibilidade dos dados.
Estes detalhes podem ser vistos na Tabela 1 a seguir.
Apresentamos um exemplo com base no banco de dados sobre a participao da populao
com 100 anos ou mais na populao com 60 anos ou mais segundo o local de moradia e sexo nas
UF/BR 2007. Esta tabela demonstra as duas possibilidades Presena de todas as Respostas e
presena de dados censurados NI (missing) ou seja, falta de informao:
30
EaD
Tabela 1: Participao de idosos com 100 anos ou mais no grupo de pessoas com 60 anos ou mais,
considerando sexo e local de moradia, nas diversas UF/BR 2007
Participao
MR
% MR
6
14
5
25
1
26
23,08
53,85
19,23
96,15
3,85
100,00
% MR
vlido
24,00
56,00
20,00
100,00
HR
% HR
MU % MU
HU % HU
19
7
73,08
26,92
19
7
73,08
26,92
26
100,00
8
17
1
26
26
100,00
30,77
65,38
3,85
100,00
Fonte: IBGE/cidades.
Obs.: Siglas: MR Mulheres da rea Rural; HR Homens da rea Rural;
MU Mulheres da rea Urbana; HU Homens da rea Urbana;
Categorias da participao: Raros: % < 0,05; N Mdio: 0,05 a 0,14; Grande N: % > 0,14
Na Tabela 1 estamos avaliando a varivel Participao de Idosos com 100 anos ou mais no
grupo de Idosos da Populao com 60 anos ou mais, considerando diferentes informaes que
potencializam obter diferentes aspectos que podem ser comparados.
Estamos comparando os Estados segundo sua distribuio de longevidade a partir de diferenas apresentadas por sexo (H ou M) e por localizao (R ou U). Nesse caso a varivel a
mesma, as populaes apresentam caractersticas diferenciadas.
O comentrio que vamos apresentar a seguir de cada tratamento especfico dos dados
uma das diversas leituras dos resultados estatsticos. Procuramos, especialmente, nesse tipo
de comentrio:
apresentar inicialmente uma idia geral qual o tratamento estatstico permitiu chegar, auxiliando o leitor a enxergar nos resultados o que estes nos revelam, isto , encaminhando a
leitura na direo que compatvel com os objetivos para os quais os dados foram coletados;
sustentar as ideias, argumentaes com as estatsticas calculadas. Estas so argumentativas
por si prprias e devem convencer o leitor. Por exemplo, no basta dizer a maioria dos Estados, necessrio informar de quanto essa proporo para que ela convena o leitor sobre a
superioridade em termos de presena dessa categoria;
evitar referir todos os dados da tabela, apenas os que queremos colocar em destaque;
procurar apresentar informaes que esto subjacentes, retrabalhadas, tipo a soma de dois
dados, o complementar de algum deles.
Comentrio 1: Com base nesta tabela constatamos que a maior participao de
pessoas com 100 anos ou mais na populao idosa so as mulheres do meio rural (MR), que apresentam em 76% dos Estados um nmero mdio de idosos,
31
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
em torno de 5 a 14 idosos com 100 anos ou mais em cada 10 mil idosos (56%), 15 ou mais
idosos com 100 anos ou mais em cada 10 mil idosos (20%). A menor presena de homens
com mais de 100 anos, tanto no meio urbano como no rural. So raros (menos de 5 idosos com
100 anos ou mais em cada 10 mil idosos) em 73% dos Estados em ambos os casos.
Outro exemplo deste tratamento utilizando mltiplas tabelas para traar o perfil pode ser
vista na Tabela 2. Nesse caso, diferentes variveis so consideradas para uma mesma populao,
mas ainda tratadas isoladamente. O que muda a apresentao conjunta.
Vejamos ento, na Tabela 2, variveis da Microrregio de Trs Passos, apresentando seu
perfil econmico a partir de 5 delas: Porte dos municpios, Classificao da densidade demogrfica, Classificao pelo PIB per capita, N de Agncias Financeiras e Classificao n indstrias/
mil hab.
Tabela 2: Classificao dos municpios segundo potencial econmico da Microrregio de Trs Passos com 20 municpios 2
N=20
Porte dos Municpios
1 Pequeno Porte I (at 20 mil hab.)
2 Pequeno Porte II (20 a 50 mil hab.)
11
55,00
45,00
5,00
3 (20 a 29 hab./km)
40,00
4 (30 a 39 hab./km)
25,00
30,00
1 Pobre
19
95%
2 Em desenvolvimento
5%
45,00
15,00
25,00
5,00
5,00
5,00
N de Agncias Financeiras
5,00
35,00
10
50,00
10,00
Fonte: IBGE/cidades.
* Todos os municpios apresentam densidade inferior a 100 hab./km2, logo tem baixa densidade demogrfica. A classificao evidencia 5 nveis (1 a 5) sendo 1 o menor e 5 o maior dentro do grupo
32
EaD
Estas variveis oferecem uma viso geral da Microrregio, no permitindo fazer destaques de municpios individualmente, mas pretende dar uma viso da Microrregio em termos
econmicos.
Comentrio 2: Utilizando o banco de dados da Microrregio de Trs Passos, buscamos fazer
uma avaliao do potencial econmico da riqueza da regio. Constata-se na Tabela 2 que so
20 municpios de pequeno porte (55% de nvel I com at 20 mil habitantes e 45% de nvel II com
20 a 50 mil habitantes), em sua maioria com baixo rendimento econmico e baixa densidade
demogrfica: menos de 100 hab./km2. Apenas trs municpios apresentam um destaque em
termos econmicos: Trs Passos, Crissiumal e Horizontina. Os demais apresentam populaes
pobres, com baixo rendimento e baixo potencial de desenvolvimento. Podemos observar que em
termos de PIB per capita (fatia do PIB por residente nos municpios da Microrregio), 95% dos
municpios podem ser considerados subdesenvolvidos/pobres, uma vez que o PIB per capita/
ano inferior a US $ 7 mil dlares/ano, o que daria uma base em torno de R$ 1000,00/ms.
Nessa Microrregio 45% dos municpios no dispem sequer de uma agncia financeira, e o
nmero mdio de agncias financeiras por municpio de 1,25. O nmero de indstrias para
cada mil habitantes indica que existem apenas dois municpios que apresentam uma maior
industrializao, com 11 a 20 indstrias por mil habitantes. 40% dos municpios so pouqussimo ou nada industrializados (menos de 5 indstrias por mil habitantes).
As tabelas bivariadas, por sua vez, apresentam simultaneamente duas ou mais variveis,
cada varivel uma dimenso. Quando trabalhamos com uma ou at duas dimenses os resultados do tratamento so simples de explicar e compreender, porm se trabalharmos com trs ou
mais dimenses torna-se bem mais complexo. Por isso vamos nos restringir a duas dimenses.
Ao sistematizar duas variveis vamos construir uma tabela bivariada, tambm chamada
de tabela cruzada, ou tabela de dupla entrada.
Estas variveis devem ser qualitativas ou ento transformadas em qualitativas pela organizao de dados quantitativos em intervalos tipo faixa etria, por exemplo. Uma varivel entra
na linha (li ) e outra na coluna (cj ) da matriz. Nas margens da Tabela teremos os dados de cada
varivel em separado, e no interior a frequncia conjunta (fij ), em que i representa a informao
da linha e j a informao da coluna. Se estamos tratando de sexo e consumo de determinado
bem, podemos ter os seguintes pares de informaes conjuntas: masculino e consome; masculino e no consome; feminino e consome; feminino e no consome. Resumidamente, temos os
seguintes pares: (M;C); (M;N); (F;C); (F;N). Vamos contar a repetio de cada par para formar
a frequncia conjunta. Se tivermos seis homens que consomem este bem, ento a primeira frequncia conjunta 6.
33
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
%.de.linha
%i , j =
f i , j*100
li
%.de.coluna
; % = f i , j*100
i, j
cj
%.de.total
; % = f i , j*100
i, j
n
No exemplo:
%.de.consumo
%.de.total
%.de.sexo
6
f
6
;
;
%1,1 = *100 = 20,0% %1,1 = *100 = 11,8% %i , j = i , j*100
51
30
n
Para apresentar a tabela bivariada, ou tabela conjunta, estamos utilizando um exemplo do
banco de dados sobre o padro alimentar de um grupo de alunos. Encontramos inicialmente as
frequncias conjuntas e as frequncias marginais (estas formam os resultados como se fossem
uma tabela simples). A seguir, empregando as frmulas apresentadas anteriormente, calculamos
os percentuais, realizando logo a seguir o comentrio (leitura) das informaes sistematizadas
nessa tabela:
Tabela 3: Consumo de alimento light por sexo
Sexo\consumo
Masculino
% sexo
% consumo
% do total
Feminino
% sexo
% consumo
% do total
Total p/consumo
% sexo
% consumo
% do total
Consome
6
20,0
11,8
6,5
45
72,6
88,2
48,9
51
55,4
100,0
55,4
No Consome
24
80,0
58,5
26,1
17
27,4
41,5
18,5
41
44,6
100,0
44,6
34
Total p/sexo
30
100,0
32,6
32,6
62
100,0
67,4
67,4
92
100,0
100,0
100,0
EaD
Comentrio 3: Observa-se que a preocupao com o consumo de alimentos light, considerados com menor potencial de prejuzo sade, est associado com o sexo do consumidor:
mulheres consomem mais do que homens. Constata-se que maior entre as mulheres (72,6%
das mulheres) do que entre os homens (apenas 20% dos homens), referindo portanto que
88,2% do consumo realizado por pessoas do sexo feminino e 58,5% dos que no consomem
so homens.
Para fazer a anlise da tabela bivariada realizamos o mesmo tipo de recorte permitido nas
tabelas simples.
apresentar a idia sntese da inteno que motivou a tabela;
um cuidado o de no rediscutir todos os percentuais;
no utilizar todos os percentuais referentes a uma frequncia conjunta. Escolher o que melhor
expressa a inteno da pesquisa;
procurar embasar os comentrios com as estatsticas mais adequadas, isto , escolher o que vai
sustentar melhor, convencer melhor o leitor.
Ao fazermos a leitura da tabela temos de nos conscientizar de que o fazemos para terceiros,
que no tero a viso dos dados brutos e nem das diferentes maneiras pelas quais os mesmos
podem ser sistematizados, apresentados ou interpretados. Muitas relaes que esto subjacentes
aos dados podem ser ressaltadas nesses comentrios pelo autor, encaminhando a compreenso
que o leitor vai ter da temtica. Com isso, alertamos para a parcialidade do comentrio, no h
neutralidade nele. O autor deve assumir que conduz o leitor interpretao.
A seguir vamos apresentar outro exemplo: Condies Econmicas dos Municpios da Microrregio de Trs Passos, a partir do banco de dados n 1.
Tabela 4: N de Agncias financeiras segundo o porte dos municpios da Microrregio de Trs Passos em 2007.
Po r t e d o s m u n i c p i o s
Pe q u e n o Po r t e I
% rea
% agncias
% total
Pe q u e n o Po r t e I I
% rea
% agncias
% total
To t a l p o r Po r t e
% rea
% agncias
% total
N Agncias
0
7
63,6
77,8
35,0
2
22,2
22,2
10,0
9
45,0
100,0
45,0
1
2
18,2
66,7
10,0
1
11,1
33,3
5,0
3
15,0
100,0
15,0
2 ou mais
2
18,2
40,0
10,0
6
66,8
83,3
30,0
8
40,0
100,0
40,0
To t a l p o r A g n c i a s
11
100,0
55,0
55,0
9
100,0
45,0
45,0
20
100,0
100,0
100,0
Fonte: IBGE/cidades.
35
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Seo 2.3
Tabelas em Srie Numrica e Distribuio de Frequncias
com Variveis Quantitativas
A sistematizao dos dados de variveis quantitativas permite um pouco mais de tratamento estatstico. O nmero de informaes com as quais trabalhamos e a apresentao de um
comportamento padronizado ou no vo definir se a sistematizao ser feita por meio de Srie
Numrica (pequenas amostras, n<20), que trabalha com toda a informao individualizada, isto
, listada uma a uma, ou de Distribuio de frequncias (grandes amostras, n20), que distribui
as repeties dentro de intervalos, informando, portanto, que naquela faixa de valores existem
fi (frequncia, n), que so as observaes.
Na Srie Numrica, quando trabalhamos com pequenas amostras de tamanho menor do
que 20, listamos os valores de Xi (varivel aleatria) ordenados em ordem crescente, do menor
para o maior. Consideramos a listagem dos dados absolutos nesse caso, pois devido ao pequeno
tamanho da Amostra ou Populao, o agrupamento dos valores observados em intervalos significaria uma perda de informaes que inviabilizaria a compreenso do fenmeno. Aps fazer a
listagem dos dados ordenados o mximo que podemos obter, nessa fase inicial, so:
Informaes sobre o n, valor mnimo (Li Limite Inferior), o valor mximo (Ls Limite Superior), a amplitude total (At = Ls Li, Faixa de variao dos dados entre o maior e o menor).
Referncias para um agrupamento qualitativo, formao de categorias que reagrupem os
valores de forma nominal.
36
EaD
xi
n
xi
*100
i =1
Empregamos, para exemplificar, os dados referentes aos municpios que esto separados
por Porte, como municpios de Pequeno Porte Nvel I e II, da Microrregio de Trs Passos. No
caso dos Municpios de Pequeno Porte I ou II, observa-se que:
Tabela 5: Valor do ITR (Imposto Territorial Rural) nos municpios de Pequeno Porte Nvel I e II
da Microrregio de Trs Passos RS 2007.
N
1
2
3
4
5
6
7
8
9
10
11
Pequeno Porte I
Municpio
Valor_ITR
Barra do Guarita
533,70
Vista Gacha
922,33
Nova Candelria
946,85
Miragua
1.324,74
Esperana do Sul
1.724,62
Boa Vista do Buric
1.902,02
Bom Progresso
2.369,08
Humait
2.519,68
Braga
4.145,13
Sede Nova
4.554,22
So Martinho
5.514,40
Total
26.456,77
VR
2,02
3,49
3,58
5,01
6,52
7,19
8,95
9,52
15,67
17,21
20,84
100,00
N
1
2
3
4
5
6
7
8
9
Pequeno Porte II
Municpio
Valor_ITR
Tiradentes do Sul
2.944,97
Tenente Portela
3.703,25
Derrubadas
4.060,42
Trs Passos
5.196,27
Crissiumal
5.417,75
Redentora
6.674,59
Dr Maurcio Cardoso
7.660,00
Horizontina
8.291,42
Campo Novo
15.989,17
Total
59.937,84
VR
4,91
6,18
6,77
8,67
9,04
11,14
12,78
13,83
26,68
100,00
Fonte: IBGE/cidades.
37
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Estes dados so apresentados em forma de srie numrica pois em ambos os casos, n<20:3
municpios de Pequeno Porte I, nPPI = 11; Municpios de Pequeno Porte I, nPPII = 9. Agrup-los
e distribu-los em intervalos invivel porque ocorre muita perda de informao. Como so
valores quantitativos, procurou-se avaliar a contribuio total em cada grupo de municpios e a
participao de cada um deles nesse montante. Para calcular essa participao utilizamos o VR
= valor relativo, isto , a parte da cada municpio dentro do total do grupo.
Comentrio 5: O montante arrecadado de ITR nos Municpios de Pequeno Porte nvel II
aproximadamente o dobro do outro grupo, perfazendo quase 60 mil reais. O municpio que
mais contribui para o primeiro montante (R$ 26.456,77) So Martinho, que arrecada 20,84%
do valor total. O municpio que mais contribui para o segundo montante (R$ 59.937,84)
Campo Novo, que arrecada 26,86% do valor total. Aproximadamente 90,9% dos municpios de
Pequeno Porte I apresentam baixa arrecadao de ITR, enquanto que no grupo de municpios
de Pequeno Porte II, 66,7% dos municpios apresentam arrecadao mdia.
Com esse resultado poderamos formar 2 grupos de arrecadaes do ITR, apresentados a
seguir mediante tabelas simples, pois criaram-se a partir dessa informao estatstica dois grupos:
com baixa e mdia arrecadao, visualizados na Tabela 6:
Tabela 6: Classificao dos municpios segundo o porte e valor de ITR arrecadado na Microrregio de Trs Passos
Arrecadao
Intervalo
Baixa
Mdia
Total
< R$ 5.000,00
R$ 5.000,00
Pequeno Porte I
N
%
10
90,91
1
9,09
11
100,00
Pequeno Porte II
N
%
3
33,33
6
66,67
9
100,00
38
EaD
b. que o Ls seja includo no ltimo intervalo, entendendo-se neste caso que o limite final do ltimo
intervalo no pode ser o Ls, mas tem de estar obrigatoriamente contido nele;
c. que todos intervalos precisam ter frequncia maior do que zero, isto , fi > 0.
Observadas risca estas exigncias, iniciamos o tratamento dos dados para um conjunto de
dados cujo n > 20.
Essa tarefa de sistematizao passa pelo levantamento das informaes bsicas, ordenao
em forma crescente do menor para o maior valor com o Ramo e Folhas, avaliao da ocorrncia de
valores soltos, fora do padro, por meio do Diagrama de Pontos, dimensionamento dos intervalos
mediante a Amplitude Parcial, construo da Distribuio de Frequncias (DF):
Informaes bsicas dos dados
Para iniciar o processo de agrupar os dados em intervalos precisamos saber o montante
de variao que deve ser distribudo em intervalos, usualmente de tamanho regular. Essas informaes podem ser obtidas sem qualquer tratamento prvio: n nmero de dados; Li valor
mnimo da distribuio de valores; Ls valor mximo do conjunto de observaes. De posse destas
informaes podemos calcular a faixa de variao dos dados pela diferena entre o mnimo e o
mximo. Este dado denominado de At = Amplitude total.
N de valores
Menor valor
Maior valor
Faixa de Variao
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Esta ordenao pode ser feita usando o programa Excel que classifica os dados por uma
varivel ou fazer uma ordenao manual. O modo manual comumente utilizado, o da ordenao
visual, muito demorado em grandes amostras. Temos uma outra alternativa, que da organizao em ramos e folhas.
Esta tcnica busca nos dados duas faixas de variao: uma para os ramos de variao
mais demorada, construda a partir da avaliao dos limites Li e Ls computada anteriormente
para o caso. Observamos de quanto a quanto os dados variam e construmos faixas de referncias de maior amplitude; outra para as folhas, que uma faixa de variao mais rpida dentro
da maior.
Por exemplo, se escolhemos uma variao nas dezenas para os Ramos, nas Folhas a variao ser das unidades. Aps organizar o Ramo e folhas, alocamos cada observao no Ramo
adequado e registramos a parte da observao que no aparece no ramo. A apresentao do Ramo
e Folhas fica assim, se as informaes bsicas fossem estas (referentes ao ITR dos municpios de
Pequeno Porte I da Microrregio de Trs Passos):
1902
2369
4145
15989
5418
4060
7660
1725
8291
2520
1325
947
6675
5514
4554
3703
2945
5196
922
40
EaD
FOLHAS
534
725
947
902
325
369
520
703
145
418
6
7
FOLHAS
922
534
725
922
947
325
902
945
369
520
945
703
.060
554
.060
145
554
514
196
196
418
514
675
675
660
660
291
291
15
989
15
989
Com essa tcnica olhamos os dados apenas uma vez. So distribudos inicialmente j nas
faixas certas e posteriormente ordenados em cada faixa, de forma rpida.
Diagrama de Pontos
Outra tcnica importante para verificar se a padronizao dos dados est garantida, isto
, se no h nem um valor muito fora do padro, o Diagrama de Pontos. Faz-se uma rgua
parcial, dando conta da variao dos dados e se desenha um ponto para cada valor, respeitando
a primeira casa das Folhas apenas.
Com isso, ser possvel verificar se algum dos valores est muito fora do esquema e tambm concluir sobre a forma provvel da distribuio dos dados. Vamos enxergar as regies de
concentrao dos valores, e tambm, conseguimos visualizar as faixas de disperso em que os
pontos se tornam mais raros, dispersos.
Chamamos os valores fora do padro de pontos isolados, tecnicamente so os outliers.
Estes valores precisam ser reconhecidos, pois atrapalham a distribuio das observaes nos
intervalos, constituindo uma quebra da terceira regra que impe uma exigncia de frequncia
maior do que zero em todos os intervalos. Se a distncia entre o penltimo ponto e o outlier for
muito grande corremos o risco de ter fi = 0. Neste caso, este ponto deve ser descartado, colocado
em uma observao e o padro ser calculado com os pontos restantes. Necessariamente vamos
ter que redimensionar o n, Li ou Ls e o At. Vejamos como fica no exemplo dos Quadros 5 e 6.
41
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
10
11
12
13
14
15
Neste Diagrama de Pontos observamos perfeitamente que a maioria dos municpios apresenta ITR de 0 a 8 mil reais; este , portanto, o padro destes municpios, no entanto encontramos
um valor que pode ser considerado um outlier: o 15.989. Ele se encontra afastado dos demais e
no poder ser agrupado, est fora do padro. Existe um vazio entre ele e o valor imediatamente
anterior de mais de 7.500 reais. O tratamento dos dados deve colocar este valor parte e informar
que temos um caso de valor fora do padro, outlier, portanto.
No se trata de perda de informao, mas sim de trat-la em separado para evitar tendenciosidades nas estatsticas. Os outliers tanto podem ser informaes corretas que apresentam
uma outra tendncia que no a do grupo de dados mais homogneos, quanto pode ser valor
incorretamente observado.
Excluindo-se este valor as informaes bsicas modificam e passam a ser:
Quadro 8: Informaes bsicas readequadas ao novo cenrio de ocorrncia de outlier
n=
Li =
Ls =
At =
19
R$ 534,00
R$ 8.291,00
R$ 7.757,00*
EaD
O nmero de intervalos pode variar entre 4 e 10, tendo em vista que agrupar os dados pretende
facilitar a viso do conjunto de dados. Nesse caso o excesso de intervalos acabaria diluindo a
informao de forma a prejudicar a anlise. O nmero de intervalos dado pela
n . Caso o
resultado dessa raiz for superior a 10, possvel adaptar para um resultado mais favorvel.
A amplitude parcial (hi) o tamanho do intervalo, este resulta da aplicao de uma frmula,
cuja resposta deve ser olhada apenas como um indicador do entorno de amplitude a ser empregada. O ajuste deve sempre favorecer a visibilidade da informao, por isso nem sempre
o valor encontrado diretamente utilizado. necessrio fazer uma aproximao do mesmo
de forma a atingir os objetivos de sua utilizao. Essa aproximao permanece no entorno do
valor encontrado.
hi =
At
n
,. At = Ls Li
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
fr % =
xi
* 100
n
fr%ac: frequncia relativa percentual acumulada, a primeira repete, a segunda fr%ac2= fr%ac1+
fr%2
Vejamos esta sequncia de tratamentos aplicados ao exemplo dos municpios da Microrregio de Trs Passos no que se refere ao ITR.
Informaes bsicas aps o ajuste de outlier
Como foi observada a presena de um outlier, a sua supresso gera modificaes nas
informaes bsicas.
Quadro 9: Informaes bsicas readequadas ao novo cenrio de ocorrncia de outlier
n=
Li =
Li =
At =
19
R$ 534,00
R$ 8291,00
R$ 7.757,00
hi =
At
n
7.757,00 7.757, 00
=
= 1779,57 2. 000,00
4,3589
19
2.000
4.000
6.000
8.000
|-------|-------|-------|-------|-------
fi
fa
fr%
fr%ac
4.000
6.000
6
4
6
6
10
16
31,58
21,05
31,58
31,58
52,63
84,21
8.000
18
10,53
94,74
19
5,26
100,00
19
100,00
2.000
10.000
Fonte: IBGE/cidades.
Obs.: Exceto o municpio de Campo Novo com valor do ITR= R$15.989,17, representando 26,68% do
imposto arrecadado na microrregio, considerado outlier, isto , valor isolado, pois se encontra fora do
padro dos demais municpios.
44
EaD
Comentrio 7: A arrecadao de ITR constitui-se de valores baixos (de 500 a 8,5 mil reais),
caracterizando pequenas propriedades na Microrregio, excetuando-se Campo Novo, que
apresenta um valor mais elevado, acima de R$ 15.000,00. Observa-se que em 84,21% dos
municpios a arrecadao do ITR foi inferior a 6 mil reais. Na faixa de menos de R$ 2.000,00
se concentram 31,58% dos municpios.
Na sequncia de nossos estudos vamos verificar como a utilizao de grficos facilita a
leitura dos dados que foram sistematizados em tabelas. A diferena entre usar tabela ou grfico
est na agilidade da informao ou no seu detalhamento: o grfico d um impacto direto, permitindo a visualizao rpida do comportamento geral dos dados, enquanto a tabela vai deixar
que o leitor conhea todos os detalhes desse comportamento, exigindo maior tempo de avaliao
para uma melhor compreenso do fenmeno. Vamos adiante?
Seo 2.4
Representao Grfica e Sua Leitura
Nada melhor do que um grfico para potencializar uma viso geral e rpida do comportamento dos dados. Os diagramas de colunas, barras, setores (pizza), linhas, pontos, so os mais
utilizados para apresentar tabelas simples e cruzadas e o histograma, polgono de frequncias e
setores (limitado a 7 intervalos na DF) para representar a distribuio de frequncias. O grfico
pode ser feito manualmente ou com auxlio de um software tipo Excel.
Um cuidado que devemos ter o de fazer uma escolha, ou utilizamos a tabela ou o grfico, nunca os dois ao mesmo tempo, pois apesar de permitirem vises diferenciadas (a tabela
um olhar detalhista, o grfico uma viso mais geral), as informaes so as mesmas, e faremos
uma repetio desnecessria e incmoda para o leitor. A nossa anlise que vai definir o que
pretendemos enfatizar naquele momento, permitindo a escolha.
A composio do grfico agrega essencialmente o ttulo, a figura e a fonte:
Ttulo: deve identificar a varivel apresentada, a populao de origem, local e tempo de ocorrncia. Quer dizer, o leitor do grfico deve ficar perfeitamente situado em relao s informaes
que lhe esto sendo apresentadas. O ttulo pode ser colocado na parte superior ou inferior da
figura, pode ser numerado e seguir um mesmo padro em todos eles.
Figura: A figura deve identificar as informaes que esto sendo apresentadas em cada eixo, de
preferncia apresentar os valores em % para permitir comparaes, uma vez que o valor absoluto
s permite comparaes quando os n so iguais. Outro cuidado extremamente importante
45
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
relativo escala de apresentao dos dados. Deve-se ter o cuidado de apresentar como se fosse
uma rgua, respeitando a base decimal. Algumas dicas na escolha dos grficos: escolha o de
colunas, se as categorias forem palavras curtas ou siglas; opte pelo de barras se as categorias
forem palavras longas ou expresses; adote o de linhas se estiver apresentando uma varivel
temporal, isto , que evolui no tempo; escolha o de setores (pizza) se o objetivo for comparar o
desempenho das alternativas e estas forem num nmero mximo de 7 categorias; o histograma
de frequncias se quiser representar uma Tabela de Distribuio de Frequncias.
Fonte: imprescindvel informar a fonte dos dados para agregar credibilidade e possibilidade
de voltar informao original se for o caso.
Um grfico sem estas trs partes no considerado um grfico.
Vejamos alguns EXEMPLOS de grficos:
GRFICO DE COLUNAS
Grfico 1: Distribuio dos municpios da Microrregio de Trs Passos
Grficosegundo
1: Distribuio
dosdemogrfica
municpios(hab./km
da Microrregio
2
a densidade
) RS/2007de Trs
Passos segundo a densidade demogrfica (hab./km) RS/2007
8
Municpios 4
2
0
1
(< 10)
(20 a 29)
(30 a 39)
(40 e mais)
Habitantes/km
Fonte: IBGE
Fonte: IBGE.
Comentrio: De forma geral podemos observar que a Microrregio de Trs Passos apresenta
uma densidade demogrfica igual a 20 hab./km, indicando uma boa concentrao populacional. O que mais ocorre so municpios com densidade entre 20 e 29 hab./km. O que menos
ocorre so municpios com pouca densidade, inferior a 10 hab./km.
46
EaD
GRFICO DE BARRAS
Grfico 2: Distribuio dos municpios da Microrregio de Trs Passos por porte RS/2007
2 - Pequeno Porte II
(20 a 50 mil hab.)
Porte
11
1 Pequeno Porte I
(at 20 mil hab.)
0
10
12
N de muncpios
Fonte: IBGE
Fonte: IBGE.
Comentrio: A Microrregio de Trs Passos formada por 20 pequenos municpios. Observase que 55% deles so classificados como Pequeno Porte nvel I (< de 20 mil hab.) e 45% deles
como Pequeno Porte nvel II (de 20.001 a 50 mil habitantes).
10%
5%
35%
50%
1) No industrializado
2) Pouco industrializado
3) Mdia industrializao
4) Industrializado
Fonte: IBGE.
47
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Comentrio: A sociedade em geral tem a percepo que um municpio deve incentivar investimentos na instalao de indstrias visando a potencializar a criao de empregos. Observamos que 50% dos municpios tm de 5 a 10,9 indstrias/10 mil habitantes, uma concentrao
mdia. Apenas 5% das comunidades so No Industrializadas, certamente com atividades
mais rurais.
GRFICO DE LINHAS
Grfico
4: N de agncias
financeiras
no municpio
Grfico 4: N de agncias
financeiras
no municpio
Microrregio
de- Trs Passos RS/2007
Microrregio de Trs Passos - RS/2007.
50
40
30
20
10
0
0
N de Agncias
Fonte : IBGE
Fonte: IBGE.
Comentrio: Numa sociedade capitalista como a nossa, a funo das agncias financeiras
canaliza as movimentaes, no entanto, o avano das agncias virtuais por meio da Internet
minimiza a necessidade do acesso fsico no local de moradia. A agncia presencial facilita
a soluo de problemas por potencializar o contato pessoal. Na Microrregio, 45% das localidades no tm agncia financeira e isto explicado pelo porte dos municpios. Apenas trs
municpios apresentam trs ou mais agncias.
66,8
63,6
60
40
22,2
20
18,2
11,1
18,2
0
0
1
N de Agncias
Pequeno I Pequeno II
Fonte: IBGE.
48
2 ou mais
EaD
Comentrio: A anlise dessa viso bidimensional corrobora com a opinio emitida no grfico
anterior. Os municpios que no tm agncia financeira so 63,6% dos de pequeno porte I
e os que possuem 2 ou mais agncias so 66,8% dos municpios de pequeno porte II. Desta
forma podemos verificar que existe uma associao entre a presena de agncias financeiras
e o porte do municpio na Microrregio de Trs Passos.
HISTOGRAMA DE FREQUNCIAS
Grfico 6: Arrecadao do ITR - Imposto Territorial Rural por
31,58
31,58
21,05
10,53
2.000
4.000
6.000
8.000
10.000
ITR (R$)
Fonte:
IBGE.
Fonte:
IBGE
Comentrio: Entendemos que a Microrregio de Trs Passos tem uma tradio de pequenas
propriedades rurais e produo de alimentos com mo de obra familiar. As duas faixas de arrecadao que concentram os municpios incluem aqueles que arrecadam ITR < R$ 2.000,00
(31,58%) e ITR no intervalo de 4 a 6 mil reais tambm com 31,58% dos municpios. No geral,
85% das localidades arrecadam menos de R$ 6.000,00.
Nesses exemplos foi possvel comprovar que visualizar as informaes das tabelas por
meio de grficos torna a informao muito mais dinmica e rpida, porm tem suas limitaes
em termos de detalhes. Vejamos agora como aplicar estes conhecimentos. Seguem-se alguns
bancos de dados que precisam ser trabalhados conforme o conhecimento exemplificado at agora: tabelas simples uni e bivariadas, grficos, comentrios. Agilize-se e mostre o que aprendeu,
aproveitando para refazer os exemplos ampliando seu conhecimento.
Seo 2.5
Aplicaes
Para desenvolver habilidades na aplicao dos conceitos e tratamentos apresentados anteriormente, solicitamos que aplique o tratamento adequado nos seguintes bancos de dados:
49
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
1) Banco de dados nmero 2 apresenta algumas variveis sociais da Mesorregio Centro Ocidental Rio-Grandense por municpio, fornecidas pelo IBGE, com classificaes que foram
pesquisadas em artigos publicados na Internet para serem aqui atribudas. Como vimos, o RS
constitudo de sete mesorregies. A Centro-Ocidental abrange trs microrregies (Santiago,
Restinga Seca e Santa Maria) e 31 municpios. A abordagem pretendida com este tratamento
estatstico visa a construir um panorama referencial de informaes que dizem do exerccio
da democracia e cidadania por meio de Indicadores Sociais. Aproveite e complete os espaos
pontilhados:
Quadro 10: Informaes sobre variveis e categorias 456
N: N de ordem dos registros
Municpio: Varivel ............................ pois seus valores so ................................................................................;
X1: ndice de Pobreza, Varivel...............................................................................................................................;
X2: Classificao do ndice de Pobreza, Varivel aleatria ...................................................................................,
sendo 1) Baixa proporo (<15%); 2) Mdia Proporo (15 a 29%); 3) Alta proporo ( 30%)4
X3: ndice de Pobreza Subjetiva, V. A. ....................................................................................................................
X4: Classificao da Pobreza Subjetiva , V. A. ........................................................................................................
X5: ndice de Gini, Indicador de distribuio de renda, V. A. ...............................................................................
X6: Classificao do IG V. A. ........................... (0 a 8, (0-Igualdade e 8-Desigualdade), 0 -< 25; 1 25 a 29,9;
2 30 a 34,9; 3 35 a 39,9; 4-40 a 44,9; 5 45 a 49,9; 6 50 a 54,9; 7-55 a 59,9; 8 60 e mais5
X7: Residentes, V. A. ................................................................................................................................................
X8: Porte do municpio V. A, ...................................; ( 1: Pequeno I at 20 mil hab.; 2: Pequeno II 20001 a
50000; 3: Mdio 50001 a 100000; 4: Grande 100001 a 900000; 5: Metrpole > 900 000.6
www.pnud.org.br/hdr/hdr97/rdh7-1.htm
portalsocial.sedsdh.pe.gov.br/.../Gloss%E1rio%20tabela%20dos%20munic%EDpios.pdf
50
EaD
Quadro 11: Banco de dados n 2: variveis sociais da Mesorregio Centro Ocidental Rio-Grandense por municpio
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
Mun
Agudo
Cacequi
Capo do Cip
Dilermando de Aguiar
Dona Francisca
Faxinal do Soturno
Formigueiro
Itaara
Itacurubi
Ivor
Jaguari
Jar
Jlio de Castilhos
Mata
Nova Esperana do Sul
Nova Palma
Pinhal Grande
Quevedos
Restinga Seca
Santa Maria
Santiago
So Joo do Polsine
So Martinho da Serra
So Pedro do Sul
So Sep
So Vicente do Sul
Silveira Martins
Toropi
Tupanciret
Unistalda
Vila Nova do Sul
Pobreza
17,35
34,21
999
20,31
23,21
21,99
20,37
29,94
25,67
15,96
19,72
20,12
30,37
22,12
28,63
17,49
22,83
22,66
21,02
25,26
26,76
14,18
18,29
26,3
27,43
23,61
18,86
15,79
30,05
25,9
24,67
Cls_pobr
2
3
999
2
2
2
2
2
2
2
2
2
3
2
2
2
2
2
2
2
2
1
2
2
2
2
2
2
3
2
2
Pobresubj
13,55
27,6
999
15,93
18,16
17,05
15,75
23,4
20,48
11,64
14,94
15,9
23,89
16,96
21,25
12,93
16,9
17,95
16,77
18,98
20,75
10,6
13,47
21
20,66
17,91
13,74
11,73
24,12
19,67
19,04
Cls_pobsubj
1
2
999
2
2
2
2
2
2
1
1
2
2
2
2
1
2
2
2
2
2
1
1
2
2
2
1
1
2
2
2
Igini
0,41
0,41
999
0,35
0,42
0,43
0,39
0,39
0,38
0,36
0,39
0,35
0,39
0,37
0,36
0,37
0,37
0,37
0,4
0,44
0,41
0,4
0,35
0,4
0,4
0,39
0,36
0,34
0,39
0,36
0,36
Cls_IG
4
4
999
3
4
4
3
3
3
3
3
3
3
3
3
3
3
3
4
4
4
4
3
4
4
3
3
2
3
3
3
Residentes
16.714
13.629
3.180
3.129
3.572
6.343
7.116
4.633
3.568
2.378
11.626
3.692
19.541
5.291
4.775
6.432
4.496
2.732
15.595
263.403
49.558
2.702
3.409
16.613
23.787
8.361
2.479
3.070
22.556
2.392
4.255
Porte
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
4
2
1
1
1
2
1
1
1
2
1
1
Nossa pergunta relaciona-se com o Perfil da Pobreza na Mesorregio Centro Ocidental RioGrandense.
2) Banco de dados nmero 3 apresenta algumas variveis da Microrregio de Iju, com as
mesmas variveis do banco nmero 2, e responde mesma pergunta anterior, porm nesta
microrregio.
51
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Quadro 12: Banco de dados nmero 3: variveis sociais relacionadas com as condies de acesso
riqueza da Microrregio de Iju por municpio
N
Mun
Pobreza
Cls_
Pobre-
Cls_po-
pobr
subj
bsubj
Igini
Cls_IG
Residentes
Porte
Area_
Cls_
Densi-
Cls_
terr
area
dade
dens
1
2
3
4
5
6
Ajuricaba
Alegria
Augusto Pestana
Bozano
Chiapetta
Condor
19,3
25,42
16,4
999
24,55
23,17
2
2
2
999
2
2
13,79
20,1
11,98
999
19,3
17,76
1
2
1
999
2
2
0,37
0,38
0,37
999
0,37
0,38
3
3
3
999
3
3
7.261
4.789
7.273
2.296
4.078
6.607
1
1
1
1
1
1
323
173
347
201
396
465
2
1
2
2
2
2
22,5
27,7
21,0
11,4
10,3
14,2
4
4
4
4
4
4
Coronel Barros
15,98
12,36
0,35
2.441
163
15,0
8
9
10
11
12
13
14
15
Coronel Bicaco
Iju
Inhacor
Nova Ramada
Panambi
Pejuara
Santo Augusto
So Valrio do Sul
26,81
26,16
32,31
12,36
25,79
22,46
29,16
28,02
2
2
3
1
2
2
2
2
20,75
19,68
25,7
9,44
18,97
16,98
23,47
20,06
2
2
2
1
2
2
2
2
0,39
0,42
0,35
0,35
0,39
0,38
0,4
0,38
3
4
3
3
3
3
4
3
7.873
76.739
2.290
2.461
36.360
3.900
13.622
2.635
1
3
1
1
2
1
1
1
492
689
114
255
491
414
468
108
2 16,0
3 111,4
1 20,1
9,7
2
2 74,1
9,4
2
2 29,1
1 24,4
4
3
4
4
4
4
4
4
Fonte: IBGE/cidade.
V. A. .....................
Cls_rea
V. A. ..................... (1. Pequeno (<200 km); 2. Mdio (200 a 500 km); 3. Grande (> 500 km)
Densidade Demogrfica
(hab./km)
Cls_densidade
V. A. .....................
V. A. ..................... (1. < 10; 2. 10 a 19; 3. 20 a 29; 4. 30 a 39; 5. 40 e mais)
52
EaD
na
srie
Tx desocupao
no
quer
trab
Cart
assim
Ms
Perodo
na
srie
Tx desocupao
no
quer
trab
Cart
assim
Ms
Perodo
na
srie
Tx desocupao
no
quer
trab
Cart
assim
mar/02
10,4
77,7
47,6
ago/04
30
7,3
84,8
47,6
jan/07
59
8,1
85,3
49,3
abr/02
11,2
80,7
48,1
set/04
31
8,4
86,5
47,3
fev/07
60
7,5
85,0
49,7
mai/02
10,8
80,0
49,3
out/04
32
7,0
87,3
46,9
mar/07
61
7,3
86,1
50,3
jun/02
9,4
80,3
47,3
nov/04
33
7,2
86,9
47,9
abr/07
62
7,1
86,1
48,8
jul/02
9,8
79,5
47,8
dez/04
34
6,5
88,7
46,4
mai/07
63
6,5
86,9
49,1
ago/02
8,5
80,7
47,4
jan/05
35
6,9
87,2
47,0
jun/07
64
7,8
87,4
49,5
set/02
9,4
81,7
47,8
fev/05
36
6,6
87,3
47,9
jul/07
65
7,5
88,2
49,3
out/02
8,3
79,8
47,0
mar/05
37
6,9
88,0
49,2
ago/07
66
7,9
88,8
50,8
nov/02
8,7
80,8
46,6
abr/05
38
6,5
87,3
49,5
set/07
67
6,7
89,0
49,8
dez/02
10
7,5
79,8
48,5
mai/05
39
6,9
86,6
49,2
out/07
68
5,9
89,3
49,3
jan/03
11
8,2
80,8
49,6
jun/05
40
6,2
86,0
49,6
nov/07
69
5,9
89,2
50,1
fev/03
12
8,7
81,8
49,1
jul/05
41
5,7
87,2
49,7
dez/07
70
5,1
88,6
50,2
mar/03
13
9,8
80,9
48,0
ago/05
42
6,7
87,0
49,7
jan/08
71
5,6
87,2
52,1
abr/03
14
9,3
79,0
47,2
set/05
43
7,6
87,9
48,9
fev/08
72
6,1
87,9
50,6
mai/03
15
9,7
79,4
46,9
out/05
44
6,4
88,4
49,1
mar/08
73
5,5
88,2
50,6
jun/03
16
11,0
81,5
45,7
nov/05
45
7,2
90,0
48,9
abr/08
74
6,9
87,0
50,3
jul/03
17
9,3
81,7
45,1
dez/05
46
6,5
89,1
49,8
mai/08
75
6,0
86,1
50,4
ago/03
18
10,0
82,9
47,2
jan/06
47
7,8
88,1
49,1
jun/08
76
5,9
86,3
50,9
set/03
19
10,6
83,2
46,9
fev/06
48
7,1
89,0
49,4
jul/08
77
5,8
86,6
52,1
out/03
20
9,9
84,3
47,7
mar/06
49
8,0
90,6
48,7
ago/08
78
5,6
87,4
51,0
nov/03
21
9,0
84,8
46,5
abr/06
50
7,8
91,0
48,8
set/08
79
5,6
87,7
51,4
dez/03
22
7,0
84,5
47,0
mai/06
51
8,9
88,4
48,6
out/08
80
5,7
87,9
51,5
jan/04
23
7,6
84,4
48,4
jun/06
52
7,9
87,4
48,4
nov/08
81
5,0
89,4
51,1
fev/04
24
7,4
84,4
48,2
jul/06
53
9,3
86,9
48,7
dez/08
82
4,4
86,8
51,6
mar/04
25
9,1
84,4
48,4
ago/06
54
7,7
87,0
49,2
jan/09
83
5,5
87,2
53,1
abr/04
26
9,2
83,5
48,4
set/06
55
8,1
88,1
49,9
fev/09
84
6,0
87,4
53,2
mai/04
27
8,8
86,2
48,0
out/06
56
8,2
88,7
49,8
mar/09
85
6,0
88,4
52,0
jun/04
28
8,7
84,0
48,6
nov/06
57
7,3
88,8
49,5
jul/04
29
7,8
83,9
47,8
dez/06
58
6,2
87,1
48,9
53
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Quadro 15: Banco de dados nmero 5: participao dos idosos e populao com 100 anos ou mais por UF/BR
Situao do domiclio
Urbana
Sexo
Idade
SP
Rural
Homens
100 ou
mais
Mulheres
100 e
60 e mais
mais/ 10
mil
87
464.003
100 ou
mais
Homens
100 e
60 e mais
mais/
10 mil
97
334.542
100 ou
mais
Mulheres
100 e
60 e mais
100 ou
mais/
10 mil
11
68.376
mais
100 e
60 e mais
mais/ 10
mil
17.690
RO
21.668
15.403
16.795
3.470
TO
24805
11
19721
13750
3171
PI
23
56.578
34
55.083
13
48.145
18.706
SC
22
102.609
32
79.422
45.780
14.038
CE
36
100.831
57
84.344
34
95.875
17
37.972
MO
16
55.743
14
37.788
21.794
3.659
PR
49
171.130
56
127.382
14
76.137
14
22.173
MS
21
59.602
15
45.913
14.288
3.140
PA
19
54.159
26
42.259
18
55.138
12
18.417
ES
19
40.829
41
31.419
13
24.310
7.625
MA
41
93.405
72
94.528
26
74.394
27
36.347
RS
32
188.766
76
156.827
14
101.524
24
32.002
AL
22
53.694
38
55.859
14
28.371
12
14.965
PB
37
87.113
58
90.234
23
45.917
20
21.044
10
PE
49
106.659
86
108.769
22
68.573
34
33.805
10
MG
139
369.719
235
303.217
49
156.357
57
55.542
10
GO
45
89.364
53
68.289
31.069
6.613
11
SE
26
32.837
48
38.943
12
19
19.580
10
15
12.032
12
RJ
31
104.947
53
87.452
18.150
11
8.324
13
BA
133
174.018
253
170.736
15
113
176.287
126
86.580
15
AM
11
39.727
14
38.731
17.301
4.619
17
AP
7336
6832
1381
502
20
RR
4273
3837
2324
496
20
RN
42
70.127
60
64.739
17
30.472
28
12.852
22
AC
9130
8565
4985
1305
Fonte: IBGE/Estados.
RESUMO DA UNIDADE 2
Esta unidade foi dedicada a descrever um conjunto de dados obtidos por
meio de pesquisa, de levantamentos, de registros, de censos, mediante sua
sistematizao e apresentao em tabelas simples univariadas e bivariadas e grficos. Aprendemos que no se deve representar as informaes
obtidas por meio de grficos e tabelas simultaneamente, pois ambas vo
apresentar as mesmas descries. As tabelas sero elaboradas quando for
necessrio fornecer os detalhes e os grficos quando a inteno for obter
uma viso geral e rpida do comportamento da(s) varivel (eis).
54
EaD
Unidade 3
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Seo 3.1
Quadro-Resumo das Frmulas
As medidas descritivas vo fornecer nmeros tpicos que descrevem o comportamento dos
dados. So elas as Medidas de Tendncia Central e as Medidas de Variabilidade. Para facilitar
o manuseio das frmulas necessrias para o clculo das estatsticas desta unidade vamos iniciar
com um quadro-resumo de frmulas.
As frmulas para o clculo das medidas descritivas so apresentadas somente para variveis
quantitativas com duas opes: para srie numrica (n< 20) e distribuio de frequncias (n
20), em dois quadros: um para as Medidas de Tendncia Central: Mdia ( X ), Mediana (Md)
e Moda (Mo), outro para as Medidas de Variabilidade: Varincia absoluta (s), Desvio padro
(s) e Coeficiente de Variao (CV).
Quadro 1: Quadro-resumo das frmulas das Medidas de Tendncia Central MTC
Me dida s
S r i e Nu m r i c a
Mdia Aritmtica
(
n a a m os t r a e
n a po pu la o )
X =
i =1
N par P =
Me dia n a (M d )
xi
n
n
2
X =
i =1
, a M edi a na
n
2
(li + l s )
f i xi
,... X i =
n
2
a m d i a d o s d o i s v a lo res cen-
P =
t r a i s , i . . , d o P- simo valor e o
seguinte.
n +1
, a M edi a N mpar P =
2
n a o P- s i m o v alor.
lo ca li za r no
Md = li +
(P
f a o i m d,
faa )hi
fi
A m o d a n u m a s rie numrica
o v a l o r m a i s r e p etido, i., com
Moda (M o)
f i lo ca li za r no > f i o i m o , i nter-
c o n c e n t r a o m xima. A srie
pode ser:
reti ra to do s o s da do s.
Am o d a l s e m m oda
d1
hi
Mo = li +
+
d
d
2
1
,
d1 = f m f ant d 2 = f m f post
U n i m o d al u m va lo r m o da l
B i m o d al d o i s va lo res m o da i s
P l u r i m o d a l m a is de do i s v a lo r e s m ai s r e p e t i d o s
f m : frequncia mxima
f ant : frequncia anterior mxima
f post : frequncia posterior mxima
56
EaD
Entendemos que ser fcil para o estudante visualizar e comparar as diferenas que as frmulas apresentam quando so utilizadas em sries numricas ou distribuies de frequncias.
Fundamentalmente, compreendemos que a srie no apresenta grande dificuldade de
obteno das informaes e de compreenso de seu significado e do que elas indicam no caso
da tendncia central, pois apresenta uma listagem dos dados. A maior complexidade do clculo na distribuio de frequncias deve-se ao fato de que os intervalos no do visibilidade ao
valor em si, mas ao nmero de ocorrncias dentro do intervalo, respectiva faixa de variao
e principalmente ao fato de que no trabalhamos com o prprio valor, mas sim com um valor
representativo, que o ponto mdio. Isso exige uma certa disposio para recriar a informao.
As frmulas servem para recuper-la. Observa-se que para a Mdia Aritmtica e para a Varincia
as frmulas se modificam apenas pela incluso do Xi ponto mdio no caso da DF.
Srie Numrica
(s ou )
Distribuio de frequncias
n
2
i
x
2
S = (x )
i =1 n
se pequena amostra (n < 30) , aplica
2
Varincia Absoluta
Fator de Correo
n
FC =
n 1
S2 =
i =1
(s ou )
Coeficiente de
Va ria o ( C V )
FC =
S*2 = S. FC
S*2 = S. FC
D e s v io pa d r o
f i xi2
2
(x )
n
S = S2
S = S2
C V > 6 0 % , M o da pa dr o
S
CV = 100
X
S
CV = 100
X
n
n 1
C V < 3 0 % , M di a pa dr o
3 0 % C V 60% , M edi a na pa dr o
C V > 6 0 % , M o da pa dr o
IN 65% = X S ; X + S
In t e r v a lo d e N o rma lida de ( I N ) *
IN 95% = X 2 * S ; X + 2 * S
IN 99% = X 3* S ; X + 3* S
IN 65% = X S ; X + S
IN 95% = X 2 * S ; X + 2 * S
IN 99% = X 3* S ; X + 3* S
57
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Seo 3.2
Medida de Tendncia Central e de Variabilidade
conceitos e operacionalizao
Iniciamos com uma apresentao dos conceitos, propiciando que sejam discutidas as razes
que levam a sua utilizao. A ideia principal, como j foi expresso anteriormente, a de resumir
o comportamento dos dados em nmeros que sirvam de parmetro para sua anlise.
Como a informao mais usualmente empregada, e observa-se que ela influenciada pelos
valores extremos da varivel, importante que verifiquemos como os dados se concentram ou
se dispersam em relao mdia para avaliar a adequabilidade de seu uso ou a necessidade de
buscar medidas alternativas, como a mediana ou a moda.
Cada uma das Medidas de Tendncia Central vai olhar a centralidade dos dados por uma
tica:
Mdia centro em termos de massa
Mediana centro real
Moda centro em termos de concentrao
A variabilidade vai permitir concluir sobre a homogeneidade ou heterogeneidade dos valores obtidos em relao mdia aritmtica:
em sendo homogneos, a distribuio dos valores se concentra em torno da mdia;
em sendo heterogneos, a distribuio dos valores se dispersa em torno da mdia.
58
EaD
MDIA ARITMTICA
MEDIANA
MODA
VARINCIA ABSOLUTA
DESVIO PADRO
COEFICIENTE DE VARIAO
INTERVALO DE NORMALIDADE
de 50% cada
o valor mais frequente no conjunto de dados
MEDIDAS DE VARIABILIDADE
Mede os desvios quadrticos dos valores em relao mdia
Informa o desvio mdio dos valores em relao mdia
Valor relativo da variabilidade em torno da mdia, permite obter uma
concluso sobre a validade da mdia
Intervalo em torno da mdia considerando um afastamento mdio em
relao a ela
As frmulas para o clculo das medidas descritivas so apresentados com duas variaes:
para Srie Numrica e para Distribuio de Frequncias (DF). Como podemos observar no
quadro resumo das frmulas, a principal diferena que na srie temos os valores individualmente e podemos som-los diretamente, enquanto que na DF eles esto dentro de um intervalo
de valores e o que sabemos a sua frequncia, isto , a sua repetio. Nesse caso, temos de
encontrar um valor que represente o intervalo. Este valor ser denominado de Xi, ponto mdio.
na verdade o meio do intervalo que adotamos como se todos os valores do intervalo fossem
iguais a ele. Por exemplo: num intervalo de 10 |----- 20 o ponto central 15 pois (10+20)/2
= 15, X =
i
(li + ls )
59
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
municpios limtrofes. Sua finalidade integrar a organizao, o planejamento e a execuo de funes pblicas de interesse comum, definidas por lei complementar estadual. VA qualitativa no ordenvel. Significado dos cdigos esto no banco de dados.
Mesorregio uma subdiviso dos Estados brasileiros que congrega diversos municpios de uma rea geogrfica com similaridades econmicas e sociais. Foi criada pelo
Mesorregio
IBGE e utilizada para fins estatsticos e no constitui, portanto, uma entidade poltica ou administrativa. VA qualitativa no ordenvel. Significado dos cdigos esto no
banco de dados.
O ndice de Desenvolvimento Humano (IDH) uma medida comparativa que engloba
trs dimenses: riqueza, educao e esperana mdia de vida. uma maneira padronizada de avaliao e medida do bem-estar de uma populao. O ndice vem sendo
IDH-Mdio
usado desde 1993 pelo Programa das Naes Unidas para o Desenvolvimento. Primeiros do mundo Islndia e Noruega IDH = 0,968. Va Quantitativa Contnua pode ser
transformada em VA qualitativa ordenvel ([1. Baixa (0 a 0,499); 2. Mdio (0,5 a 0,799);
3. Alto (0,8 a 1).
O produto interno bruto (PIB) representa a soma (em valores monetrios) de todos os
bens e servios finais produzidos numa determinada regio (quer seja pases, Estados,
cidades), durante um perodo determinado (ms, trimestre, ano, etc.). O PIB um dos
indicadores mais utilizados na macroeconomia com o objetivo de mensurar a ativida-
Densidade
60
EaD
microrregio
cod_
cod_
microrre-
mesorre-
gio
gio
mesorregio
IDH_ mdio
DENSIDADE
24
0,778
R$ 10.771,63
22,7
27
0,824
R$ 7.107,62
31,8
29. Santiago
29
0,781
R$ 11.515,27
10,2
1. Cachoeira do Sul
0,772
R$ 8.085,83
21,1
16. Lajeado-Estrela
16
0,787
R$ 14.741,40
73,6
26
0,782
R$ 15.779,80
57,1
2. Camaqu
0,765
R$ 9.404,93
22,6
12. Gramado-Canela
12
0,819
R$ 10.191,58
113,7
18. Montenegro
18
0,819
R$ 14.885,89
94,4
20. Osrio
20
0,792
R$ 7.222,50
37,1
23
0,829
R$ 11.500,41
665,2
31. So Jernimo
31
0,779
R$ 45.175,33
28,9
7. Caxias do Sul
4 4.Nordeste Rio-grandense
0,852
R$ 17.417,44
153
13. Guapor
13
4 4.Nordeste Rio-grandense
0,823
R$ 17.866,55
35,8
35. Vacaria
35
4 4.Nordeste Rio-grandense
0,754
R$ 11.381,48
9,4
6. Carazinho
5 5.Noroeste Rio-grandense
0,768
R$ 12.005,06
32,9
8. Cerro Largo
5 5.Noroeste Rio-grandense
0,756
R$ 10.470,75
30,17
9. Cruz Alta
5 5.Noroeste Rio-grandense
0,77
R$ 14.709,39
18,9
10. Erechim
10
5 5.Noroeste Rio-grandense
0,778
R$ 12.514,84
38,2
11
5 5.Noroeste Rio-grandense
0,758
R$ 8.743,02
33,8
14. Iju
14
5 5.Noroeste Rio-grandense
0,784
R$ 12.875,91
35,9
19. No-Me-Toque
19
5 5.Noroeste Rio-grandense
0,786
R$ 19.420,57
28,3
21
5 5.Noroeste Rio-grandense
0,797
R$ 13.922,97
45,3
25. Sananduva
25
5 5.Noroeste Rio-grandense
0,775
R$ 11.576,32
19,3
28
5 5.Noroeste Rio-grandense
0,813
R$ 11.606,43
47,1
30
5 5.Noroeste Rio-grandense
0,783
R$ 10.076,02
18,77
33. Soledade
33
5 5.Noroeste Rio-grandense
0,75
R$ 7.294,43
20
34
5 5.Noroeste Rio-grandense
0,779
R$ 13.743,19
36,7
15. Jaguaro
15
6 6.Sudeste Rio-grandense
0,761
R$ 8.115,95
9,3
17
6 6.Sudeste Rio-grandense
0,786
R$ 16.766,70
27,9
22. Pelotas
22
6 6.Sudeste Rio-grandense
0,794
R$ 6.607,87
48,6
32
6 6.Sudeste Rio-grandense
0,744
R$ 8.152,46
7,4
3. Campanha Central
7 7.Sudoeste Rio-grandense
0,78
R$ 6.780,64
11,8
4. Campanha Meridional
7 7.Sudoeste Rio-grandense
0,777
R$ 8.631,31
12,6
5. Campanha Ocidental
7 7.Sudoeste Rio-grandense
0,789
R$ 10.588,69
12,8
Para compreender a aplicao das medidas descritivas em ambos os casos, SN e DF, vamos
apresentar alguns exemplos usando e analisando as medidas propostas. Retome estes exercciosexemplos, pois esse procedimento muito importante. Se voc o fizer vai ter imediatamente a
noo de que acertou os resultados, pois pode compar-los com os que so apresentados na
seo seguinte.
61
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Microrregio
6. Carazinho
0,768
12.005,06
32,9
0,589824
144.121.465,60
1.082,41
8. Cerro Largo
0,756
10.470,75
30,2
0,571536
109.636.605,56
912,04
9. Cruz Alta
0,770
14.709,39
18,9
0,5929
216.366.154,17
357,21
10. Erechim
0,778
12.514,84
38,2
0,605284
156.621.220,23
1.459,24
0,758
8.743,02
33,8
0,574564
76.440.398,72
1.142,44
14. Iju
0,784
12.875,91
35,9
0,614656
165.789.058,33
1.288,81
19. No-Me-Toque
0,786
19.420,57
28,3
0,617796
377.158.539,12
800,89
0,797
13.922,97
45,3
0,635209
193.849.093,62
2.052,09
25. Sananduva
0,775
11.576,32
19,3
0,600625
134.011.184,74
372,49
10
0,813
11.606,43
47,1
0,660969
134.709.217,34
2.218,41
11
0,783
10.076,02
18,8
0,613089
101.526.179,04
353,44
12
33. Soledade
0,750
7.294,43
20,0
0,5625
53.208.709,02
400,00
13
0,779
13.743,19
36,7
0,606841
188.875.271,38
1.346,89
Total
10,097
158.958,90
405,4
7,845793
2.052.313.096,89
13.786,36
()
Inicialmente vamos calcular a Mdia Aritmtica, a mais conhecida das medidas de Tendncia Central para as 3 variveis (lembrando que X: IDH; Y: PIBpc ; Z: Densidade demogrfica).
62
EaD
X =
i =1
xi 10,097
=
= 0,7766923 ,
n
13
Este IDH um ndice classificado como mdio pelas categorias expressas no Quadro 4, o
que no a pior situao, uma vez que a mdia do Estado de 0,785, ficando, portanto, estatisticamente na mesma situao do Estado.
n
Y =
i =1
yi 158.958,90
=
= R$12.227,61 ,
n
13
Este um PIB per capita mdio, que indica que nossa regio apresenta uma receita econmica insatisfatria, isto , a riqueza produzida no a retira da classificao de regio pobre,
em torno de US$ 7.000,00 (utilizando-se uma base de 2:1), prxima ao valor do estadual, R$
12.504,29, ficando, portanto, um pouco acima da do Estado, mas no seu entorno, indicando que
uma das mesorregies consideradas pobres no Estado, pois fica abaixo de US$ 7.000,00.
n
Z =
i =1
zi 405, 4
=
= 31,18hab. / km ,
n
13
Esta uma baixa densidade, uma vez que a mdia do Estado de 54,64 hab./km, ficando,
portanto, abaixo da do Estado, entendendo-se que pouco povoada, permitindo ainda expanso
em termos populacionais. Outro fator motivador dessa baixa densidade so as reas rurais, que
praticamente esto reduzidas a poucas famlias que resistem e concentrao da rea rural em
propriedades maiores com expanso do latifndio e s migraes urbanas em busca de melhores
condies de trabalho pela baixa industrializao da regio.
b. Mediana e Moda
Temos outras medidas descritivas alternativas para a Mdia: a Mediana e a Moda. As
outras medidas de Tendncia Central, Mediana (Md) e Moda (Mo), na srie numrica no dependem de grandes clculos, pois a mediana uma medida separatriz que separa o grupo em
dois, cada um com 50% das informaes e a moda informa qual o valor com maior frequncia,
isto , mais repetido.
Neste caso, a primeira providncia para o clculo destas duas medidas a ordenao dos
dados em ordem crescente. Essa providncia permite que rapidamente se visualize o valor central (Mediana) e o valor com maior repetio (Moda). Vamos agora calcular as outras medidas
de Tendncia Central para cada uma das 3 variveis: X, Y e Z.
63
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
0,750 0,756 0,758 0,768 0,770 0,775 0,778 0,779 0,783 0,784 0,786 0,797
0,813
10
11
12
13
0,75
0,76
0,76
0,77
0,77
0,78
0,78
0,78
0,78
0,78
0,79
0,80
0,81
Para calcular a mediana (Md) consideramos que n = 13 mpar, logo a posio do valor
n + 1 13 + 1
mediano dada por: P=
=
= 7 valor , a mediana ento o P-simo valor de IDH. O
2
2
7 valor se observarmos no Quadro 7 0,778. Assim, conclui-se que 50% das microrregies no
apresenta IDH superior a 0,778, um valor considerado mdio (intervalo de 0,5 a 0,799).
Para calcular a moda (Mo) verificamos quais dentre as microrregies apresentam valores
iguais de IDH, implicando valor mais repetido. Para o caso de considerarmos trs casas decimais,
no encontramos valor repetido no IDH, podendo considerar a srie amodal.
Se considerarmos a aproximao para duas casas decimais, o valor mais repetido 0,78,
que ocorre 5 vezes, conforme pode ser observado no Quadro 7, formando uma srie unimodal.
Neste caso, o valor modal para IDH 0,78, confirmando a ideia de que a Mesorregio Noroeste
Rio-Grandense apresenta um ndice de Desenvolvimento Humano mdio. Como a Mdia de
0,776, Mediana 0,778 e Moda 0,78, podemos afirmar que a Moda no difere significativamente da Mdia e da Mediana e permitindo concluir que:
X Md Mo
Esta igualdade nos informa que estamos diante de dados com muita simetria, cuja concentrao central apresenta todas as 3 medidas, logo a curva dos dados tende a normal, simtrica
com concentrao central.
64
EaD
10
11
12
13
7,3
8,7
10,1
10,5
11,6
11,6
12,0
12,5
12,9
13,7
13,9
14,7
19,4
Para calcular a Mediana (Md), novamente consideramos que n = 13 mpar, logo a posio
n + 1 13 + 1
do valor mediano dada por: P =
=
= 7 valor , a Mediana o P-simo valor que o
2
2
stimo valor do PIBC 12.005,06. Observa-se, portanto, que 50% das microrregies no apresenta
PIB per capita superior a R$ 12.005,06, um valor um pouco abaixo de US$ 7.000,00, confirmando
a classificao como regio pobre. Apenas dois municpios apresentam classificao de Regio
em desenvolvimento.
Para calcular a Moda (Mo), consideramos quais dentre as microrregies apresentam valores iguais de PIBpc. No encontramos valor repetido no PIB, podendo considerar a srie amodal.
Com uma aproximao para milhares, isto , dividindo todos os valores por mil, observamos que
o valor de PIBpc = 11,6 mil reais o nico repetido. Neste caso, como a Mdia de R$ 12.227,61
e a Mediana de R$ 12.005,06, verificamos que a Moda menor do que a Mediana e esta, por
sua vez, menor que a Mdia, indicando uma distribuio assimtrica:
X > Md > Mo
Esta desigualdade nos informa que estamos diante de dados com assimetria, cuja concentrao no central. Apresenta o ponto mais alto da distribuio, a Moda, nos valores mais
baixos, logo a curva assimtrica positiva.
b3.Varivel Z: Densidade
Quadro 9: Varivel densidade, dados ordenados, para obteno da Mediana e da Moda
DENSIDADE
DENSIDADE
18,8
1
19
18,9
2
19
19,3
3
19
20,0
4
20
28,3
5
28
30,2
6
30
32,9
7
33
33,8
8
34
35,9
9
36
36,7
10
37
38,2
11
38
45,3
12
45
47,1
13
47
65
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Para calcular a Mediana (Md), novamente consideramos que n = 13 mpar, logo a posin + 1 13 + 1
o do valor mediano dada por: P =
=
= 7 valor , a Mediana o P-simo valor que
2
2
densidade= 32,9 hab./km. Observa-se, portanto, que 50% das microrregies no apresenta
densidade inferior a 32,9 hab./km, um valor um pouco maior que o valor mdio, que de 31,2
hab./km.
Para calcular a Moda (Mo), consideramos quais dentre as microrregies apresentam valores iguais de densidade. No encontramos valor repetido na densidade, podendo considerar
a srie amodal. Com uma aproximao para inteiros observamos que o valor de densidade =
19 hab./km o nico repetido. Neste caso, a Moda menor do que a Mediana e esta maior
do que a Mdia, indicando uma distribuio assimtrica, no entanto no dentro do padro, e
podemos concluir que:
X < Md > Mo
Esta desigualdade nos informa que estamos diante de dados com assimetria, cuja concentrao no central. Apresenta o ponto mais alto da distribuio, a Moda, nos valores mais
baixos, mas como a Mediana maior que a Mdia, podemos entender como uma curva tendendo
assimtrica negativa.
c. Medidas de Variabilidade
Para avaliarmos qual das trs medidas de Tendncia Central (Mdia, Mediana ou Moda)
consegue apresentar melhor o padro dos dados avaliamos a variabilidade. Como a Mdia
a mais utilizada e uma medida paramtrica, esta o melhor nmero tpico para evidenciar
a forma do padro de afastamento dos valores observados. Eles estabelecem uma relao, informam a variao em torno da Mdia. Vamos analisar a homogeneidade (valores distribudos
proximamente Mdia) ou heterogeneidade (valores muito espalhados, dispersos em relao
Mdia) dos dados com base nos afastamentos.
Entende-se que se a variao relativa dos afastamentos em torno da Mdia forem menores
do que 30%, esta considerada baixa, aceitvel, ento a Mdia representativa, vlida como
padro dos dados; caso a variao fique entre 30% e 60%, a variao considerada grande,
66
EaD
grupo heterogneo, e a melhor medida para informar o padro a Mediana; em ltimo caso, se
a variao for maior que 60%, sem limite final, o grupo heterogneo e a medida que pode ser
considerada um padro para os dados a Moda.
()
CV
S 2 = [
i =1
xi2
2 n , com fator de correo para pequenas amostras
(x ) ]
n 1
n
Vamos utilizar os somatrios que j foram realizados junto ao banco de dados. Vamos precisar da soma de xi, entendendo-se que cada valor da varivel vai ser colocado ao quadrado e
por fim somado.
n
S 2 = [
i =1
xi2
7,845793
2 n
13
(x ) ]
=[
(0,7766923)]* = 0,000294243
n 1
n
13
12
Apesar de este valor estar expresso na mesma unidade de valor da varivel, como uma
mdia quadrtica, isto , de diferenas elevadas ao quadrado, o resultado no vai ser avaliado
efetivamente.
Desvio Padro (s)
A partir deste momento os clculos seguem em sequncia, por isso o melhor deix-los
no visor da calculadora, sem deslig-la.
0,01753533
S
CV = 100 =
*100 = 2, 26%
X
0,7766923
67
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
S 2 = [
i =1
xi2
2 n , com fator de correo para pequenas amostras
(x ) ]
n 1
n
Vamos empregar os somatrios que j foram realizados junto ao banco de dados. Vamos
precisar da soma de xi, entendendo-se que cada valor da varivel vai ser colocado ao quadrado
e por fim somado.
n
S 2 = [
i =1
xi2
2.052.313.096,89
2 n
13
(x ) ]
=[
(12227,61)]* = 9.052.107,829
n 1
n
13
12
Apesar de este valor estar expresso na mesma unidade de valor da varivel, como uma mdia quadrtica, isto , de diferenas elevadas ao quadrado, no vai ser avaliado efetivamente.
Desvio Padro (s)
A partir deste momento os clculos seguem em sequncia, por isso o melhor deix-los
no visor da calculadora, sem deslig-la.
3.008,672104
S
CV = 100 =
X
12.227,61
*100 = 24,6%
EaD
xi2
2 n
, com fator de correo para pequenas amostras
S = [ (x ) ]
n 1
i =1 n
n
Vamos utilizar os somatrios que j foram realizados junto ao banco de dados. Vamos precisar da soma de xi, entendendo-se que cada valor da varivel vai ser colocado ao quadrado e
por fim somado.
xi2
13.786,36
13
2 n
(31,18)] * = 95, 6549 [hab./km]
S = [ (x ) ]
=[
13
12
n 1
i =1 n
2
Apesar de este valor estar expresso na mesma unidade de valor da varivel, como uma mdia quadrtica, isto , de diferenas elevadas ao quadrado, no vai ser avaliado efetivamente.
Desvio Padro (s)
A partir deste momento os clculos seguem em sequncia, por isso o melhor deix-los
no visor da calculadora, sem deslig-la.
9,780332305
S
CV = 100 =
*100 = 31, 4%
X
31,18
Como 30%<CV<60%, pois o desvio encontrado representa 31,4% de afastamento em relao mdia, podemos afirmar que se trata de um grupo heterogneo e o padro da densidade
demogrfica no bem informada pela Mdia, sendo indicado usar a Mediana Md=32,9 hab./
km, indicando que a Mesorregio Noroeste Rio-Grandense tem um padro baixo de povoamento,
havendo espao ainda para o crescimento populacional.
69
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
EaD
Neste momento, ao tratar do mbito estadual, vamos trabalhar com dados agrupados em
faixas empregando a Distribuio de Frequncias. No vamos desenvolver os clculos para a
construo da DF, mas apresentaremos as informaes bsicas necessrias para voc refazer
essa construo.
As medidas de Tendncia Central so medidas de posio, porque posicionam o conjunto
de dados na reta, isto , nos informam sobre os pontos em que ocorrem as respostas de nossas
variveis, neste caso, as mesmas utilizadas anteriormente: IDH-mdio, PIB per capita e Densidade populacional. O tratamento estatstico vai partir de uma DF, com os clculos necessrios
para realizar a anlise pretendida.
a1. Varivel X: IDH-mdio
Vamos comear pelo procedimento usual de agrupamento de dados (construo da Distribuio de Frequncias).
Quadro10: Informaes bsicas sobre o IDH-mdio das microrregies do RS
N
Li
Ls
At
Raiz n
Hi
35
0,744
0,852
0,108
5,916079783
0,018255332
0,02
Valores de Xi
|------|------|------|------|------|------Total
0,76
0,78
0,80
0,82
0,84
0,86
fi
5
11
12
3
3
1
35
fa
5
16
28
31
34
35
fr%
14,29
31,43
34,29
8,57
8,57
2,86
100,00
fr%ac
14,29
45,72
80,00
88,58
97,15
100,00
Xi
0,75
0,77
0,79
0,81
0,83
0,85
fi*xi
3,75
8,47
9,48
2,43
2,49
0,85
27,47
fi*xi
2,8125
6,5219
7,4892
1,9683
2,0667
0,7225
21,5811
71
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Mdia Aritmtica ( x )
Para preparar a DF para o clculo da Mdia precisamos da coluna do Xi, ponto mdio (soma
dos limites do intervalo dividida por 2). Aps obter o ponto mdio, multiplicamos cada um pela
frequncia (fi*xi), que ser a soma dos valores nesse intervalo. Aps o clculo do ltimo produto
somamos e obtemos a soma geral que ser utilizada na frmula, como evidenciamos a seguir:
n
X =
i =1
f i xi 27, 47
=
= 0,785 , IDH-mdio do Estado do RS.
n
35
Apesar de ser um valor alto, ainda no se encontra na faixa dos melhores IDHs, que se inicia
em 0,8. O Brasil entrou pela primeira vez para o grupo de pases com elevado desenvolvimento
humano, com um ndice medido em 0,800 no ano de 2005. Em 2006 obteve uma melhora no
ndice de 0,007, com uma pontuao de 0,807. Encontra-se na 70 colocao mundial, posio
que j mantinha no ano anterior(Wikipdia, IDH, 14/7/2009).
Mediana (Md)
O clculo da Mediana numa DF deve ser feito a partir de uma frmula que recupere o
valor que separa o grupo em duas partes, com 50% cada. Inicialmente precisamos encontrar o
ponto central, ou seja, sua posio (P), que vai nos indicar em qual intervalo se encontra o valor
mediano.
Sua localizao ser feita na coluna do fa, aquele que contm o p-simo valor. Nossa referncia que o valor que se encontra naquele intervalo a posio do ltimo valor que foi contado
naquele intervalo. Nesse caso, o intervalo deve conter o valor P. Explicando mais concretamente,
se os valores do fa so 1, 5, 20,... isto significa que no primeiro intervalo s entrou um dado, do
2 ao 5 entrou no segundo intervalo, do 6 ao 20 no terceiro intervalo e assim por diante. Com
isso, se n=30, P = 15, valor que estar contido no 3 intervalo. Do intervalo mediano, que foi o
selecionado, retiraremos toda a informao necessria. A nica informao que no segue este
critrio o fa a (frequncia acumulada do intervalo anterior ao mediano). Quando o intervalo
mediano ocorrer no primeiro intervalo o fa a ser zero.
P =
n 35
=
= 17,5 l o c a l i z a o f a n o t e rc e i ro i n t e r v a l o , p o i s a s m i c ro r re g i e s
2 2
Md = li +
72
(P f aa )hi
fi
= 0,78 +
(17,5 16)0,02
= 0,7825
12
EaD
d 2 = f m f post = 12 3 = 9
f m : frequncia mxima
d1
1
Mo = li +
hi = 0,78 +
* 0,02 = 0,782
1 + 9
d1 + d 2
X Md Mo
Esta igualdade nos informa que estamos diante de dados com muita simetria, cuja concentrao central apresenta todas as 3 medidas, logo a curva dos dados tende normal, simtrica
com concentrao central, concluindo-se que o grupo bastante homogneo.
73
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
S2 =
i =1
f i xi2
(21,5811)
2
(x ) =
(0,785) = 0,000377857
n
35
S = s = 0,000377857 = 0,019438544
Coeficiente de Variao (CV)
Para avaliar a validade da Mdia precisamos verificar quanto representa o desvio padro
em relao Mdia e aps tirar uma concluso com base no esquema que foi apresentado anteriormente.
0,019438544
S
CV = 100 =
100 = 2, 48%
X
0,785
Observa-se que a Mdia vlida, pois a disperso em torno dela tende a zero, < 30%.
Trata-se de um grupo homogneo de dados com pouqussima variao entre as microrregies,
uma vez que CV = 2,48%, caso tpico de simetria, como vimos anteriormente.
Nesse caso, a aplicao do Intervalo de Normalidade perfeitamente aplicvel.
74
EaD
IN 65% = X S ; X + S =
{0,785-0,0004;0,785+0,0004}={0,7846;0,7854}
IN 95% = X 2 * S ; X + 2 * S =
{0,785-2*0,0004;0,785+2*0,0004}={0,7842;0,7858}
IN 99% = X 3* S ; X + 3* S =
{0,785-3*0,0004;0,785+3*0,0004}={0,7838;0,7862}
Respondendo, ento, questo inicial, formulamos a seguinte concluso:
Concluso: O padro de IDH do Estado gacho 0,785 com pouqussima diferena entre as
microrregies, podendo-se definir este IDH como representativo do comportamento estadual.
Tendo em vista que o IDH variando de 0,5 a 0,799 considerado um ndice de Desenvolvimento Humano mdio, entendemos que o RS apresenta um mdio padro de desenvolvimento.
Observando-se o intervalo de normalidade, conclumos que ainda esto faltando mais investimentos na rea social para que o IDH do Estado supere esse nvel, pois no IN99% o valor
mximo possvel de 0,786, no superando os limites desse intervalo.
a2. Varivel Y: PIB per capita
Vamos comear pelo procedimento usual de agrupamento de dados (construo da Distribuio de Frequncias).
Quadro 11: Informaes bsicas do PIB per capita das microrregies do RS
n
34
Li
R$ 6.607,87
Ls
At
Raiz n
Hi
R$ 19.420,57
12812,7
5,830951895
2197,359922
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Tabela 2: Distribuio do PIB per capita (em milhares de reais) do RS por microrregio
6
9
12
15
18
Valores de Xi
|-------|-------|-------|-------|-------Total
9
12
15
18
21
fi
10
11
8
4
1
34
fa
10
21
29
33
34
fr%
29,41
32,35
23,53
11,76
2,94
100,00
fr%ac
29,41
61,76
85,29
97,06
100,00
Xi
7,5
10,5
13,5
16,5
19,5
fi*xi
75
115,5
108
66
19,5
384
fi*xi
562,5
1212,75
1458
1089
380,25
4702,5
Mdia Aritmtica ( x )
Para preparar a DF para o clculo da Mdia precisamos da coluna do Xi, ponto mdio (soma
dos limites do intervalo dividida por 2). Aps obter o ponto mdio multiplicamos cada um pela
frequncia (fi*xi), que ser a soma dos valores nesse intervalo. Aps o clculo do ltimo produto,
somamos e obtemos a soma geral que ser utilizada na frmula, como evidenciamos a seguir:
n
X =
i =1
f i xi 384
=
= 11, 294 mil reais
n
34
O PIB per capita estadual de R$11.294,00, abaixo do valor mnimo razovel: 7 mil dlares. Este desempenho indica que, no Estado, existem microrregies que fazem decrescer o valor
mdio e pelos padres mundiais uma regio pobre.
Mediana (Md)
O clculo da Mediana numa DF necessita ser feito a partir de uma frmula que recupere
o valor que separa o grupo em duas partes, com 50% cada. Inicialmente precisamos encontrar o
ponto central, ou seja, sua posio (P), que vai nos indicar em qual intervalo se encontra o valor
mediano. Sua localizao ser feita na coluna do fa, aquele que contm o p-simo valor. Deste
intervalo retiraremos toda a informao necessria. A nica que no segue este critrio o valor
do fa a (frequncia acumulada do intervalo anterior ao mediano). Quando o intervalo mediano
ocorrer no primeiro intervalo o valor do fa a ser zero.
n 34
=
= 17 localiza o f a no terceiro intervalo, pois as microrregies 17 at
2 2
a 28 se encontram nesse intervalo mediano, o imd. Seleciona o intervalo e retira todos
P=
Md = li +
76
(P f aa )hi
fi
=9+
(17 10) *3
= 10,91
11
EaD
Com isso, entende-se que 50% das microrregies do RS no ultrapassam um PIB per capita de R$ 10.910,00, tem ndices inferiores, mas no limite de R$ 6.607,87, informando-nos que
no RS a maioria das microrregies pode ser considerada pobre (26 delas tm classificao de
regio pobre, pois o PIB per capita inferior a 7 mil dlares, 9 delas podem ser consideradas em
desenvolvimento, pois o PIB fica entre 7 e 25 mil dlares.
Moda (Mo)
Para obtermos informao sobre o valor que mais ocorre no conjunto de dados, aps o
agrupamento dos valores, devemos nos concentrar no intervalo que agrega o maior nmero
de informaes (> fi). Este ser denominado o intervalo modal. Esta localizao independe da
localizao da Mediana, pois so duas informaes diferentes, no entanto algumas vezes, principalmente em funo da simetria da distribuio, as duas medidas utilizam o mesmo intervalo
como referncia para o clculo. uma coincidncia, no uma regra. Quando o intervalo modal
ocorrer no primeiro intervalo o fant ser zero, e o mesmo ocorre se o> fi se encontrar no ltimo,
nesse caso fpost ser zero.
d 2 = f m f post = 11 8 = 3
a ele o i mo, i n t e r v a l o m o d a l . S e l e c i o n a o
f m : fr e q u n c i a m xi m a
f ant : fr e q u n c i a a n t e r i o r m xi m a
d1
1
Mo = li +
hi = 9 +
*3 = 9,75
1 + 3
+
d
d
1
2
f post : fr e q u n c i a p o s t e r i o r m xi ma
O que mais frequente no Rio Grande do Sul so microrregies que apresentam um PIB
per capita em torno de R$ 9.750,00, um valor muito abaixo do esperado.
Comparando-se as trs informaes
( x = R$ 11.294,00, > ..Md = R$ 10.910,00.. > ...Mo = R$ 9.750,00 ) verificamos que se trata
de uma curva assimtrica positiva, pois a Moda o menor valor difere da Mdia e da mediana
e podemos concluir que:
X > Md > Mo
77
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Esta desigualdade nos informa que estamos diante de dados cuja distribuio assimtrica,
concluindo-se que o grupo heterogneo.
Tendo em vista a necessidade de nos reportarmos Tabela 2 para avaliar a validade da
Mdia, vamos calcular logo a variao em torno da Mdia por meio das Medidas de Variabilidade, antes de passarmos o tratamento das outras variveis.
Medidas de Variabilidade
O PIB per capita mdio do RS vlido como padro para analisar o Estado?
Varincia absoluta (s)
Para calcular a varincia absoluta precisamos de uma coluna com o produto de cada fi pelo
quadrado do Xi, ponto mdio. Ao finalizarmos todos os produtos a soma destes que vai ser
utilizada na frmula. Se n > 30, no h necessidade de aplicar o Fator de Correo [n/(n-1)].
Neste caso n=34 (um dos valores foi isolado por no apresentar o mesmo padro dos demais),
ento a varincia ser calculada sem ele.
n
S =
2
i =1
f i xi2
(4702,5)
2
(x ) =
(11, 294) = 10,75438753milreais
n
34
3, 279388286
S
CV = 100 =
100 = 29,04%
X
11, 294
78
EaD
Observa-se que a Mdia vlida, pois a disperso em torno dela < 30%. Trata-se de um
grupo homogneo de dados com variao entre as microrregies, uma vez que CV = 29,04%,
no limite do permitido em termos de variao tendendo a 30%.
Concluso: que o PIB per capita do Estado gacho R$11.294,00 com pouca diferena entre
as microrregies, podendo-se considerar este PIB representativo do comportamento estadual,
indicando que uma grande parte das microrregies e o prprio Estado podem ser considerados
pobres.
a3. Varivel Z: Densidade
Vamos comear pelo procedimento usual de agrupamento de dados (construo da Distribuio de Frequncias).
Quadro 12: Informaes bsicas da densidade (hab./km) das microrregies do RS
N
34
Li
7,4
Ls
At
Raiz n
Hi
153
145,6
5, 830951895
24, 970194
30
55
80
105
130
155
fi
17
12
2
1
1
1
34
fa
17
29
31
32
33
34
fr%
50,00
35,29
5,88
2,94
2,94
2,94
100,00
fr%ac
50
85,29
91,18
94,12
97,06
100,00
Xi
17,5
42,5
67,5
92,5
117,5
142,5
fi*xi
297,5
510
135
92,5
117,5
142,5
1152,5
fi*xi
5206,25
21675
9112,5
8556,25
13806,3
20306,3
58356,3
79
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Mdia Aritmtica ( x )
Para preparar a DF para o clculo da Mdia precisamos da coluna do Xi, ponto mdio (soma
dos limites do intervalo dividida por 2). Aps obter o ponto mdio, multiplicamos cada um pela
frequncia (fi*xi), que ser a soma dos valores nesse intervalo. Aps o clculo do ltimo produto
somamos e obtemos a soma geral que ser utilizada na frmula, como evidenciamos a seguir.
n
X =
i =1
f i xi 1.152,5
=
= 33,9hab. / km
n
34
n 34
=
= 17 localiza o f a no terceiro intervalo pois as microrregies 17 at
2 2
a 28 se encontram nesse intervalo mediano, o imd. Seleciona o intervalo e retira
P=
EaD
localizao da Mediana, so duas informaes diferentes, no entanto algumas vezes, principalmente em funo da simetria da distribuio, as duas medidas utilizam o mesmo intervalo como
referncia para o clculo. uma coincidncia, no uma regra. Quando o intervalo modal ocorrer
no primeiro intervalo o fa n t ser zero, e o mesmo ocorre se o (> fi) se encontrar no ltimo, ou
seja, fp o s t ser zero.
d 2 = f m f post = 17 12 = 5
f m : frequncia mxima
d1
17
Mo = li +
hi = 5 +
* 25 = 24,3.hab. / km
17 + 5
d1 + d 2
Entendemos que a densidade populacional mais frequente de 24,3 hab./km. Comparandose as trs informaes, ( x = 33,9.hab. / km .. > ..Md = 30.ha. / km .. > ..Mo = 24,3.hab. / km ), verificamos
que se trata de uma curva assimtrica positiva, pois a Moda o menor valor, difere da Mdia e
da Mediana e podemos concluir que:
X > Md > Mo
Esta desigualdade nos informa que estamos diante de dados cuja distribuio assimtrica,
concluindo-se que o grupo heterogneo.
Tendo em vista a necessidade de nos reportarmos Tabela 3 para avaliar a validade da
Mdia, vamos calcular logo a variao em torno da Mdia por meio das Medidas de Variabilidade, antes de realizarmos o tratamento das outras variveis.
Medidas de Variabilidade
A densidade populacional mdia do RS vlida como padro para analisar o Estado?
81
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
S2 =
i =1
f i xi2
(58356,3)
2
(x ) =
(33,9) = 567,1517647(hab. / km )
n
34
S = s = 567,1517647 = 23,81494835.hab. / km
Entende-se que o desvio mdio para mais ou para menos em torno da mdia de 23,815
hab./km.
Coeficiente de Variao (CV)
Para avaliar a validade da Mdia precisamos verificar quanto representa o desvio padro
em relao Mdia e aps tirar uma concluso com base no esquema que foi apresentado anteriormente.
23,815494835
S
CV = 100 =
100 = 70, 25%
X
33,9
Observa-se que a Mdia no vlida, pois a disperso em torno dela > 60%. Trata-se
de um grupo heterogneo de dados com variao entre as microrregies, uma vez que CV =
70,25%. Neste caso a medida padro a ser utilizada a Moda = 24,3 hab./km. Assim sendo, a
densidade populacional do Estado est num padro de baixa ocupao, pois o que mais ocorre
so densidades em torno de 24,3 hab./km.
Concluso: Verificamos que o Estado do RS apresenta um IDH mdio de 0,785, PIB per capita de R$ 11.294,00, inferior ao padro de 7 mil dlares, podendo ser considerado um Estado
pobre, e por fim com baixa densidade demogrfica, uma vez que a mesma de 24,3 hab./
km<100 hab./km2. O Estado reflete uma postura cultural que d destaque educao e
sade, porm ainda est dominado por polticas pblicas que privilegiam a concentrao de
renda, a no realizao da reforma agrria, protegendo a concentrao de terra. Percebe-se
82
EaD
tambm a falta de investimento para o crescimento das regies. Para tanto, importante que
o foco, tanto da organizao e da administrao pblica quanto da sociedade civil, esteja
no cidado e na cidad com vistas a ampliar os espaos de participao popular em todos
os nveis. As estatsticas refletem uma falta de vontade poltica de viabilizar a Qualidade de
Vida com qualidade.
A Estatstica uma cincia presente em todos os aspectos da vida, seja ela humana ou animal, seja ela com elementos no vivos, mas que se repetem na nossa sociedade e/ou na natureza.
Muitos clculos aparentemente, mas que no decorrer de sua aplicao vamos compreendendo
que se trata de formataes que se apoiam umas nas outras, repetindo raciocnios e clculos, com
uma importante contribuio na descrio do comportamento de fatos j ocorridos, na projeo
de resultados, nas tomadas de deciso. Essa nossa inteno com as aplicaes: que voc se
torne apto a conhecer estatisticamente e tomar as melhores decises, com uma grande margem
de segurana.
Como sugesto para tornar esta unidade menos complexa, insistimos que voc se disponha
a refazer os exemplos apresentados antes de partir para as aplicaes. Alm do que, importante
retomar todos os captulos anteriores ao realizar as aplicaes.
Seo 3.3
Aplicaes
Considere o seguinte banco de dados para construir suas questes e desenvolver as estatsticas necessrias para obter as respostas. Este banco traz informaes educacionais da:
Mesorregio 2 Centro Oriental Rio-Grandense com 54 municpios, sendo composta por trs
Microrregies (1. Cachoeira do Sul; 16. Lajeado-Estrela; 26. Santa Cruz do Sul).
Ao fazer o estudo, sugerimos que trabalhe em separado as trs Microrregies, oportunizando duas sries numricas e uma DF:
1. Cachoeira do Sul (n = 7);
16. Lajeado-Estrela (n = 31);
26. Santa Cruz do Sul (n = 16);
Tambm trabalhe estatisticamente a Mesorregio como um todo para comparar os achados
estatsticos.
83
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Mun
Microrregio
MatrEF07
MatrEM07
Matr07
Doc_EF07
Doc_
EM07
Doc07
Nal_
docEF
Nal_
docEM
Nal_
doc07
Cachoeira do Sul
11.889
3.288
15.177
851
265
1116
14
12
14
Cerro Branco
689
171
860
60
14
74
11
12
12
Novo Cabrais
587
154
741
44
12
56
13
13
13
Pantano Grande
1.777
389
2.166
110
28
138
16
14
16
Paraso do Sul
947
231
1178
67
11
78
14
21
15
Passo do Sobrado
825
239
1064
89
16
105
15
10
Rio Pardo
5.679
1.407
7.086
369
123
492
15
11
14
Arroio do Meio
16
2.360
781
3.141
183
52
235
13
15
13
16
1.710
499
2.209
121
35
156
14
14
14
Boqueiro do Leo
16
1.298
240
1.538
106
21
127
12
11
12
10
Canudos do Vale
16
274
274
27
27
10
999
Capito
16
402
127
529
40
16
56
10
Colinas
16
257
66
323
26
12
38
10
Coqueiro Baixo
16
193
193
19
19
10
999
10
Cruzeiro do Sul
16
1.440
358
1.798
105
33
138
14
11
13
Doutor Ricardo
16
290
76
366
35
10
45
10
Encantado
16
2.588
817
3.405
203
66
269
13
12
13
11
Estrela
16
4.238
1.345
5.583
298
122
420
14
11
13
12
Fazenda Vilanova
16
541
154
695
25
34
22
17
20
11
13
Forquetinha
16
303
96
399
29
36
10
14
14
Imigrante
16
291
96
387
34
14
48
15
Lajeado
16
9.346
2.991
12.337
673
236
909
14
13
14
16
Marques de Souza
16
524
95
619
50
17
67
10
17
Muum
16
640
194
834
77
21
98
18
Nova Brscia
16
400
196
596
32
17
49
13
12
12
19
Paverama
16
886
215
1101
68
18
86
13
12
13
20
Pouso Novo
16
303
76
379
33
11
44
21
Progresso
16
1.081
225
1.306
89
19
108
12
12
12
22
Relvado
16
257
76
333
32
39
11
23
Roca Sales
16
1.123
423
1.546
100
45
145
11
11
15
24
16
710
243
953
49
15
64
14
16
25
Srio
16
346
108
454
25
13
38
14
12
26
Taba
16
579
201
780
59
12
71
10
17
11
27
Taquari
16
3.860
1.144
5.004
277
87
364
14
13
14
28
Teutnia
16
3.571
1.187
4.758
259
96
355
14
12
13
29
Travesseiro
16
257
85
342
29
38
30
Vespasiano Correa
16
175
67
242
20
29
31
Westflia
16
347
98
445
36
45
10
11
10
Arroio do Tigre
26
1.991
601
2.592
168
45
213
12
13
12
Candelria
26
4.485
814
5.299
284
79
363
16
10
15
Estrela Velha
26
613
104
717
55
63
11
13
11
Gramado Xavier
26
787
101
888
70
12
82
11
11
Herveiras
26
582
101
683
41
11
52
14
13
Ibarama
26
761
144
905
80
17
97
10
26
470
104
574
45
11
56
10
10
Mato Leito
26
555
133
688
43
18
61
13
11
Passa Sete
26
981
222
1203
77
15
92
13
15
13
10
26
16.667
4.333
21.000
1.056
332
1.388
16
13
15
11
Segredo
26
1.284
227
1.511
116
20
136
11
11
11
12
Sinimbu
26
1.542
343
1.885
107
30
137
14
11
14
13
Sobradinho
26
2.193
628
2.821
168
48
216
13
13
13
14
Vale do Sol
26
1.727
176
1.903
93
14
107
19
13
18
15
Venncio Aires
26
9.321
2.221
11.542
653
200
853
14
11
14
16
Vera Cruz
26
3.445
841
4.286
220
46
266
16
18
16
84
EaD
Mun
Municpio
Microrregio
Codigo da Microrregio
Mesorregio
Cdigo da Mesorregio
MatrEF07
MatrEM07
Matr07
Doc_EF07
Doc_EM07
Doc07
Nal_docEF
Nal_docEM
Nal_doc07
RESUMO DA UNIDADE 3
Nesta unidade abordamos tcnicas e mtodos estatsticos com a finalidade
de sistematizar os dados coletados, descrever seu padro comportamental a partir de medidas descritivas. Estas se repartem em dois tipos de
medidas: as de tendncia central, que so Mdia, Mediana e Moda; e
as de variabilidade que so basicamente a varincia, o desvio padro e o
coeficiente de variao.
85
EaD
Unidade 4
INTRODUO AMOSTRAGEM
Ruth Marilda Fricke
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
EaD
Seo 4.1
Padres a Seguir no Processo Amostral
O trabalho quando realizado por amostragem e no de forma censitria, populacional,
requer algumas estratgias para seu desenvolvimento:
Seguindo uma certa lgica presente neste texto, estamos disponibilizando conceitos no
processo amostral e os meios para sua utilizao.
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
1 Mtodo de Cochran:
Necessita definir previamente a preciso margem de erro r, sendo =r., a fidedignidade z valor da curva normal e conhecer/estimar a variabilidade populacional ou s.
Para trabalharmos de forma mais operacional e simplificada, considerando que o depende da
90
EaD
z
1,64
1,96
2,58
Para encontrarmos o valor de t na tabela t de Student precisamos fixar o valor de Pf e encontrar os graus de liberdade fixados por (n-1), sendo n o tamanho da amostra piloto, e localizar
o valor de t no interior da tabela. Por exemplo, se n = 30; 20; 10, = 0,05, veja os resultados no
quadro a seguir para os valores de t:
Quadro 2: Valores de t calculados para um valor de Pf: 0,95, com n variado: 30; 20 e 10
Pf
0,95
0,95
0,95
n-1
30 -1=29
20 -1=19
10 -1=9
t
2,262
2,093
2,045
Quando estamos trabalhando com base em estimativa da varincia e n > 120, os valores
de t se aproximam de z e podemos utilizar a aproximao normal.
91
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
CV
n = z / 2 z / 2
* Esta frmula utilizada para populaes infinitas ou com N desconhecido, com conhecido.
2 frmula:
2
s
CV
n = t / 2 = t / 2
n=
N z2 / 2 2
N z2 / 2 cv 2
( N 1) 2 + z2 / 2 2 ( N 1) r 2 + z2 / 2 cv 2
n=
N t2 / 2 s 2
N t2 / 2 cv 2
( N 1) 2 + t2 / 2 s 2 ( N 1) r 2 + t2 / 2 cv 2
EaD
1
n=
Seo 4.2
Delineamento Amostral: Dimensionamento e Seleo
Esta seo vai nos apresentar a metodologia do delineamento amostral e da seleo aleatria que ir garantir a cientificidade dos resultados.
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
RGS
M u n i c p io s
496
P I B p e r c a p i t a em m i -
Va ri ve l
Mdia
D e s v io Pa d r o
Coeficiente de
Va ria o
r
PF
E m presa
Func i o n ri o s
2.500
Pro du o
Pro duto s
Desco nheci do
l ha r e s d e rea i s
1 1 ,2 9 4 1 18
3 ,2 7 8 9 8 3 1 valo r po -
Ida de
Peso da pe a
32,27
3,8724 v a lo r esti m a -
2,3 kg
0,8625 v a lo r esti m a-
p u l ac i o na l
do, n = 20
do , n= 40
0 ,2 9 0 3 2 6 63
0,12
0,375
0 ,0 5
0 ,9 0
0,05
0,95
0,10
0,99
400
10.000
100
Ta m a n h o e s t i m a d o
s com base no Erro,
frmula 5
Utilizando os dados do Quadro 3 vamos dimensionar a amostra para cada grupo, considerando as informaes disponveis na hora de escolher a frmula adequada e proceder seleo
aleatria.
Dimensionamento da amostra
Grupo 1: RGS municpios
Como N conhecido, N = 496 e =3,278931, varincia populacional conhecida, vamos
escolher a frmula 3:
n=
94
N z2 / 2 cv 2
496 * (1,64) * (0, 29032663)
=
= 76,8 77 municpios
2
2
2
( N 1) r + z / 2 cv
(496 1) * (0,05) + (1,64) * (0, 29032663)
EaD
Municpio
Sorteado
Municpio
Sorteado
Municpio
17
Antnio Prado
27
162
Farroupilha
53
356
Salto do Jacu
20
Aratiba
28
164
Faxinalzinho
54
368
Santa Tereza
26
Arroio Grande
29
171
Forquetinha
55
376
27
Arvorezinha
30
179
Getlio Vargas
56
379
Santo Cristo
28
Augusto Pestana
31
190
Harmonia
57
385
So Gabriel
37
Barra do Ribeiro
32
191
Herval
58
393
So Jos do Inhacor
39
Barra Funda
33
197
Ibia
59
394
So Jos do Norte
46
34
202
Iju
60
395
So Jos do Ouro
48
35
203
Ilpolis
61
403
So Martinho da Serra
10
60
Cacequi
36
215
Itati
62
404
11
63
Cacique Doble
37
222
Jaguaro
63
408
12
68
Cambar do Sul
38
232
Lajeado
64
411
So Sebastio do Ca
13
73
Campo Novo
39
244
Marau
65
416
So Vendelino
14
74
Campos Borges
40
254
Minas do Leo
66
419
Sapucaia do Sul
15
83
Capo da Canoa
41
267
Muliterno
67
427
Serafina Corra
16
99
Cerro Branco
42
270
Nonoai
68
434
Sinimbu
17
116
Coqueiros do Sul
43
279
Nova Pdua
69
441
Taquara
18
120
Cotipor
44
283
Nova Ramada
70
443
Taquaruu do Sul
Trs Forquilhas
19
124
Cristal do Sul
45
289
Novo Machado
71
458
20
131
Dilermando de Aguiar
46
294
Palmares do Sul
72
459
Trs Palmeiras
21
138
Dona Francisca
47
296
Palmitinho
73
461
Trindade do Sul
22
141
Eldorado do Sul
48
302
Parob
74
466
Tupanciret
23
144
Engenho Velho
49
333
Protsio Alves
75
472
Unistalda
24
151
Erval Seco
50
334
Putinga
76
486
Victor Graeff
77
491
Vista Alegre
25
156
Estncia Velha
51
343
Rio Grande
26
160
Eugnio de Castro
52
354
Sagrada Famlia
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
n=
N t2 / 2 cv 2
2.500 * (2,093) * (0,12)
=
= 24,99 25 funcionrios
2
2
2
( N 1) r + t / 2 cv
(2.500 1) * (0,05) + (2,093) * (0,12)
O estudo deve considerar uma amostra de 25 funcionrios para garantir uma margem
mxima de erro de 5% e uma confiabilidade de 95%. Utilizamos a funo da calculadora para
fazer o sorteio com os seguintes passos:
(2nd F+RND)*2500, gerando os 25 nmeros da amostra e mais as 6 reservas, controlando
para no haver repeties.
No sorteio devemos considerar um delineamento que garanta uma distribuio igualitria
por sexo, quer dizer, uma amostra estratificada por sexo. Para tanto, separamos os funcionrios
em dois grupos e metade ser sorteada entre os do sexo masculino e a outra metade entre as de
sexo feminino.
Como se trata de pessoas que eventualmente podem se negar a responder ou faltar, ou ainda no serem encontradas, sorteia-se tambm um grupo de nomes-reserva chamado de reserva
tcnica para fazer substituies caso seja necessrio.
O pressuposto, neste caso, a existncia de uma listagem com a relao de trabalhadores.
A cada um deles vai ser atribudo um nico nmero que varia de 1 a N=2.500.
Neste caso, as reservas tambm tm de ser meio a meio por sexo.
Quadro 5: Amostra sorteada e respectiva seleo.
n2
1
2
3
4
5
6
7
8
9
10
11
12
13
1
Masculino
sorteado
94
202
272
340
363
498
907
944
1.467
1.688
1.725
1.914
2.216
reserva M
278
Feminino
nome
Gustavo
Adolfo
Maximino
Carlos
Ernesto
Franois
Gabriel
Mateus
Frederico
Homero
Elvis
Cassiano
Jo s i a s
n2
14
15
16
17
18
19
20
21
22
23
24
25
sorteado
960
1.049
1.467
1.640
1.745
1.798
1.825
2.101
2.148
2.217
2.217
2.415
nome
Anastcia
Tarsila
Fabiana
Raquel
Eliana
Edivania
Alice
Luciana
Guilhermina
Jamilia
Constancia
Zuleica
reserva F
Ricardo
727
Ins
1.250
Fabrcio
996
Janaina
2.107
Jonas
1.137
Dbo ra
96
EaD
Aps a seleo amostral, proceder-se- coleta das assinaturas nos Termos de Consentimento
Livre e Esclarecido (TCLE) para iniciar a coleta de dados. Este procedimento garante que o pesquisado conhece os objetivos da pesquisa e sua participao, bem como os procedimentos metodolgicos. Tambm lhe garantido sigilo de sua participao e em nenhum momento as informaes
prestadas sero relacionadas a sua pessoa e lhe causaro prejuzo na empresa ou em qualquer
lugar. Garante ainda que a qualquer momento estar livre para retirar seu consentimento.
Grupo 3: Produo contnua de uma empresa de mdio porte peas
Delineamento: como a produo contnua, entende-se que a populao de peas produzidas tendem a infinito, por isso no dimensionamos o N. Tambm impossvel conhecer a
varincia populacional, apenas podemos estim-la mediante uma amostra piloto com uma varivel
quantitativa que nos assegure mdia, varincia, desvio padro e coeficiente de variao. Neste
caso a variabilidade foi estimada a partir de uma grande amostra, n=40. Podemos considerar
ento a utilizao da primeira frmula.
Como N conhecido, N e CV = 0,375 a partir de uma amostra piloto de tamanho 40,
logo temos varincia populacional desconhecida, mas estimada numa grande amostra, com uma
margem de erro fixada em r= 0,10 e uma probabilidade de confiana, PF=0,99, vamos escolher
a frmula 1:
2
CV
0,375
= 2,58*
= 93,6 94.lote.de. peas
n = z / 2
r
0,10
No possvel aplicar os mtodos de sorteio neste caso, pois se trata de uma produo
contnua e as peas no so numeradas nem identificadas, apenas fazem parte de lotes que
identificam o perodo, turno e dia em que foram produzidas, o responsvel pela mquina, a prpria mquina e o conferente. Cada lote constitudo de dez peas, o que favorece, por exemplo,
o clculo da proporo de peas defeituosas por lote, etc. A forma que pode ser adotada a de
fazer uma amostra aleatria sistemtica, em que uma razo estabelecida para o momento da
coleta. Considerando a experincia na produo estabeleceu-se o momento da coleta de 6 em 6
horas, com sorteio da primeira coleta do dia e a partir da de 6 em 6 horas coleta-se uma amostra,
sendo que a unidade amostral o lote daquele perodo. O sistema repetido at ser composto
o nmero de lotes definido pelo dimensionamento da amostra.
Sabe-se que a empresa funciona ininterruptamente, 24 horas por dia. O turno de trabalho
para o sorteio inicial da meia noite s 6 da manh. nesse intervalo de tempo que ser sorteado
o horrio da primeira amostra e a partir da inicia-se a coleta do lote de 6 em 6 horas. O intervalo
contabilizado em meia hora e hora completa, formando assim 12 intervalos de tempo:
Enumerao dos perodos de tempo para o sorteio inicial:
N
Horrio
1
0,5
2
1
3
1,5
4
2
5
2,5
6
3
7
3,5
8
4
9
4,5
10
5
11
5,5
12
6
97
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Sorteio da hora de incio da coleta dos lotes, um em cada perodo previsto. Sero sorteados nmeros
de 1 a 12, correspondente ao nmero de perodos de meia hora da meia-noite s 6 da manh.
Quadro 6: Amostra de perodos sorteados como hora de incio da coleta
1
2
3
4
5
6
7
8
9
10
11
12
4
1,5
3
2,5
4,5
1,5
0,5
5
0,5
2
4
0,5
13
14
15
16
17
18
19
20
21
22
23
24
5,5
4
3
3
6
5
1
6
1,5
0,5
5,5
4
A hora inicial considerada a semente geradora dos horrios para o processo amostral, a
qual ser ento somada com (+ 6) gerando os demais horrios do dia. Para completar o ltimo
dia de coleta, o 24, aproximamos para n = 96.
Quadro 7: Amostra de perodos sorteados gerados a partir da hora sorteada inicialmente
n3
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Coleta
4
10
16
22
1 ,5
7 ,5
1 3 ,5
1 9 ,5
3
9
15
21
2 ,5
8 ,5
1 4 ,5
2 0 ,5
4 ,5
1 0 ,5
1 6 ,5
2 2 ,5
1 ,5
7 ,5
1 3 ,5
1 9 ,5
N3
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
C oleta
5
11
17
23
0,5
6,5
1 2,5
18,5
5,5
1 1,5
17,5
2 3,5
4
10
16
22
3
9
15
21
3
9
15
21
n3
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
98
C o leta
5,5
11,5
17,5
23,5
4
10
16
22
3
9
15
21
3
9
15
21
6
12
18
24
5
11
17
23
n3
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
Co leta
1
7
13
19
6
12
18
24
1,5
7,5
13,5
19,5
0,5
6,5
12,5
18,5
5,5
11,5
17,5
23,5
4
10
16
22
EaD
Seo 4.3
Aplicaes
O gerente de uma empresa do ramo de calados populares quer conhecer a interferncia
de algumas variveis na conduo de seus negcios. Como o estatstico deve conduzir o processo
amostral?
Em cada proposio identifique:
a populao
a unidade amostral
o delineamento
o clculo da amostra
a seleo aleatria
Caso 1) Se ele pretende entrevistar a clientela utilizando a varivel gasto na ltima aquisio para delinear a amostra, vai precisar de uma amostra piloto. Com base em 26 notas de
clientes da empresa monte o processo amostral, definindo margem de erro, probabilidade de
confiana e coeficiente de variao a partir dos valores das notas:
Quadro 8: Banco de dados da amostra piloto
1
2
3
4
5
6
7
8
9
10
11
12
13
R$ 136,40
R$ 119,87
R$ 124,33
R$ 112,60
R$ 102,53
R$ 87,90
R$ 99,12
R$ 127,45
R$ 132,90
R$ 123,10
R$ 107,34
R$ 264,00
R$ 148,00
14
15
16
17
18
19
20
21
22
23
24
25
26
R$ 64,00
R$ 117,00
R$ 145,00
R$ 186,90
R$ 166,99
R$ 268,00
R$ 54,80
R$ 145,00
R$ 219,00
R$ 104,00
R$ 131,60
R$ 59,23
R$ 84,50
99
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Caso 2) Se ele pretende utilizar a informao sobre o nmero de pares de calados que
vendeu nas ltimas exportaes para os vizinhos da Amrica Latina, onde tem 180 clientes,
enviando uma mala investigativa via Internet por processo amostral.
Quadro 9: Banco de dados de todos os clientes
n
pares
pares
pares
pares
pa res
pa re s
1
2
3
4
5
6
7
8
9
10
411
577
564
507
202
435
513
292
394
404
31
32
33
34
35
36
37
38
39
40
239
132
445
265
219
430
519
225
485
259
61
62
63
64
65
66
67
68
69
70
183
1 90
4 42
190
410
1 62
4 27
417
481
403
91
92
93
94
95
96
97
98
99
100
267
238
198
552
167
210
310
409
458
217
121
122
123
124
125
126
127
128
129
130
312
384
599
282
289
392
493
150
532
461
151
152
153
154
155
156
157
158
159
160
451
188
252
317
437
365
512
248
142
514
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
127
485
165
352
128
435
520
435
137
415
204
527
450
569
175
463
559
249
500
103
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
148
401
555
259
320
365
223
107
580
141
560
572
356
391
429
260
148
212
536
542
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
406
3 50
110
534
176
3 27
325
562
396
1 39
476
445
333
3 44
188
574
296
3 88
291
446
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
195
180
132
201
495
224
453
514
533
545
454
213
258
473
295
476
436
585
503
405
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
327
389
554
585
427
480
169
137
565
136
118
412
526
233
104
159
248
238
287
485
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
266
284
573
274
571
535
137
458
127
258
271
564
422
290
259
550
334
586
584
155
Caso 3) Se ele deseja saber como seria a aceitao de um novo produto entre seus clientes
usuais. No sabe quantos clientes costumam vir a sua loja e comprar um tipo de calado como
esse novo produto.
Caso 4) Se ele deseja encontrar o perfil de clientes na aceitao de um novo plano de
promoes. Toma como informao a proporo de clientes que costuma frequentar a loja nos
sbados tarde: p = 0,54
100
EaD
Caso 5) Sabendo que tem 228 sapateiras, toma uma amostra de 35 delas tomando a informao sobre o tempo de trabalho na indstria caladista, deseja conhecer o grau de satisfao
dos trabalhadores da empresa.
Quadro 10: Amostra piloto
n
1
2
3
4
5
6
7
8
9
10
11
12
TS
0
13
3
12
24
4
12
1
24
27
18
12
n
13
14
15
16
17
18
19
20
21
22
23
24
TS
6
23
16
14
11
20
13
20
12
29
9
11
n
25
26
27
28
29
30
31
32
33
34
35
TS
4
23
26
10
7
14
29
25
2
27
0
RESUMO DA UNIDADE 4
Nesta unidade introduzimos o estudante em um dos principais procedimentos dentro da Estatstica, que distingue um trabalho de senso comum
de um trabalho cientfico: o processo amostral. Procuramos trabalhar as
principais frmulas, o rigor do delineamento e da seleo aleatria das
unidades amostrais.
101
EaD
Unidade 5
103
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Seo 5.1
Conceitos e Definies
Estimadores:
Os estimadores so as estatsticas amostrais que sero calculadas na amostra e projetadas
por meio de estimativas por ponto (a estimativa utilizada como se fosse o parmetro populacional) ou por intervalo (uma estimao que parte da estatstica amostral calculada, mdia ou
proporo, no caso deste texto e acrescentando uma margem de erro para mais e para menos,
que nos informa a faixa de ocorrncia do verdadeiro valor populacional).
Intervalo de Confiana:
O Intervalo de Confiana dimensiona uma faixa de possvel ocorrncia do parmetro populacional, ou seja, do verdadeiro valor, desconhecido mas estimado por meio da amostra. Este
intervalo construdo aps a definio da probabilidade de confiana que pretendemos ter na
estimativa realizada.
Teste de Hiptese:
Aps o clculo da estimativa precisamos conferir se o valor encontrado est garantido como
uma projeo do valor populacional. Para tal, estabelecemos um nvel de significncia (uma espcie de margem de erro) para nossa estimativa e conseguimos estabelecer uma garantia para
a informao obtida, possibilitando que as decises sejam tomadas tendo por base a informao
amostral.
Na seo 5.2 vamos apresentar a metodologia estatstica que permite inferir os parmetros
populacionais a partir de uma amostra, ou seja, generalizar a partir dela. No processo amostral
no interessam por si mesmas as estatsticas da amostra, mas sim as estimativas construdas a
partir dela e que inferem o comportamento populacional.
Seo 5.2
Estimativas e sua Projeo
Nesta seo vamos apresentar as estimativas e os testes de hipteses que permitem a
projeo dos resultados amostrais. As estimativas so calculadas com valores das estatsticas
amostrais. As projees so realizadas quando testamos se os valores encontrados na amostra
trazem evidncia suficiente para inferirmos os parmetros populacionais.
104
EaD
5.2.1 ESTIMATIVAS
As estimativas da informao populacional a partir da amostra podem ser realizadas:
Por ponto: quando se projeta o valor calculado na amostra como se fosse o prprio parmetro,
o valor populacional. Este procedimento desconsidera a margem de erro presente no processo
amostral e no oferece garantia estimativa.
Por intervalo: ao estabelecer a estatstica amostral como estimativa, constri-se em torno dela
um intervalo baseado no potencial de erro de estimativa do processo. Como se diz popularmente, o valor verdadeiro projetado como a estatstica calculada na amostra mais ou menos um
determinado valor que a margem de erro agregada da confiana. Por isso, denominado de
Intervalo de Confiana. Usualmente este intervalo calculado para garantir 95% de confiana
de conter o verdadeiro parmetro.
Ao utilizarmos a mdia amostral, j temos comprovao anterior que esta medida um
estimador timo para a mdia populacional, pois o valor esperado da mdia amostral o prprio
parmetro, (
)= e a varincia mnima, V(
)= /n.
Mesmo assim a estimativa por ponto arriscada, pois fazemos o clculo amostral a partir
de uma amostra entre todas as possveis, ento importante que na projeo trabalhemos com
uma estimativa por intervalo, considerando a confiana dentro da margem de erro. Vrios so
os parmetros que podem ser estimados, mas vamos trabalhar somente com os estimadores da
mdia , e proporo, .
IC 95% = X z / 2
= Pf
n
IC 95% = X t( n 1); / 2
= Pf
n
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
IC 95% = p z / 2
= Pf
n
Teste de hipteses
Mdia
Estimador: X (xbarra)
Parmetro: (mi)
zo =
X 0
to =
X 0
sx
Rejeitar H0 se: t0<-t(n-1); t0>+ t(n-1); Aceitar H0 se: t(n-1)/2 < t0<+ t(n-1)/2
Proporo
Parmetro: (pi) Estimador: p (p proporo)
H0: =0, a proporo atual igual antiga.
Ha: 0, >0, <0, a proporo atual diferente, menor ou maior que a antiga.
zo =
p ' 0
(p0 )(1 p0 )
106
EaD
EXEMPLO:
Sabe-se que o mdulo da propriedade rural na nossa regio de 25 ha. Devido ao modelo
agrcola e sistema de organizao social em funo de lucro e de acumulao, a populao urbana
vem crescendo e a rural diminuindo em funo do xodo rural. Os agricultores e suas famlias
saem do meio rural por causa do endividamento, busca de instituies de sade e de educao,
do custo elevado de produo agrcola, da dificuldade de acesso s novas tecnologias, etc.
Hiptese: Em funo disso entende-se que o mdulo rural esteja se modificando.
1) Fazemos uma amostra de propriedades rurais de nossa regio
Dados disponveis para o dimensionamento da amostra:
Seja um estudo de propriedades rurais, avaliando-se a concordncia atual com o mdulo
rural em 25 ha. O censo agrcola revela que nesta regio o nmero total de propriedades rurais
de 2.049 estabelecimentos e o nmero total de hectares de 51.508.
Dessa relao podemos tirar uma razo de ha/propriedade:
Razo =
total.de.ha
51.508.ha
=
= 25,13.ha / propriedade
n de propriedades rurais 2.049 propriedades rurais
Segundo essa razo (25,13 ha/propriedade), observamos que na prtica ela corresponde
ao mdulo rural.
Como comprovaremos a hiptese de que o modelo de concentrao de terras est modificando o tamanho das propriedades rurais?
Estabelecemos ento uma proporcionalidade com a finalidade de ter uma informao bsica para o clculo da amostra:
P=25/25, 13=0,99 logo q=(1-p)= 0,01
=p=0,99; =s =p*q= 0,99*0,01=0,0099;
s=( p*q)= (0,0099)=0,09949874 e
CV= q/p=0,01/0,99)=0,10050378
Estabelecendo r=0,03 e uma Pf=0,95z / 2 =1,96, vamos dimensionar o tamanho da
amostra utilizando a frmula para proporo com N finito:
n=
=
N z2 / 2 2
=
( N 1) 2 + z2 / 2 2
N z2 / 2 CV 2
2049 * (1,96) * (0,10050378)
=
=
2
2
2
( N 1) r + z / 2 CV
(2049 1) * (0,03) + (1,96) * (0,10050378)
= 42,25 43 propriedades na amostra.
107
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Como percebemos, em princpio no temos muita informao sobre as propriedades para fazer
um clculo da amostra; buscamos ento um apoio numa proporo que na realidade uma razo.
A estatstica que mais agregaria informao seria a Mdia, pois ela uma medida que faz
um aporte de dados individual, isto , teramos uma informao conhecida para o clculo da
Mdia de cada uma das propriedades.
Como, no entanto, a razo calculada representa baixssima variabilidade, entendemos que
a amostra no sofrer superestimao para compensar. Posteriormente, com base na amostra
realizada, poderemos estimar um real tamanho da amostra para verificar o nvel de satisfao
com os clculos realizados.
30 =
n0 =
N z2 / 2 CV 2
2049 * (1,96) * (0,10050378)
=
2
2
2
( N 1) r + z / 2 CV
(2049 1) * ( r ) + (1,96) * (0,10050378)
N z2 / 2 CV 2
N z2 / 2 CV 2
2
1)
=
z2 / 2 CV 2
N
r
( N 1) r 2 + z2 / 2 CV 2
n0
1/ 2
N z2 / 2 CV 2
N z 2 CV 2
1
1
r = /2
z2 / 2 CV 2
=
z2 / 2 CV 2
n0
n0
( N 1)
( N 1)
2
1/ 2
2
2
1
(2049)(1,96) (0,10050378)
(1,96) 2 (0,10050378) 2
r =
30
(2049 1)
108
= 0,036
EaD
Ento, diminuindo o tamanho da amostra para 30, considerando que PF = 0,95, estaremos
trabalhando com um erro mximo de r=0,036
3) Coletamos dados referentes s 30 propriedades rurais, selecionadas aleatoriamente.
4) Construmos o banco de dados das propriedades sorteadas para compor a amostra.
Quadro 2: Relao das variveis coletadas por meio do instrumento de coleta e sua classificao
X1
X2
X3
X4
X5
X6
VA quantitativa contnua
VA qualitativa no ordenvel
VA qualitativa no ordenvel
VA qualitativa no ordenvel
VA qualitativa no ordenvel
VA quantitativa
Quadro 3: Banco de dados n 6 com as variveis coletadas por meio do instrumento de coleta
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
X1
Tam
28
12
15
5
8
55
80
36
27
10
47
62
87
13
25
42
53
84
27
18
15
61
76
34
29
50
42
24
16
49
1130
X2
soja
1
1
1
0
0
1
1
1
1
0
1
1
1
0
1
1
1
1
0
1
1
1
1
0
1
1
1
1
0
1
X3
milho
1
0
1
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
1
1
1
0
1
1
0
1
0
1
1
1
X4
aves
1
1
0
1
1
0
0
1
1
1
0
0
0
1
0
0
1
0
0
1
1
0
0
1
1
0
0
1
1
0
X5
leite
1
1
1
1
1
1
0
1
1
1
0
0
0
1
1
0
1
0
1
1
1
0
1
1
1
1
0
1
1
0
0,77
0,87
0,50
0,70
X6
moradores
5
7
7
9
8
2
3
4
5
8
2
3
3
6
5
2
3
2
4
5
6
2
4
3
5
3
2
2
8
4
132
X1
tam
784
144
225
25
64
3025
6400
1296
729
100
2209
3844
7569
169
625
1764
2809
7056
729
324
225
3721
5776
1156
841
2500
1764
576
256
2401
59106
X6
moradores
25
49
49
81
64
4
9
16
25
64
4
9
9
36
25
4
9
4
16
25
36
4
16
9
25
9
4
4
64
16
714
109
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Frmula
n
Mdia
X =
Aritmtica:
Varincia
i =1
xi
n
x2
2
S = i (x )
i =1 n
2
X1: Tamanho
X1 =
Coeficiente de
Variao
1.130
= 37,67.ha
30
X6 =
2 30
59.106
S2 =
(37,67 )
30
30 1
= 570,177 ha
132
= 4, 4 moradores
30
2 30
714
S2 =
(4, 4)
30
30 1
= 22,59310345 moradores
S = (570,177 2 =
Desvio
Padro
X6: Moradores
S = (22,59310345) 2 =
S = S2
= 23,87837934.ha
S
CV = 100
X
23,87837934
CV =
100 =
37,67
4,753220324
CV =
100 =
4, 4
= 63, 4%
= 108%
= 4,753220324
Intervalo Confiana
Li
Ls
Parmetros
estimativa
37,67
29,12
4,4
2,67
TH
Sig.
46,21
2,096
0,0180, *
6,10
1,325
0,0918 n.s.
Intervalo de confiana de 95% para a Mdia; utiliza-se o intervalo de confiana com base
na distribuio normal devido ao tamanho da amostra piloto, n = 30.
110
EaD
23,87837934
IC 95% = X z / 2
= Pf IC 95% = 37,67 1,96
= 0,95
n
30
zo =
X 0
37,67 25
= 2,906
23,87837934 30
Concluso:
Como zo= 2,906 > zt =1,96, tem uma chance de 1,79% de ocorrer no caso da igualdade com
o mdulo rural antigo ser verdadeira, garantindo que a diferena estatisticamente significativa (P<0,05). Rejeitamos H0 concluindo que houve mudana no padro de propriedades,
ocorrendo uma concentrao de terras nessa regio, constatando-se que o padro mdio no
mais 25 ha, cresceu e com um nvel de significncia estatstico de 5%, podemos estimar o
tamanho mdio das propriedades em 37,67, com um potencial de variar entre 29 e 46 ha.
111
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
4,753220324
IC 95% = X z / 2
= Pf IC 95% = 4, 4 1,96
= 0,95
n
30
zo =
X 0
4, 4 3, 25
= 1,325
4,753220324 30
Concluso:
Como zo= 1,325 < zt =1,96 aceitamos H0, h uma chance de ocorrer de 9,18% no caso de a
igualdade com o nmero de moradores ser verdadeiramente 3,25, garantindo que a diferena
no estatisticamente significativa (P>0,05). Aceitamos H0 concluindo que no h diferena
estatisticamente significativa entre a mdia estadual = 3,25, e a mdia da regio = 4,4. As
famlias, atualmente, como decorrncia da vida moderna, do planejamento familiar, acesso
aos meios de contracepo, tendem a ter menos filhos, restringindo-se a 1 ou 2 no mximo.
112
EaD
X2: Produz soja, p: sim; (1-p): no tal que p = 0,77 (1-p) = 0,23
IC 95% = p z / 2
p(1 p)
0,77 * 0, 23
Constatamos que a proporo de propriedades que produz soja estimada em 0,77, e que
a proporo pode ser avaliada potencialmente como um valor entre 0,71 e 0,83, com um nvel
de significncia de 5%.
O intervalo de confiana calculado evidencia que o zero no um valor possvel para a
verdadeira mdia, com 95% de confiana. Supondo, no entanto, que metade das propriedades
rurais produz soja, queremos saber se a proporo estimada significativamente maior do que a
suposta. Para isso vamos construir um teste de hiptese com essa premissa, de que a proporo
real igual a 0,50.
H0: = 0,50 a proporo de propriedades que produzem soja de 0,50.
Ha: = 0,50 a proporo de propriedades que produzem soja > que 0,50.
Regio crtica do teste
Pf=0,95, =0,05 Z=1,96
Logo:
Aceita H0 se z0 1,96
Rejeita H0 se z0 > 1,96
Estatstica de teste:
Grandes amostras
zo =
p 0
p (1 p )
=
n
0,77 0,50
= 3,514
0,77(0, 23)
30
Concluso:
Como zo= 3,514 > zt =1,96 tem uma chance de 0,02% de ocorrer no caso da igualdade
com a hiptese de que 50% das propriedades produzem soja seja verdadeira, altamente
improvvel, garantindo que a diferena altamente significativa estatisticamente (P<0,01).
Rejeitamos H0, concluindo que h diferena altamente significativa estatisticamente entre a
proporo suposta = 0,50 e a proporo da regio = 0,77 quando se trata de produo de soja
113
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
com um nvel de significncia de 1%. Apesar de a soja ser uma produo que exige grandes
extenses rurais e cultivo com maquinrio agrcola, a maioria das propriedades (independentemente do tamanho) dedica-se a essa cultura pelo manejo exigido e retorno bastante
garantido, bem como pela poltica agrcola que favorece esta cultura. Podemos ento afirmar
que a proporo estimada de produtores de soja de 77% com grandes possibilidades de o
intervalo de 71% a 83% conter a real proporo da regio em termos de produtores de soja,
tenha uma chance de 95% de conter a verdadeira proporo.
X : Produz milho, p: sim; (1-p): no tal que p = 0,87 (1-p) = 0,13
3
IC 95% = p z / 2
p (1 p )
0,87 * 0, 23
zo =
114
p 0
p (1 p )
=
n
0,87 0,50
= 6,026
0,87(0,13)
30
EaD
Concluso:
Como zo= 6,026 > zt =1,96 rejeitamos H0, tem uma chance de ocorrer de 0,0000..% no caso
da igualdade com a suposio 0,50 ser verdadeira, garantindo que a diferena altamente
significativa estatisticamente (P<0,01). Conclumos que h diferena altamente significativa
estatisticamente entre a proporo suposta = 0,50 e a proporo da regio = 0,87 quando se
trata de produo de milho com um nvel de significncia de 1%. Apesar de o milho ser uma
produo que exige uma terra de boa qualidade, quase sempre uma terra de mato, uma
cultura de grande utilidade tanto para a comercializao quanto para a demanda interna
da propriedade, por isso a maioria das propriedades (independentemente do tamanho) se
dedica a essa cultura pelo manejo exigido e retorno bastante garantido, bem como pela poltica agrcola que favorece esta cultura. Podemos ento afirmar que a proporo estimada de
produtores de milho de 87% com grandes possibilidades de o intervalo de 83% a 91% conter
a real proporo da regio em termos de produtores de milho, tenha uma chance de 95% de
conter a verdadeira proporo.
IC 95% = p z / 2
p (1 p )
0,50 * 0,50
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
zo =
p 0
p (1 p )
=
n
0,50 0,65
0,50 * (0,50)
= 1,643
30
Concluso:
Como zo= -1,643 > zt =-1,96 aceitamos H0, tem uma chance de ocorrer de 0,0505% no caso
da igualdade com a suposio de 0,50 ser verdadeira, garantindo que a diferena no significativa estatisticamente (P>0,05). possvel concluir que no h diferena estatisticamente
significativa entre a proporo suposta = 0,65 e a proporo da regio = 0,50 quando se trata
de produo de aves com um nvel de significncia de 5%. Apesar de ave ser uma produo
que no exige grandes extenses rurais, de fcil manuseio e consumo garantido, a maioria
das propriedades, independentemente do tamanho, no se dedica muito a essa produo. Podemos ento afirmar que o a proporo estimada de produtores de aves de 50% com grandes
possibilidades de que o intervalo de 41% a 59% conter a real proporo da regio em termos
de produtores de aves, tenha uma chance de 95% de conter a verdadeira proporo.,
X : Produz leite, p: sim; (1-p): no tal que p = 0,70 (1-p) = 0,30
5
IC 95% = p z / 2
p(1 p)
0,70 * 0,30
EaD
zo =
p 0
p (1 p )
=
n
0,70 0,90
= 2,390
0,70(0,30)
30
Concluso:
Como zo= -2,390 < zt =-1,96 rejeitamos H0, tem uma chance de ocorrer de 0,0084% no caso
de a igualdade com a suposio ser 0,50 a verdadeira proporo, garantindo que a diferena
altamente significativa estatisticamente (P<0,01). Concluindo que h diferena altamente
significativa estatisticamente entre a proporo suposta = 0,90 e a proporo da regio =
0,70 quando se trata de produo de leite com um nvel de significncia de 5%. Apesar de o
leite ser um produto altamente comercializvel, pois vrias empresas de beneficiamento do
leite operam na regio, a proporo de produtores menor do que a esperada. Podemos ento
afirmar que a proporo estimada de produtores de leite de 70% com grandes possibilidades
de que o intervalo de 62% a 78% conter a real proporo da regio em termos de produtores
de leite tenha uma chance de 95% de conter a verdadeira proporo.,
Seo 5.3
Aplicaes
Organize uma pesquisa de campo em que voc precise entrevistar, coletar dados de qualquer natureza.
117
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
RESUMO DA UNIDADE 5
Nesta unidade aprendemos a projetar os resultados de uma amostra
para uma populao. As garantias que temos de resultados confiveis
estabelecida a partir de estimativas calculadas por meio de intervalo
de confiana de 95%. Alm das estimativas, aprendemos a testar se
os valores estimados por intermdio da amostra diferem significativamente de valores antigos.
118
EaD
Unidade 6
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Seo 6.1
Correlao entre Variveis
O termo correlao significa relao em dois sentidos que serve para designar a fora
que mantm unidos dois conjuntos de dados. A correlao mede a intensidade, a direo e
estabelece o grau de associao linear entre duas variveis quantitativas.
120
EaD
Exemplo de Aplicao:
Tabela 1: Valores dos investimentos reais, em bilhes de dlares, no perodo entre 1968 e 1982 nos Estados Unidos
ANO
Xi
Yi
X iYi
X i2
Yi 2
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
161
172
158
173
195
217
199
163
195
231
257
259
225
241
204
161
344
474
692
975
1302
1393
1304
1755
2310
2827
3108
2925
3374
3060
1
4
9
16
25
36
49
64
81
100
121
144
169
196
225
25921
29584
24964
29929
38025
47089
39601
26569
38025
53361
66049
67081
50625
58081
41616
120
3 050
26004
1240
636520
Seo 6.2
Diagrama de Disperso
O clculo do coeficiente de correlao bastante trabalhoso, assim conveniente fazermos
primeiro o diagrama de disperso, que uma representao grfica bidimensional.
O diagrama de disperso uma representao grfica da relao entre duas variveis
quantitativas. Esta representao feita sob a forma de pares ordenados ( X i , Yi ), onde X i
um valor observado de uma varivel e Yi o correspondente valor da outra varivel.
Na construo do grfico podemos comear com qualquer um dos eixos. No nosso exemplo
a varivel X i representa os gastos, pois entre o valor que representa o menor investimento e o que
indica o maior investimento, que so 2 e 20, devemos criar uma escala no eixo correspondente.
Proceder no eixo Yi da mesma maneira, pois o ms de janeiro apresentou o menor valor para o
faturamento, que 20, o ms de outubro apresentou o maior faturamento, que de 62. Pois bem,
devemos criar uma escala considerando este intervalo e representarmos no corresponde eixo.
121
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Em nosso exemplo:
O diagrama de disperso fica:
Figura 1: Evoluo dos investimentos em funo dos anos
270
250
230
210
190
170
150
1967
1969
1971
1973
1975
1977
1979
1981
1983
Anos
Seo 6.3
Coeficiente de Correlao
A correlao mede a intensidade, a direo e estabelece o grau de associao linear entre
duas variveis quantitativas. As relaes lineares tm importncia especial porque uma linha
reta um padro simples e bastante comum.
122
EaD
0 R 1
1 R 0
Correlao no linear
No h correlao linear
Karl Person (1857 1936) foi quem desenvolveu a frmula de R, que dado por:
R=
( X )( Y ) ,
n X ( X ) n Y ( Y )
n (X iYi )
2
i
-1 R 1
0
0 |--- 0,3
0,3 |--- 0,6
0,6 |--- 0,8
0,8 |--- 1,0
1,0
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
R=
15(26004) (120).(3050)
390060 366000
R=
15(1240) (120) 15(636520) (3050)
4200 245300
R=
24060
24060
64,80741* 495, 2777 R = 32097,66 R = 0,749587
Seo 6.4
Coeficiente de Determinao ( R )
2
um dos critrios mais empregados para caracterizar o ajuste, pois o Coeficiente de Determinao nos permite saber quanto da variao de Yi pode ser explicado pela variao de X i .
R 2 = (R ) .100
2
EaD
Seo 6.5
Anlise de Regresso
Com a regresso buscamos as leis que explicam como duas ou mais variveis esto relacionadas. Alm disso, proporciona obtermos um dado desconhecido a partir de seu par conhecido,
com uma boa aproximao.
O estudo da regresso usado para estabelecer uma equao matemtica que possa descrever com certa preciso a relao entre duas ou mais variveis.
Ao traarmos o diagrama de disperso e obtermos uma nuvem de pontos de configurao
lembrando uma reta, possvel equacionarmos a esses pontos uma reta com o objetivo de produzirmos uma informao simplificada que possa expressar a lei que as mantm unidas.
Devemos lembrar que por dois pontos passa uma e somente uma reta, mas que quando
temos uma nuvem de pontos podemos traar inmeras retas.
De todas as retas possveis devemos escolher a que melhor se ajuste a todos os pontos
simultaneamente. A escolha dessa reta (equao) segue um critrio chamado Mtodo dos Mnimos Quadrados.
O Mtodo dos Mnimos Quadrados deve-se ao matemtico e astrnomo francs Pierre
Simon Laplace, que segue estes critrios:
S
=0
a
S
=0
b
Diferenciando S parcialmente em relao aos estimadores a e b, e simplificando as expresses, obtemos as equaes normais do ajuste pelo mtodo dos mnimos quadrados. Essas
equaes normais so equaes lineares e podem ser resolvidas, simultaneamente, em relao
aos coeficientes a e b, ou algebricamente temos:
125
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
a=
b=
n X iYi X i Yi
n X i2
( X )
Yi = a + bX i
Observao importante:
O sinal ^ sobre o Yi para indicar que se trata de um valor terico, prximo da realidade,
mas no necessariamente presente nos dados observados.
Agora devemos calcular a equao da reta de regresso e comentar sobre o significado
das estimativas.
Clculo dos coeficientes a e b.
b=
Em nosso exemplo:
Yi = 157,5045 + 5,7286 X i
a = 157,5045 Investimento mdio real que no depende do passar dos anos. No exemplo
este coeficiente no tem sentido prtico, no entanto no podemos esquecer que ele faz parte do
modelo ajustado e que para fazermos projees ele essencial.
126
EaD
b = 5,7286 Acrscimo mdio nos investimentos reais a cada ano. A cada ano os investimentos reais tiveram um acrscimo mdio de 5,7286 dlares.
Pergunta: Qual o volume esperado de investimentos reais a serem gastos no ano de
1983?
Seo 6.6
Banco de Dados
Tabela 2: Valores dos investimentos reais e do Produto Interno Bruto, em bilhes de dlares,
as taxas mdias de juros e as taxas de inflao no perodo entre 1968 e 1982 nos Estados Unidos
ANO
1968
INVESTIMENTO
161
PIB
1058
JUROS
5,16
INFLAO
4,40
1969
172
1088
5,87
5,15
1970
158
1086
5,95
5,37
1971
173
1122
4,88
4,99
1972
195
1186
4,50
4,16
1973
217
1254
6,44
5,75
1974
199
1246
7,83
8,82
1975
163
1232
6,25
9,31
1976
195
1298
5,50
5,21
1977
231
1370
5,46
5,83
1978
257
1439
7,46
7,40
1979
259
1479
10,28
8,64
1980
225
1474
11,77
9,31
1981
241
1503
13,42
9,44
1982
204
1475
11,02
5,99
Com este banco de dados pretendemos que voc aplique a teoria estudada na Unidade 6.
127
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
RESUMO DA UNIDADE 6
Nesta Unidade aprendemos a desvendar as relaes que existem
entre as variveis quantitativas estabelecendo o tipo e o grau de
correlao que existe entre elas. Alm disso, buscamos compreender
o resultado estatstico dessas relaes no contexto das variveis que
envolvem o estudo.
128
EaD
Unidade 7
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Os arquivos que normalmente produzimos com o Excel so do tipo Pasta de Trabalho, e possuem a extenso .xls ou .xlsx., respectivamente para MS Excel verso 2003 e verso 2007. A tela
inicial do Excel apresentada na Figura 1a para a verso 2003 e Figura 1b para a verso 2007.
Figura 1a: Tela inicial do Excel 2003
Uma planilha um conjunto de linhas e colunas, como uma grade. No Excel, as colunas
so identificadas por letras em ordem alfabtica, e as linhas por nmeros em ordem crescente.
Uma clula a menor unidade de trabalho do Excel, identificada pelo cruzamento de uma linha
e uma coluna.
130
EaD
Cada clula tem um endereo prprio, formado pela combinao da letra da coluna com o
nmero da linha. Por exemplo, a clula D8 localiza-se no cruzamento da coluna D com a linha
8. Para selecionar uma clula, colocando-a em foco, utiliza-se o cursor, que na planilha aparece
como um ponteiro semelhante a uma cruz. Basta clicar na clula desejada.
Um intervalo de clulas a representao de uma faixa ou conjunto de clulas. Pode ser
selecionado clicando com o cursor sobre um dos cantos do intervalo e arrastando at o canto
oposto, formando um retngulo. Pode tambm ser apenas uma coluna ou linha. Para selecionar
uma coluna inteira deve-se clicar na respectiva letra, no cabealho da coluna.
Para selecionar uma linha inteira deve-se clicar no nmero identificador da linha. O intervalo identificado por suas coordenadas, sendo que o primeiro elemento das coordenadas
o endereo da clula superior esquerda, e o segundo elemento das coordenadas o endereo
da clula inferior direita do intervalo. Os dois elementos so separados por dois pontos ( : ). Por
exemplo, o intervalo C4:E5 compreende as clulas C4,C5,D4,D5,E4 e E5.
Seo 7.1
Elaborando um Banco de Dados no Excel
Para criar um banco de dados no Excel destinamos as linhas aos dados de cada elemento
da amostra e as colunas a cada uma das variveis. A Figura 2 mostra o exemplo do banco de
dados dos clientes da empresa Costa, apresentado a seguir. Tomemos esse banco de dados como
exemplo para desenvolver toda a Unidade 7.
Exemplo:
Pesquisa de satisfao realizada, por amostragem, com clientes da empresa Costa
(empresa fictcia), em maio de 2009.
131
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Sexo
F
F
F
M
F
F
F
F
M
F
M
F
F
F
F
M
F
F
F
M
F
M
M
Nota geral
10
7
6
7
8
9
7
7
5
5
8
8
9
9
7
10
8
8
9
7
7
8
9
132
Idade
22
26
32
35
23
27
22
37
41
40
35
35
37
22
21
19
40
51
55
45
46
33
34
EaD
Seo 7.2
Utilizando as Tcnicas Estatsticas para Analisar os Dados no Excel
Primeiramente voc deve ativar as ferramentas de anlise estatstica no Excel. O procedimento diferente no Excel verso 2003 e no Excel verso 2007. Siga os passos conforme a
verso que voc possui.
No Excel 2003:
Clique no menu Ferramentas, depois em Suplementos e ento marque a opo Ferramentas de Anlise e clique no boto ok conforme a Figura 3 (esquerda). De agora em diante,
sempre que voc desejar utilizar o comando anlise de dados, este estar disponvel no menu
Ferramentas.
No Excel 2007:
Clique no boto do Office
133
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Seo 7.3
Medidas Descritivas para as Variveis Quantitativas
Para obter as medidas descritivas, voc clica na opo Anlise de dados no menu Ferramentas no Excel 2003 ou clica no boto Anlise de dados no menu Dados no Excel 2007. Ento
aparecer a janela da Figura 4.
Figura 4: Ferramentas de Anlise
Nesta janela voc clica na opo Estatstica descritiva. Aps, aparecer a janela da Figura
5. Nesta, observar os seguintes passos:
selecione os dados da coluna que voc deseja analisar, por exemplo, coluna E, que se refere
varivel idade;
marque a opo rtulos na primeira linha, pois foi selecionado junto com os valores o nome
(rtulo) da varivel;
marque nova planilha, assim o resultado do comando vai aparecer numa nova planilha da pasta
de trabalho;
marque resumo estatstico;
clique no boto ok.
134
EaD
Para calcular o coeficiente de variao deve-se incluir uma frmula da seguinte maneira:
clique numa clula vazia do Excel; sugesto: na clula B16;
digite =;
clique no valor do desvio padro;
digite /;
clique no valor da mdia;
135
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
digite*;
digite 100;
tecle enter.
A frmula deste exemplo :
Neste exemplo o valor do coeficiente de variao 29,59%.
Interpretao dos resultados: A idade mdia dos indivduos pesquisados de 33,83 anos,
com desvio padro de 10 anos. Dos 23 indivduos avaliados, 50% deles tm idade at 35 anos
e os outros 50% tm idade igual ou maior a 35 anos. A menor idade desta amostra 19 anos e
a maior 55. Tem-se um conjunto de dados homogneos, posto que o coeficiente de variao
assume valor menor que 30%.
Seo 7.4
Tabelas Simples para as Variveis Qualitativas
e para as Variveis Quantitativas com Pouca Variabilidade
Para elaborar uma tabela simples a partir de um banco de dados utilize o comando relatrio de
tabela dinmica. Ateno: este disponibilizado diferentemente no Excel 2003 e no Excel 2007.
No Excel 2003:
Escolha a opo Relatrio de tabela e grfico dinmico no menu Dados, sendo apresentada
a tela da Figura 7.
Figura 7: Tabela e grficos dinmicos no Excel 2003
136
EaD
A opo de tabela dinmica j est marcada; caso deseje um grfico voc deve selecionar
a segunda opo, conforme Figura 7.
Aps, clique no boto avanar e ento a janela da Figura 8 ser apresentada.
Figura 8: Seleo do banco de dados no Excel 2003
Neste momento voc escolhe o modo de apresentao da tabela (layout), mostrada na figura
10. Para escolher o local de apresentao das categorias da varivel voc deve arrastar o boto
apresentado direita da tela, referente varivel de interesse, at o corpo da tabela sobre Linha.
Depois, arraste novamente o boto da varivel para o centro do corpo da tabela para calcular
frequncia absoluta (n), ou seja, contar as categorias. Deve aparecer no boto: Contar de nome_
da_varivel. Caso isso no ocorra, clique duplo sobre o boto e escolha a opo ContNm.
137
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Para calcular a frequncia relativa percentual, voc deve novamente arrastar o boto da
varivel at o centro do corpo da tabela e clicar duplo sobre o boto, sendo apresentada a tela
da Figura 11, clique em Opes e no campo Mostrar dados como, selecione a opo % do total
e clique no boto ok.
Figura 11: Opes de apresentao da frequncia no Excel 2003
EaD
Para formatar a tabela clique no boto Formatar Relatrio na barra de ferramentas do relatrio e escolher o Relatrio 7. A tabela ficar assim:
No Excel 2007:
Clique no menu Inserir e na opo Tabela dinmica e aparecer a janela da Figura 13.
Se o banco de dados (rea com as informaes da pesquisa) no estiver selecionado voc deve
selecion-lo com o mouse e aps clique no boto ok.
Figura 13: Seleo de banco de dado no Excel 2007
139
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
, duas vezes. Deve aparecer ContNm em cada boto de valores, caso no estiver
aparecendo ento clique com o mouse sobre o primeiro boto e escolha a opo configuraes
do campo valor. Aparecer a janela da Figura 15.
140
EaD
Na janela da Figura 15: marque a opo ContNm e no boto ok, assim aparecer o valor
absoluto na tabela simples (segunda coluna). Clique sobre o segundo boto e escolhe a opo
configuraes do campo valor.
Aparecer a janela da Figura 16:
Figura 16: Marcando a opo mostrar valores como % do total
Marque a opo ContNm e clique na ficha mostrar valores como e escolher a opo % do
total, conforme Figura 16; assim aparecer o valor relativo percentual na tabela simples (terceira
coluna). A tabela para este exemplo est apresentada na Figura 17.
141
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
No cabealho da tabela substitui-se contar de sexo por n e contar de sexo 2 por %, assim
obtm-se a tabela 1 (Figura 18).
Figura 18: Exemplo de tabela simples formatada
Seo 7.5
Tabelas Cruzadas
O processo para a construo de tabelas cruzadas dinmicas semelhante construo de
tabelas simples. A seguir apresentamos procedimento para o Excel 2003 e Excel 2007.
No Excel 2003:
Selecione mais uma varivel para o corpo da tabela conforme a Figura 19, colocando-a
sobre a Coluna. Finalizando todo o processo aparecer a tabela cruzada conforme Figura 20.
142
EaD
No Excel 2007:
Selecione mais uma varivel conforme a Figura 21 para rtulos da coluna
143
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
144
EaD
Seo 7.6
Grficos de Setores, Colunas e Barras
Voc elabora um grfico a partir de dados sistematizados (a partir de uma tabela j elaborada)
de forma diferente no Excel 2003 e no Excel 2007. Existem diferentes tipos de grficos, adequados
para cada tipo de varivel. A seguir so apresentados os tipos de grficos mais usados.
Grfico de setores (pizza)
usado para representar uma varivel aleatria. Suas categorias devem totalizar 100%
e mais indicado quando o nmero de categorias chega no mximo a 5. Primeiramente voc
seleciona as categorias e os valores absolutos ou relativos que sero apresentados no grfico, a
partir da tabela j elaborada, conforme Figura 24.
Figura 24: Selecionando os dados para elaborar um grfico
No Excel 2003:
Para construir um grfico de setores no Excel 2003 clique no cone
na barra de ferra-
mentas ou no menu Inserir e escolha a opo Figura e ento Grfico. Neste momento aparecer
a tela referente ao Assistente Grfico, como apresentada na Figura 25. Escolha o Tipo de grfico
Pizza e aparecer subtipos de grficos. Voc pode escolher um dos seis tipos e ento clicar no
boto Avanar.
145
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
A Figura 26 mostra a segunda etapa, quando apresentada uma prvia do grfico, permitindo selecionar novamente os dados, se necessrio.
Figura 26: Grfico de setores etapa 2
Na etapa 3 (Figura 27), clique no campo Ttulo do grfico e digite o ttulo do grfico.
146
EaD
Aps, clique na ficha Legenda para alterar o local de posio da legenda ou para exclu-la
(Figura 28).
Figura 28: Grfico de setores etapa 3, legenda do grfico
Na ficha Rtulos de dados (Figura 29) possvel mostrar o nome das categorias e a porcentagem no grfico. Aps, clique no boto Concluir.
147
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Pode-se personalizar o grfico, alterando a cor dos setores, trocando a cor do fundo, modificando o tamanho, tipo e cor da fonte.
Para alterar a cor dos setores voc clica uma vez no grfico, aps clica mais uma vez no
setor (fatia) cuja cor deseja alterar e aps clica duplo para aparecer o menu de cores. Ento,
seleciona-se uma cor ou no boto Efeitos de Preenchimento para utilizar as opes gradiente ou
textura. Na Figura 30 apresenta-se um exemplo de grfico formatado.
Figura 30: Grfico de setores exemplo
Grfico 1 - Sexo dos funcionrios da empresa
COSTA, maio de 2008
Masculino
30%
Feminino
70%
Grfico de Colunas
Utilizamos um grfico de colunas simples ou barras simples para representar uma varivel
aleatria. O procedimento o mesmo adotado no grfico de setores, mas na etapa 3 (Figura 31)
digitamos alm do ttulo do grfico, o ttulo do eixo x (horizontal) e o ttulo do eixo y (vertical).
148
EaD
Masculino
sexo
Grfico de Barras
De forma similar podemos construir um grfico de barras, como o apresentado na Figura
33.
149
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
sexo
Masculino
Feminino
0,00
20,00
40,00
60,00
80,00
%
No Excel 2007:
Para construir um grfico de setores (pizza) no Excel 2007, utilize o menu Inserir e escolha
grfico de pizza, conforme a Figura 34.
Figura 34: Elaborao de grfico
150
EaD
Clique com o mouse na rea do grfico (parte branca dentro do retngulo) e clique na
opo Layout 1 no menu Design, conforme Figura 36.
Figura 36: Formatando o grfico de setores
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Voc pode clicar com o mouse sobre o Ttulo do Grfico para edit-lo e ento digitar o ttulo
para o seu grfico. Ainda, pode mudar o estilo do grfico clicando no menu Design e ento em
Estilo (Figura 38).
Figura 38: Utilizando a opo design do grfico para grfico de setores
EaD
Voc pode clicar na rea do grfico (parte branca dentro do retngulo) e usar a opo do
menu Design para alterar definies do grfico: em Layout do grfico voc pode incluir o ttulo
do grfico e os valores. Clicando com o mouse no ttulo possvel editar e colocar o ttulo para
o seu grfico, conforme Figura 40.
Figura 40: Utilizando a opo design do grfico para grfico de colunas
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
Quando desejamos representar os resultados de uma tabela cruzada num grfico podemos
optar pelo grfico de colunas agrupadas ou barras agrupadas. Primeiramente devemos digitar a
tabela cruzada no Excel conforme a Figura 41 e selecion-la. Tomemos como exemplo a tabela
cruzada da satisfao com atendimento em relao ao sexo dos clientes da empresa Costa. O
procedimento para a elaborao do grfico de colunas agrupadas ou grfico de barras agrupadas
semelhante elaborao do grfico de colunas simples e barras simples, porm agora a legenda
dever aparecer, conforme Figura 42.
Figura 41: Tabela cruzada para construir um grfico de colunas agrupadas
2
0
I
MI
MM
MS
Satisfaao
Seo 7.7
Histograma e Polgono de Frequncias
O histograma e o polgono de frequncias so os grficos adequados para representar
uma distribuio de frequncia. Agora veremos como construir esses dois grficos no Excel. Primeiramente precisamos digitar a tabela de distribuio de frequncia e selecion-la, conforme
Figura 43. Tomemos como exemplo o rendimento mdio nominal da Tabela 1.
154
EaD
Tabela 1: Rendimento mdio nominal do trabalho principal, habitualmente recebido por ms, pelas pessoas de 10 anos
ou mais de idade, ocupadas na semana de referncia, em Porto Alegre, Janeiro/2005 a Dezembro/2007
R$
903 |- 939
939 |- 975
975 |- 1011
1011 |- 1047
1047 |- 1083
1083 |- 1119
Total
Fi
5
11
5
5
6
4
36
frac %
13,89
44,45
58,34
72,23
88,89
100,00
-
xi
921
957
993
1029
1065
1101
-
No Excel 2003:
Aps, no menu inserir, escolhemos a opo grfico e aps o tipo de grfico de colunas e
executamos o procedimento conforme descrito anteriormente. Quando o grfico tiver sido concludo (Figura 44) clicamos com o boto direito do mouse sobre uma das colunas do grfico e
ento aparecer o menu da Figura 45; neste escolhemos a opo formatar srie de dados. Assim,
aparecer a tela da Figura 46, clicar na ficha opes e em largura do espaamento digitar 0. O
histograma apresentado na Figura 47.
Figura 44: Construindo um histograma
155
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
R$
O procedimento semelhante para construir o polgono de frequncia. Primeiramente temos de digitar a tabela de distribuio de frequncia conforme a Figura 48. Esta dever ter um
intervalo inferior ao primeiro, com fi = 0, e um intervalo superior ao ltimo, com fi = 0. Depois,
selecionamos a tabela e no menu inserir grfico escolhemos o tipo de grfico de linha e seguimos
os passos at a finalizao, conforme a Figura 49.
156
EaD
-- 9
03
3|
90
-- 9
39
9|
93
-- 9
75
-5|
97
11
10
1
10
04
-- 1
1|
7
4
10
08
-- 1
7|
3
8
10
11
-- 1
3|
9
1
11
15
-- 1
9|
R$
No Excel 2007:
Aps, no menu inserir, escolhemos a opo grfico e aps o tipo de grfico de colunas 2 D
e o grfico da Figura 50 ser apresentado. Em layout do grfico escolhemos o layout 8 (Figura
51) e o grfico da Figura 52 ser apresentado. Clicamos com o boto direito do mouse sobre uma
das colunas do grfico e no menu escolhemos formatar srie de dados e, ento escolhemos a
opo cor da borda conforme Figura 53. Nesta escolhemos linha slida e cor preta. O histograma
apresentado na Figura 54.
157
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
158
EaD
Seo 7.8
Grfico de Linha
Digitamos os dados, observando que na primeira coluna consta o tempo e na segunda
os valores que queremos representar em um grfico de linha conforme exemplo da Figura 55.
Selecionamos os dados das duas colunas.
159
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
No Excel 2003:
Aps, no menu inserir, escolhemos a opo grfico e a seguir o tipo de grfico de linha e
executamos o procedimento conforme descrito anteriormente. Digitamos o ttulo do grfico e o
ttulo dos eixos. Podemos alterar a cor da linha clicando com o boto direito do mouse sobre a
linha. Tambm podemos alterar a cor do fundo clicando com o boto direito do mouse. O grfico
de linha apresentado na Figura 56.
Figura 56: Exemplo de um grfico de linha
No Excel 2007:
Aps, no menu inserir, escolhemos a opo grfico e a seguir o tipo de grfico de linha 2 D
e executamos o procedimento conforme descrito anteriormente. Em layout do grfico escolhemos
o layout 1 (Figura 57). Digitamos o ttulo do grfico e o ttulo dos eixos. Deletamos a legenda.
Podemos alterar a cor da linha clicando com o boto direito do mouse sobre a linha e escolhemos
a opo formatar srie de dados. O grfico de linha apresentado na Figura 58.
160
EaD
RESUMO DA UNIDADE 7
Nesta unidade utilizamos os recursos estatsticos do Excel para tratar
as informaes.
A aplicao dos mtodos estatsticos favorecida pela informtica, no
que diz respeito a hardware e software, uma vez que geralmente necessitamos trabalhar com grande quantidade de dados (n grande).
Assim, o conhecimento a respeito da utilizao de um software estatstico
ou um software que fornece tcnicas estatsticas essencial para alunos ou profissionais que esto iniciando seu aprendizado em Mtodos
Estatsticos.
A planilha eletrnica Excel uma boa alternativa para alunos que esto
se iniciando nos mtodos estatsticos, por ser de fcil acesso, posto que
grande parte dos usurios domsticos e organizaes possuem o pacote
Microsoft Office.
161
EaD
Referncias
ANDRADE MARTINS, Gilberto. Estatstica geral e aplicada. So Paulo: Ed. Atlas, 2002.
BATTISTI, I. E.; KIRCHNER, R. M.; FRICKE R. M. Rotinas da planilha eletrnica Excel para
uso em estatstica descritiva. Iju: Ed. Uniju, 2003. (Cadernos Uniju).
BEARZOTI, E.; OLIVEIRA M. Estatstica bsica. Lavras, MG: Ufla, 1997.
CORRAR, L. J.; PAULO, E.; DIAS FILHO, J. M. Anlise multivariada para os cursos de Administrao, Cincias Contbeis e Economia. So Paulo, Ed. Atlas, 2007.
COSTA NETO, P. L. Estatstica. So Paulo: Ed. Edgard Blcher, 1977.
COSTA NETO, P. L. Probabilidades. Ed. So Paulo: Edgard Blcher, 1974.
COSTA, Srgio Francisco. Introduo ilustrada estatstica. So Paulo: Ed. Harbra, 1988.
DOWNING, D.; CLARK, J. Estatstica aplicada. So Paulo: Ed. Saraiva, 2000.
FRICKE, R. M. Padres estatsticos para descrio de dados: medidas de tendncia central e de
variabilidade. Iju: Ed. Uniju, 2002. (Cadernos Uniju Srie Estatstica).
FRICKE, R. M. Teoria e aplicaes de amostragem, inferncia, relaes entre variveis. Iju:
Uniju, 2008a. Apostila.
FRICKE, R. M. Estatstica aplicada aos fenmenos sociais. Iju: Uniju, 2008b. Apostila.
IBGE. Diretoria de Pesquisas, Coordenao de Trabalho e Rendimento. Pesquisa mensal de
emprego, mar.2002-abr. 2008.
KAZMIER, L. J. Estatstica aplicada Economia e Administrao. So Paulo: Ed.McGraw Hill,
1982.
KMENTA, J. Elementos de econometria. Teoria economtrica bsica. 2. Ed. So Paulo: Ed. Atlas,
1988. V. 1.
MAGALHES, M. N.; LIMA, A. C. P. Noes de probabilidade e estatstica. So Paulo: Edusp.
2002.
MEDEIROS, V. Z.; CALDEIRA, A. M.; PACHECO, G. L.; MACHADO, M. A. S. Mtodos quantitativos com Excel. So Paulo: Ed. Cengage Learning, 2008.
MONTGOMERY, Douglas C. Probabilidad y Estadstica. Universidade do Estado do Arizona;
Editora: McGraw-Hill, 2004.
163
EaD
Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente
MORETTIN, P. A.; TOLOI, C. M. Srie temporais. Srie Mtodos Quantitativos. 2. ed. So Paulo:
Ed. Atual, 1987.
MUNIZ, J. A.; ABREU, A. R. Tcnicas de amostragem. Lavras, MG: Faepe, 1999.
OLIVEIRA, S. T. Ferramentas para o aprimoramento da qualidade. 2. ed. So Paulo: Ed.Pioneira,
1996.
SILVA, N. N. Amostragem probabilstica. So Paulo, SP: Edusp, 1998.
SILVER, M. Estatstica para Administrao. So Paulo: Ed. Atlas, 2000.
STEVENSON, W. Estatstica aplicada Administrao. So Paulo: Ed. Harbra, 1981.
TRIOLA, M. Introduo estatstica. 7. ed. Rio de Janeiro: Ed. LTC, 1999.
VIEIRA, Sonia. Princpios de estatstica. So Paulo: Ed. Pioneira, 1999.
164