Sunteți pe pagina 1din 164

Universidade regional do noroeste do estado do rio grande do sul uniju

vice-reitoria de graduao vrg


coordenadoria de educao a distncia CEaD

Coleo Educao a Distncia

Srie Livro-Texto

Ruth Marilda Fricke


Iara Denise Endruweit Battisti
Antonio dson Corrente

mtodos estatsticos
e a administrao

Iju, Rio Grande do Sul, Brasil


2009

2009, Editora Uniju


Rua do Comrcio, 1364
98700-000 - Iju - RS - Brasil
Fone: (0__55) 3332-0217
Fax: (0__55) 3332-0216
E-mail: editora@unijui.edu.br
Http://www.editoraunijui.com.br
Editor: Gilmar Antonio Bedin
Editor-adjunto: Joel Corso
Capa: Elias Ricardo Schssler
Reviso: Vra Fischer
Designer Educacional: Vanessa Francieli da Frota
Responsabilidade Editorial, Grfica e Administrativa:
Editora Uniju da Universidade Regional do Noroeste
do Estado do Rio Grande do Sul (Uniju; Iju, RS, Brasil)

Catalogao na Publicao:
Biblioteca Universitria Mario Osorio Marques Uniju
F897m

Fricke, Ruth Marilda.


Mtodos estatsticos e a administrao / Ruth Marilda Fricke,
Iara Denise Endruweit Battisti, Antonio dson Corrente. Iju :
Ed. Uniju, 2009. 164 p. - (Coleo educao a distncia. Srie
livro-texto).

ISBN 978-85-7429-840-5

1. Estatstica. 2. Administrao. 3. Amostragem. 4. Banco de dados. 5. Excel. I. Battisti, Iara Denise Endruweit.
II. Corrente, Antonio dson. III. Ttulo. IV. Srie.

CDU : 311

311:658

Sumrio
Conhecendo os Professores............................................................................................7

Apresentao............................................................................................................................9

Unidade 1 CONCEITOS BSICOS ESTATSTICA NA ADMINISTRAO......................11

Seo 1.1 A Estatstica e a Administrao............................................................................11


1.1.1 Um Olhar na Cincia da Administrao....................................................................12
1.1.2 Um Olhar na Cincia da Estatstica Mtodos Estatsticos.....................................14
1.1.3 Interligando o Potencial das Duas Cincias..............................................................15
Seo 1.2 Ajustando a Linguagem por meio dos Conceitos Bsicos da Estatstica............16
1.2.1 Informantes..................................................................................................................17
1.2.2 Informaes.................................................................................................................20
Seo 1.3 Aplicaes..............................................................................................................22
Resumo da Unidade 1..........................................................................................................24

Unidade 2 BANCO DE DADOS, TABELAS E GRFICOS:


Sistematizao e Apresentao de Dados ..........................................................25
Seo 2.1 Banco de Dados ....................................................................................................26
Seo 2.2 Tabelas Simples Univariadas e Bivariadas Com Variveis Qualitativas.......29
Seo 2.3 Tabelas em Srie Numrica e Distribuio de Frequncias
com Variveis Quantitativas.................................................................................36
Seo 2.4 Representao Grfica e sua Leitura....................................................................45
Seo 2.5 Aplicaes..............................................................................................................49
Resumo da Unidade 2..........................................................................................................54

Unidade 3 MEDIDAS QUE DESCREVEM O CONJUNTO DE DADOS............................55


Seo 3.1 Quadro-Resumo das Frmulas.............................................................................56
Seo 3.2 Medida de Tendncia Central e de Variabilidade
conceitos e operacionalizao...........................................................................58
3.2.1 Operacionalizao de Medidas Descritivas em Srie Numrica.............................62
3.2.2 Operacionalizao de Medidas Descritivas em Distribuio de Frequncias.........70
Seo 3.3 Aplicaes..............................................................................................................83
Resumo da Unidade 3..........................................................................................................85

Unidade 4 INTRODUO AMOSTRAGEM.....................................................................87


Seo 4.1 Padres a Seguir no Processo Amostral...............................................................89
4.1.1 Fatores Intervenientes ...............................................................................................89
4.1.2 Mtodos de Clculo da Amostra ...............................................................................90
Seo 4.2 Delineamento Amostral: dimensionamento e seleo .......................................93
Seo 4.3 Aplicaes..............................................................................................................99
Resumo da Unidade 4........................................................................................................101

Unidade 5 Noes de Inferncia Estatstica.....................................................103


Seo 5.1 Conceitos e Definies........................................................................................104
Seo 5.2 Estimativas e sua Projeo..................................................................................104
5.2.1 ESTIMATIVAS .........................................................................................................105
5.2.2 TESTES DE HIPTESES PARA GENERALIZAO
DE ESTATSTICAS AMOSTRAIS............................................................................106
Seo 5.3 Aplicaes............................................................................................................117
Resumo da Unidade 5........................................................................................................118

Unidade 6 REGRESSO LINEAR SIMPLES......................................................................119


Seo 6.1 Correlao Entre Variveis.................................................................................120
Seo 6.2 Diagrama de Disperso.......................................................................................121
Seo 6.3 Coeficiente de Correlao...................................................................................122
Seo 6.4 Coeficiente de Determinao ( R 2 ).....................................................................124
Seo 6.5 Anlise de Regresso...........................................................................................125
Seo 6.6 Banco de Dados...................................................................................................127
Resumo da Unidade 6........................................................................................................128
Unidade 7 FERRAMENTAS DE ANLISE ESTATSTICA NO EXCEL............................129
Seo 7.1 Elaborando um Banco de Dados no Excel.........................................................131
Seo 7.2 Utilizando as Tcnicas Estatsticas para Analisar os Dados no Excel..............133
Seo 7.3 Medidas Descritivas para as Variveis Quantitativas.......................................134
Seo 7.4 Tabelas Simples para as Variveis Qualitativas
e para as Variveis Quantitativas com Pouca Variabilidade.............................136
Seo 7.5 Tabelas Cruzadas.................................................................................................142
Seo 7.6 Grficos de Setores, Colunas e Barras...............................................................145
Seo 7.7 Histograma e Polgono de Frequncias..............................................................154
Seo 7.8 Grfico de Linha..................................................................................................159
Resumo da Unidade 7........................................................................................................161
Referncias............................................................................................................................163

EaD

Conhecendo os Professores

mtodos estatsticos e a administrao

So trs os professores contribuindo para este material didtico:


A doutora Ruth Marilda Fricke nasceu em Iju (RS) no dia 16 de
maro de 1946. Foi professora estadual e professora de Estatstica
desde 1976, na Uniju (RS) com Graduao em Pedagogia pela Uniju
(Iju RS-1977), Aperfeioamento em Estatstica na FDRH (PoA
RS 1975), Especializao em Metodologia do Ensino Superior na
Uniju (Iju RS 1978), Especializao em Estatstica na UPF (Passo
Fundo RS 1979), Mestrado em Estatstica pela Unicamp (Campinas SP 1990), Doutorado em Educao pela Unicamp (Campinas
SP 1999). Vem lecionando em diversos cursos da Uniju desde essa
poca atuando como professora titular de Estatstica. Sua produo
como pesquisadora centra-se em quatro campos: 1) Educao Estatstica e na produo de material didtico para o ensino de Estatstica
na Educao Bsica: Fundamental e Mdio; 2) Modelagem Estatstica na Produo de Indicadores de Qualidade de Vida Urbana; 3)
Modelagem Estatstica para o Tratamento de Variveis Qualitativas:
Questes Abertas na Pesquisa de campo, 4) Relaes entre formao
e desemprego dos trabalhadores urbanos. Neste material didtico
autora da introduo e das unidades 1 a 5.
A doutora Iara Denise Endruweit Battisti a autora da Unidade 7 deste material didtico. Nasceu em 8 de outubro de 1974
no municpio de Iju (Rio Grande do Sul). Cursou Informtica na
Universidade Regional do Noroeste do Estado do Rio Grande do Sul
(Uniju) de 1992 a 1996, fez Especializao em Estatstica e Modelagem Quantitativa na Universidade Federal de Santa Maria (Rio
Grande do Sul) entre 1997 e 1998. De 1999 a 2001 fez Mestrado em
Estatstica e Experimentao Agropecuria na Universidade Federal
de Lavras (Minas Gerais). Fez Doutorado em Epidemiologia na Universidade Federal do Rio Grande do Sul com tese sobre amostragem
complexa e modelos multinveis entre 2004 e 2008.
7

Atua como professora de Estatstica no magistrio superior


desde agosto de 1998 na Uniju e nos cursos de Especializao desta
universidade. docente e pesquisadora do Mestrado em Modelagem
Matemtica da Uniju.
Antonio dson Corrente nasceu em 16 de outubro de 1962 em
Iju (RS), e neste material didtico o autor da unidade 6. Possui Graduao em Cincias e Matemtica Licenciatura Curta pela Universidade Regional do Noroeste do Estado do Rio Grande do Sul (1988),
Graduao em Matemtica Habilitao Plena pela Universidade
Regional do Noroeste do Estado do Rio Grande do Sul (1990) e Mestrado em Modelagem Matemtica pela mesma universidade (1999).
Atualmente professor assistente na Uniju. Tem experincia na rea
de Matemtica, com nfase em Estatstica, lecionando em diferentes
cursos esta disciplina e atualmente atua nos seguintes temas: modelagem estatstica, comunicao comunitria, formas de codificao de
dados e elaborao de questionrios e anlise multivariada.

EaD

Apresentao

mtodos estatsticos e a administrao

Estamos comeando uma relao de conhecimento dos mtodos estatsticos relacionados


com a profisso do administrador. Algumas etapas so comuns a todas as reas, algumas so
mais especficas, no entanto ao longo de todo conhecimento vamos tentar fazer a conexo entre
essas reas de forma que o prprio estudo gere conhecimento vlido para voc. Entendemos que
as aplicaes tcnicas so cada dia mais facilitadas em virtude dos avanos das novas tecnologias, mas visualizamos que estas s fazem sentido quando pensadas e interpretadas por ns,
seres humanos. Ento este aspecto nos leva a dominar o desenvolvimento de todas as etapas e
direciona a metodologia que pretendemos empregar:
compreenso dos conceitos;
domnio das tcnicas;
entendimento da pertinncia das aplicaes;
capacidade de utilizar a informtica como ferramenta que permite a obteno de resultados
mais geis, dinmicos e corretos, potencializando o tempo da anlise;
a sistematizao e avaliao dos conhecimentos adquiridos acompanhar todo o desenvolvimento dos captulos. Ademais, proposta uma aplicao que ser realizada por meio de pesquisa
de campo numa temtica definida na rea de Administrao e tratada estatisticamente.
Procuraremos partir sempre de uma situao de estudo, real e prtica, que desencadeie
a utilizao da Estatstica pertinente, de forma a potencializar maior compreenso do contedo. Voc deve acompanhar este desenvolvimento, refazer os passos que foram desenvolvidos,
realizar as atividades previstas, buscar apoio didtico para suas dvidas ou certezas, plenificar
seu conhecimento fazendo uma resenha do mesmo para que em suas prprias palavras e na sua
compreenso os conceitos trabalhados se solidifiquem.
O objetivo deste material introduzir o educando nos conhecimentos bsicos dos mtodos
estatsticos que permitem a sistematizao de dados e a sua projeo em pesquisas amostrais de
modo a transform-los em informaes confiveis contribuindo para melhorar a performance do
profissional da rea de Administrao.
Para tal desenvolveremos:
1) noes conceituais que permitam estabelecer uma linguagem comum e conhecer a conexo
estreita entre os mtodos estatsticos e a Administrao;
9

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

2) estatsticas descritivas que sistematizam as informaes obtidas em forma de tabelas e grficos


descrevendo os fenmenos em suas ocorrncias;
3) medidas descritivas que buscam descrever o padro dos dados sintetizando-os por meio de
nmeros tpicos e a anlise do comportamento dos mesmos em relao a estes nmeros tpicos.
Uma vez conhecendo o comportamento padro dos dados e podendo descrev-los e apresent-los, passamos a uma segunda fase do tratamento estatstico: o conhecimento dos padres
populacionais a partir de um estudo por amostragem.
4) noes de amostragem que delimitam as restries essenciais para obtermos uma amostra
com potencial representativo corretamente definido;
5) noes de inferncia que permitem a generalizao da amostra para a populao, intensificando o uso de propores;
6) relaes entre variveis quantitativas que tratam de expor o que estudos descritivos no
visualizam, ou seja, as relaes que esto por trs dos fenmenos;
7) estatstica no excel por que aps o conhecimento detalhado dos mtodos estatsticos importante que os mesmos possam ser obtidos por meio de tcnicas informacionais, de modo
que as anlises sejam relatadas com uma base mais confivel de resultado. Todos os mtodos
estatsticos avaliados da unidade 1 a 6 sero retomados nesta unidade com o software Excel.

10

Ruth Marilda Fricke

EaD

Unidade 1

mtodos estatsticos e a administrao

CONCEITOS BSICOS ESTATSTICA NA ADMINISTRAO


Ruth Marilda Fricke

OBJETIVO DESTA UNIDADE:


Conhecer a relao entre a Estatstica e a Administrao, principalmente, dominando os conceitos bsicos que as inter-relacionam.

AS SEES DESTA UNIDADE:


Seo 1.1 A Estatstica e a Administrao.
Seo 1.2 Ajustando a linguagem por meio dos conceitos bsicos da Estatstica.
Seo 1.3 Aplicaes.
As reas da Administrao e da Estatstica fazem parte do mesmo campo de estudos das
Cincias: o das Cincias Aplicadas. Muitos alocam a Estatstica no campo das Cincias Exatas,
no entanto, ela uma cincia no determinstica, trata do conhecimento dos fenmenos sociais e/
ou naturais como o retrato de um momento, propiciando uma viso das tendncias futuras como
um evento probabilstico, com chances conhecidas/estimadas de ocorrer, portanto no exata, que
trata dos fenmenos sociais e/ou naturais em sua evoluo.
Ento, a partir desta breve introduo, voc consegue estabelecer a diferena entre determinstico e no determinstico? Busque maiores conhecimentos para ampliar seu conhecimento
sobre este assunto.
Vejamos, a seguir, a relao existente entre a Administrao e a Estatstica.

Seo 1.1
A Estatstica e a Administrao
Iniciamos com observaes sobre cada uma das cincias para depois entender como se
estabelecem os links entre elas.
11

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

1.1.1 UM OLHAR NA CINCIA DA ADMINISTRAO


As reas preferenciais da Administrao so:
Administrao financeira.
Administrao da produo.
Administrao pblica.
Administrao de materiais.
Marketing.
Gesto de pessoas.
Gesto sistmica.
Administrao de sistemas de informao.
Organizao, sistemas e mtodos.
Comrcio internacional.
A existncia da Administrao, segundo a Wikipdia, est relacionada a normas e funes
elaboradas para disciplinar elementos de produo, que tm como objetivo alcanar um resultado
eficaz e retorno financeiro. Pode-se afirmar, conforme a Wikipdia, que se trata do gerenciamento
dessa operacionalizao mediante o conhecimento e uso de tcnicas de Administrao:
Planos: Um conjunto de propostas resultantes de um processo de planejamento econmico,
urbano, regional, etc., que visam a determinado objetivo.
Pareceres: Avaliao de conjunturas no sentido de emitir um parecer sobre o comportamento
do fenmeno analisado.
Relatrios: Produzir um relato das ocorrncias de uma etapa de trabalho.
Projetos: Elaborao de linhas de ao e estratgias sobre uma determinada realidade para atingir determinados fins. Tem um tempo finito de execuo, e pretende criar um produto, servio
ou resultado nico. Segundo a Wikipdia: pode ser uma demanda de mercado, necessidade
organizacional, solicitao de um cliente, avano tecnolgico ou requisito legal. Apresentam:
objetivos, hipteses, cronograma, oramento, responsabilidades.
Laudos: Relato de tcnico ou especialista designado para avaliar determinada situao que
estava dentro de seus conhecimentos.
12

EaD

mtodos estatsticos e a administrao

Segundo John Riegel:


o xito do desenvolvimento de executivos em uma empresa resultado, em grande parte, da atuao e
da capacidade dos seus gerentes no seu papel de educadores. Cada superior assume este papel quando
ele procura orientar e facilitar os esforos dos seus subordinados para se desenvolverem (1995).

Atualmente as principais funes administrativas so:


Planejamento.
Conhecimento dos problemas.
Busca e encaminhamento de solues.
Definio dos recursos (humanos, financeiros e tecnolgicos).
Liderar as aes na empresa.
Gerenciar os fenmenos organizacionais que envolvem as transaes da empresa.
Tomadas de deciso.
Controle dos fatos e fenmenos mediante tcnicas de conhecimento, mensurao, acompanhamento, avaliao das informaes relacionadas ao negcio da empresa.
Essas perspectivas de atuao dependem efetivamente da capacidade do administrador
de encontrar as alternativas mais viveis e potencialmente bem-sucedidas nas diferentes etapas
do processo decisrio. Para tal precisa essencialmente identificar o problema e seu entorno. Isto
, deve ser capaz de definir o que parece, e o que realmente , contextualizado no mbito da
ocorrncia dos fatos e fenmenos, com pesquisa, levantamento e sistematizao estatstica dos
mesmos. Dessa forma comeamos a compreender a importncia dessa interao entre a Administrao e os mtodos estatsticos. Estes, na sua essencialidade, subsidiam a ao do administrador/
gestor, tanto o pblico quanto o privado.
Os tipos de decises envolvendo aspectos quantificveis que so tomadas em uma organizao:
Identificao dos custos para poder valorar os produtos, incluindo a produo (matria-prima,
equipamentos, ferramentaria, maquinaria), recursos humanos, distribuio, logstica, armazenamento.
Planejamento das despesas e oramento das diferentes reas da organizao.
Anlise das margens e da rentabilidade dos produtos.
Anlise dos custos de venda.
Planejamento do marketing (pesquisa de mercado, aceitao, satisfao do cliente).
13

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Segundo Arajo (2004), entende-se como caractersticas do gestor suas funes, habilidades
e competncias: planejar, organizar, liderar e controlar. O planejamento envolve a determinao no
presente do que se espera para o futuro da organizao, incluindo quais as decises que devero
ser tomadas para que as metas e propsitos sejam alcanados. As metas organizacionais adaptam
as funes aos recursos da empresa e aos recursos humanos necessrios para concretiz-los. O
gestor precisa conduzir o processo de forma a influenciar todas as pessoas a trabalharem em
torno de objetivos comuns, suscitando participao e adeso, gerenciando democraticamente o
processo. O controle integra as aes para o acompanhamento do processo em busca do sucesso
do empreendimento. Estas caractersticas do conta de que somente a unio de todos permite
atingir com sucesso os objetivos.
Vamos agora abordar a cincia Estatstica, como ela se organiza no tratamento de dados.

1.1.2 UM OLHAR NA CINCIA DA ESTATSTICA MTODOS ESTATSTICOS


As reas preferenciais da Estatstica so:
Estatstica descritiva.
Probabilidade.
Amostragem.
Inferncia.
Relaes entre variveis.
Estatstica paramtrica.
Estatstica no paramtrica.
Estatstica Bayesiana.
Bioestatstica.
Estatstica aplicada: medicina, sociedade, gesto pblica e privada, indstria, comrcio, agricultura, psicologia, sade...
A teoria da Estatstica preocupa-se em construir modelos com base em tcnicas estatsticas capazes de descrever, relacionar e fazer projees a partir das situao reais na empresa.
A criao de modelos, sejam eles descritivos ou inferenciais, pretende subsidiar a resoluo de
problemas de tomada de deciso, uma vez que sistematizam os dados obtidos e permitem uma
apresentao mais didtica e compreensvel.
14

EaD

mtodos estatsticos e a administrao

por meio de tabelas, grficos, medidas descritivas, amostragem, inferncias, relaes


entre variveis, que se fazem representaes da realidade. Com isso pretendemos descrever
os fenmenos como eles ocorrem, simular situaes futuras e avaliar a probabilidade de sua
ocorrncia. Simplificam, do visibilidade para os fenmenos e permitem que representemos
a realidade, com condies de projetar as tendncias e interferncias na realidade de modo a
melhorar nosso poder decisrio. Com isso:
entendemos melhor os fatos reais;
damos visibilidade a relaes existentes entre distintas variveis que compem o problema em
estudo, no perceptveis apenas ao primeiro olhar;
os mtodos estatsticos trabalham o problema como um todo e de forma multivariada, com
mltiplas variveis ao mesmo tempo;
conseguem acompanhar a evoluo do fenmeno no tempo e no espao, acompanhando os
resultados parciais, incluindo novos fatores no desenvolver do estudo;
conduzem a solues quantitativas, mais compreensveis e mais argumentativas;
permitem uso de computadores para processar grandes volumes de dados.

1.1.3 INTERLIGANDO O POTENCIAL DAS DUAS CINCIAS


Um candidato ou candidata a um emprego leva, seguramente, vantagem se tiver em sua
bagagem de conhecimento o domnio dos mtodos estatsticos, uma vez que essa habilidade pode
ser de grande interesse para as empresas contratantes. A leitura de um grfico, de uma tabela,
a interpretao e anlise de relaes e de tendncias permitem uma nova linguagem a servio
da organizao empresarial.
Para fazer essa interligao entre a Administrao e os mtodos estatsticos apresentamos
diferentes nveis de aprofundamento nessa leitura da realidade dos fatos e fenmenos sociais e/
ou naturais:
a. Estatstica Descritiva: nesse mbito, como o prprio nome diz, pretende-se descrever os fenmenos. Trata-se de tcnicas estatsticas para sistematizao, sintetizao e apresentao de
fenmenos de forma compreensvel, dando visibilidade ao que realmente aconteceu ou acontece. Como compreender os diferentes estgios do nvel de pobreza nos municpios gachos,
N = 496, sem uma descrio completa de sua localizao, magnitude, permitindo avaliar e
traar metas em relao aos bolses de miserabilidade no Estado. Qual o gestor pblico que
no deseja ter disposio essa descrio do fenmeno ao traar planos e metas, definir prioridades?
15

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

b. Estatstica Inferencial: observamos que o termo inferncia provm do verbo inferir, quer
dizer, que pretendemos olhar um quadro de resultados e projet-los para um universo maior.
A inferncia rene um conjunto de mtodos que permitem fazer essas projees com garantia
e conhecimento da margem de erro mxima inerente s inferncias realizadas com base em
uma amostra. Como podemos projetar o sucesso do lanamento de um novo produto no mercado sem antecipar seu potencial de vendas? Para tal busca impossvel represar o lanamento
esperando que se conhea qual a fatia do mercado que se interessaria pela sua aquisio,
portanto um caso tpico para inferir o resultado populacional mediante uma amostra dos
possveis clientes.
c. Estatstica Aplicada: nos dois itens anteriores passamos uma ideia sobre a existncia de um
conjunto de mtodos e tcnicas estatsticas, construindo descries e inferncias dos dados.
Aps o uso das mesmas, estando aptos a traar um perfil descritivo do nosso conjunto de dados,
vamos aplicar algumas tcnicas que revelam relaes entre variveis de forma a mostrar o que
est por trs dessas relaes descritivas. Podemos descobrir, por exemplo, que as mulheres
compram preferencialmente determinados produtos; podemos conhecer o quanto a idade pode
estar relacionada quantidade de gastos com multas de trnsito; podemos avaliar os limites
permitidos de dimetro de uma determinada pea; podemos avaliar a resposta em termos de
volume de vendas com o passar dos meses...
Ns, seres humanos, e at mesmo os animais e as plantas, temos diferentes formas de nos
expressar. Dependendo da situao, empregamos as mesmas palavras para expressar diferentes
ideias. O mesmo se d nas diversas Cincias. A palavra populao na Demografia expressa
os habitantes de uma determinada regio; j na Estatstica sob a idia de populao agregamos
todos os indivduos, animais, objetos, lugares, perodos ou mquinas, etc., que apresentam caractersticas comuns predefinidas que constituem o nosso universo de informantes. Na seo a
seguir vamos apresentar os principais conceitos da Estatstica.

Seo 1.2
Ajustando a Linguagem por meio dos Conceitos Bsicos da Estatstica
Os principais conceitos da Estatstica dizem respeito aos informantes e s informaes que
formam as bases do tratamento estatstico. Os mtodos estatsticos aparecem, ento, intimamente
relacionados com esse contexto, pois permitem conhecer e explorar os fenmenos. Dois so os
mbitos da perspectiva estatstica: INFORMANTES E INFORMAES.
16

EaD

mtodos estatsticos e a administrao

1.2.1 INFORMANTES
O que queremos dizer com Informantes?
Trata-se da provenincia dos dados, quem os fornece. Nossos informantes podem ser as
empresas, os trabalhadores, os produtos... Eles so a origem das informaes. Ao analisar as
empresas posso obter delas uma srie de informaes que constituiro o objeto da estatstica.
Os informantes podem se constituir numa populao ou numa amostra.
a. POPULAO: o conjunto de todas as unidades que reunimos a partir de caractersticas
que as definem e que so o espao temtico de nosso estudo. Segundo o dicionrio Aurlio:
Populao o conjunto de habitantes de um territrio, de um pas, de uma regio, de uma
cidade, etc.
Ainda no Dicionrio Aurlio (1995, p. 1.115): Estat. Conjunto, em geral infinito ou com
um grande nmero de membros, cujas propriedades se investigam por meio das caractersticas
dos subconjuntos que lhes pertencem, universo.
Segundo a Wikipdia Portugus:
Genericamente, uma populao o conjunto de pessoas ou organismos de uma mesma espcie que
habitam uma determinada rea, num espao de tempo definido. O termo populao tem, consoante
a disciplina a que se refere, distintas definies. Em Biologia define-se como um grupo de indivduos
que acasalam uns com os outros, produzindo descendncia. Em Estatstica chama-se populao ao
conjunto de todos os valores que descrevem o fenmeno que interessa ao investigador (grifo nosso).
Em Sociologia define-se como um conjunto de pessoas adscritas a um determinado espao, num dado
tempo (p. 1.115).

E assim por diante. Na Geografia, populao so os indivduos que fazem parte de um


mesmo grupo: habitantes de um pas, de uma tribo, de uma regio, de um Estado, ou ainda mais
especfica, economicamente ativa, desocupados, inativos...
Entendemos que na rea da Administrao, sob o ponto de vista dos mtodos estatsticos,
populao um conjunto de instituies, empreendimentos, clientes, negcios, produtos, trabalhadores, indicadores, etc. Nesse caso, basta que nosso estudo esteja centrado nessa populao,
de forma que como nossos informantes, eles forneam as informaes que esto no entorno de
nossa temtica.
Para serem populao necessrio que se constituam de um grupo exaustivo de elementos que so definidos sob as caractersticas mencionadas. Um grupo exaustivo quer dizer que
composto por todas as unidades possveis que s podem ser avaliadas censitariamente, isto ,
17

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

por meio de um censo, em que nenhuma das unidades fique de fora. As caractersticas tornam
nico aquele conjunto de dados, de forma que se distingue logo se uma unidade pertence ou
no quela populao.
Vejamos no Quadro 1 alguns exemplos de populao:

Quadro 1: Exemplos de populao e sua descrio estatstica


Populao

Tr a b a l h a d o r e s

Caractersticas

Tamanho

Pe s s o a s c o m 1 0 a n o s o u m a i s q u e

N = 1.875

so a PEA regio Metropolitana

mil pessoas

d e Po r t o A l e g r e m a r o d e 2 0 0 8 .
Da construo de Iju registradas
Empresas

n o C a d a s t r o d a Pr e f e i t u r a M u n i -

N = 121

cipal de Iju 2006.


Pr o d u t o s

Comercializados pela empresa X


de Iju maro de 2009.

2 mil itens

Definio
x : { x (1, 2, 3,
...., 1.875.000}

x : { x (1, 2, 3,
...., 121}
x : { x (1, 2, 3,
...., 2000}

Fonte: Elaborao da autora.

b) AMOSTRA: entendemos por amostra quando temos um conjunto significativo da populao


que apresenta as mesmas caractersticas e que a distingue de outros informantes. Nesse caso,
nenhuma caractersticas particular pode dominar a amostra e no estar presente em toda a
populao. Por exemplo: se nossa populao so os ces de nossa cidade, no pode a amostra
constituir-se s de fmeas, pois nesse caso acrescentaria uma nova caracterstica, que excluiria
uma parte dos ces da cidade.
No Dicionrio Aurlio (1995, p. 88), a definio 2 de amostra afirma que uma

poro, fragmento ou unidade de um produto natural ou fabricado destitudo de valor comercial, e


apresentado para demonstrar sua natureza, qualidade ou tipo (...). Em Farm. Amostra grtis de medicamentos que laboratrios farmacuticos distribuem, como propaganda, para conhecimento dos
mdicos. Amostra indeformada Constr. Amostra de solo obtida de tal modo que se podem considerar
como subsistentes nela todas as caractersticas que se verificam no local em que foram extradas.

Reunindo todos os resultados do Dicionrio Aurlio (1995, p. 88), que se referem ao conceito
estatstico observamos que amostra
18

EaD

mtodos estatsticos e a administrao

Subconjunto de uma populao por meio do qual se estabelecem ou estimam as propriedades ou caractersticas dessa populao (...) Amostra acidental, obtida por meio de um processo de amostragem
casual; (...) Amostra pequena que tem um nmero de elementos insuficientes para permitir fazer uma
estimativa no viciada1 dos parmetros2 da populao; (...) Amostra representativa que foi obtida por
um processo isento de vcio.

A partir destas explicaes podemos constatar que em quase todas as reas do conhecimento a amostra apresenta finalidades que tm suas bases apoiadas no sentido estatstico, isto
, pretende de forma sinttica, rpida, menos custosa e eficiente conhecer, estimar o comportamento da populao. Em Estatstica, pretendemos obter uma amostra que tenha um potencial
comprovado de fazer essas inferncias, de modo que dependemos de um bom delineamento
amostral: dimensionamento formal (por meio de frmula) do tamanho necessrio de unidades
amostrais, seleo aleatria e representatividade das caractersticas do perfil que interessa manter,
tais como por sexo (50% de mulheres e 50% de homens se for esta a composio da populao),
faixa etria, escolaridade...
Exemplificando: uma auditoria numa empresa identificou telefonemas dados a sua principal concorrente, e como foi constatado que algumas das promoes planejadas pela empresa
vazaram antes de serem postas em prtica, h necessidade de rapidamente detectar de qual(is)
linha(s) interna(s) partiu (partiram) as chamadas e verificar a demanda e o responsvel por elas.
Entendeu-se que inicialmente o processo por amostragem seria o mais rpido de realizar. Na
empresa existem 240 ramais telefnicos, e foram constatadas ligaes em 15% deles. Neste caso
definimos como:
Populao: Ramais com ligaes efetuadas para o principal concorrente
N = 36 ramais, N: tamanho da populao
Dimensionamento da amostra: n = 20
Numerados os ramais de U1 a U60, procedemos ao sorteio das unidades amostrais
Unidades amostrais conforme sorteio:

No viciada uma expresso estatstica que significa no tendenciosa, isto , um resultado confivel, que no sofreu interferncias
externas que o deturpassem.

Parmetros so os nmeros tpicos, tipo mdia aritmtica, obtidos em dados populacionais, enquanto que estatsticas so estimativas
destes parmetros obtidos num processo amostral.

19

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Quadro 2: Amostras sorteadas3 para a pesquisa e as reservas


RAMAL SORTEADO
Ordem

Ramal

Ordem

Ramal

Ordem

RESERVAS
Ramal

Ordem

Ramal

Ordem

Ramal

13

11

21

16

28

21

17

15

12

22

17

29

22

16

13

23

18

30

23

24

10

19

14

25

19

31

12

10

20

15

27

20

35

Fonte: Elaborao da autora.

Na seo seguinte vamos conhecer o outro lado do tratamento estatstico. Se por um lado
precisamos dos informantes, por outro necessitamos saber quais as informaes sobre a populao/amostra nos interessam e que so importantes para tirarmos concluses que respondam
as nossas perguntas/hipteses.

1.2.2 INFORMAES
Por informaes entendemos os prprios dados que sero trabalhados estatisticamente
com os mtodos estatsticos. O tema a ser investigado, as hipteses e os objetivos que definem
quais so as informaes de interesse nesse campo. Estas informaes so denominadas de
varivel aleatria.

VARIVEL ALEATRIA (VA)


Um problema bem estruturado tem suas principais variveis conhecidas. Por varivel
entendemos o conjunto de informaes de interesse que esto envolvidas no problema. Essas
informaes so aleatrias, isto , podem ser definidas num conjunto possvel de respostas, porm
se combinam ao acaso e no so predeterminadas. No so informaes isoladas, nicas, mas
cada unidade investigada apresenta uma resposta, que mostra diferenas entre elas, isto , tem
variedade, e apresenta respostas esperadas num grande conjunto de repeties.
Se avaliamos as caractersticas fsicas do produto principal da empresa podemos encontrar
informaes sobre tamanho, espessura, finalidade, valor, custo, cor, formato, tempo de produo,
materiais empregados na sua fabricao, mquinas utilizadas na produo, funo dos trabalha-

Sorteio realizado com o auxlio do Excel por meio da funo: Aleatrio ()*36, que gerou 20 ns entre os 36 ramais da Populao e mais
3 para reserva em caso de problemas de acesso ao ramal sorteado.

20

EaD

mtodos estatsticos e a administrao

dores envolvidos na produo, locais e formas de comercializao, durabilidade... Estas, portanto, so variveis envolvidas no produto. Observamos que algumas delas apresentam respostas
quantitativas e outras qualitativas.
Se considerarmos o exemplo utilizado para explicar a questo da amostra, podemos considerar que a metodologia a ser empregada na obteno dos dados a de quebra do sigilo telefnico nos ramais sorteados (este procedimento deve ser previamente autorizado). Sero colhidas
algumas informaes como: X1: autor da ligao, X2: cargo do autor da ligao, X3: tempo de
servio na empresa e X4: destinatrio da ligao; X5: cargo do destinatrio da ligao na empresa
concorrente, X6: data e X7: tempo da ligao; X8: assunto abordado na ligao, X9: abordagem
de assunto relacionado com os pr-lanamentos, X10: n de ligaes realizadas para a empresa
concorrente, X11: n total de ligaes, X12: frequncia de realizao, X13: relao das datas com
perodos de pr-lanamento de produtos, etc. Algumas respostas so categricas (qualitativas)
outras so numricas (quantitativas).
a. Variveis aleatrias qualitativas: so informaes cujas respostas so categricas que podem
apresentar uma ordem ou no entre as diferentes categorias de respostas. Permitem que se
codifique as diferentes alternativas possveis, so obtidas por meio de contagem de suas repeties, chamadas de frequncias (fi). Entre as variveis relacionadas anteriormente encontramos
como varivel qualitativa (VA Qualitativa):
Quadro 3: Exemplos de varivel qualitativa e sua classificao estatstica
Varivel
Cor
Funo dos trabalhadores envolvidos na produo
Durabilidade

Categorias

Classificao

branca, cinza, verde, azul, ver-

Varivel Aleatria Qualitativa

melha...

No Ordenvel

Projetista, operador de mquina,


alimentador de matria-prima,
carregador, pintor...
Mnima, Mdia, Mxima

Varivel Aleatria Qualitativa


No Ordenvel
Varivel Aleatria Qualitativa
Ordenvel

Fonte: Elaborao da autora.

b) Variveis aleatrias quantitativas: so variveis que apresentam valores quantitativos como


respostas. Podem ser somente valores inteiros (VA Quantitativas discretas) ou admitem valores
fracionrios (VA Quantitativas contnuas) como respostas. So finitas (N conhecido) ou infinitas
(N desconhecido). Podem ser enumeradas em ordem crescente ou decrescente, apresentam
valores mnimos (Li) e valores mximos (Ls), so obtidas por meio de tcnica de mensurao.
Entre as variveis relacionadas anteriormente encontramos como varivel qualitativa (VA
Qualitativa):
21

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Quadro 4: Exemplos de varivel quantitativa e sua classificao estatstica



Va ri v e l

Va l o r es

C u s t o de pr o d u o

X > R$ 00,00

N de t ra b a l ha d o r e s e n vo l v ido s n a pr o d u o

X ( 0, 1, 2, 3, .....)

C la ssi fi ca o
Varivel Aleatria Quantitativa
C o nt nua
Varivel Aleatria Quantitativa
Di screta

Fonte: Elaborao da autora.

Com esse Quadro 4 conclumos a apresentao da base necessria para constituir um trabalho estatstico, isto , seu objeto e seu objetivo, construdos na tica de buscar os informantes
e por meio deles obter as informaes necessrias para conhecer de forma ampla a temtica de
nosso interesse. Com as aplicaes pretendemos abrir um espao de uso desse contedo de forma
que possa alargar os horizontes do conhecimento estatstico. Lembre-se de que esta adequao
inicial em termos de linguagem, conceitos, identificaes, vo permitir que o seu tratamento dos
dados seja adequado e pertinente.

Seo 1.3
Aplicaes
a. Considere o exemplo dos ramais, as variveis sugeridas, complementando-as e classificandoas organizando um quadro como os utilizados anteriormente.
b. Organize trs estudos definindo:
A temtica, populao, N, amostra, n, sorteio, variveis e sua classificao.
No banco de dados (Inep/IBGE/PNAD) a seguir, defina Temtica, Populao, N, Variveis
e sua classificao:

22

EaD

mtodos estatsticos e a administrao

Tabela 1: Rendimento mdio mensal e nmero de profissionais por tipo de profisso segundo regies geogrficas e Brasil 2001
(Em R$ 1,00)
N de
profissionais

Brasil

Norte

Nordeste

Sudeste

Sul

Centro
Oeste

Professor da educao infantil

201.232

422,78

388,89

232,79

522,44

435,87

749,61

Professor de 1a a 4a srie

881.623

461,67

443,17

293,18

599,19

552,72

567,38

Professor de 5a a 8a srie

521.268

599,85

600,99

372,81

792,82

633,92

593,52

Funes adm. de nvel superior


em educao

139.575

849,16

753,20

549,60

1.092,85

738,27

834,86

Professor de nvel mdio

348.831

866,23

826,28

628,08

979,16

804,32

872,20

Suboficial das Foras Armadas

517.038

868,73

817,55

723,52

986,19

747,23

910,93

Professor-pesquisador no E.
Superior

6.448

898,80

215,33

1.150,16

946,56

712,65

875,47

Agente administrativo pblico

316.761

911,82

661,40

679,31

1.072,50

926,14

1.103,37

Administrador de empresas

502.895

1.202,86

986,87

774,85

1.411,18

1.057,85

1.123,93

Tcnico de nvel superior


pblico

421.318

1.310,56

1.053,94

794,02

1.586,97

1.308,30

1.876,79

Policial civil

72.743

1.510,64

1.344,46

1.320,40

1.457,90

1.488,02

2.087,23

Oficial das Foras Armadas

89.387

2.091,53

2.129,41

1.674,46

2.250,53

1.949,68

2.321,03

Economista

44.772

2.254,66

1.700,77

2.009,08

2.227,19

1.641,35

3.592,64

Auditor

68.870

2.408,40

3.512,94

1.584,94

2.588,47

1.986,32

3.133,88

Advogado

271.241

2.496,76

3.893,83

2.245,35

2.431,04

2.597,39

2.768,25

Professor de nvel superior

136.977

2.565,47

1.800,30

2.252,08

3.086,95

2.122,77

2.190,10

Delegado/Perito

13.973

2.660,52

2.753,91

1.347,25

2.650,73

3.714,45

5.969,61

Mdico

257.414

2.973,06

4.429,82

2.576,78

2.801,77

3.260,41

4.110,87

Juiz

10.036

8.320,70

5.905,38

8.038,88

9.018,42

9.750,00

7.331,08

Fonte: Pesquisa Nacional por Amostra de Domiclios (Pnad) 2001.


Nota: (1) Valor em R$ de setembro de 2001.

Obs. No estamos enfatizando o processo amostral nestas aplicaes da Unidade 1, posto que
esta ser tratada mais detalhadamente na Unidade 4.

23

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

RESUMO DA UNIDADE 1
Esta uma unidade essencial, pois nela conhecemos termos e significados que vo acompanhar nossos estudos at o final deste livro
e muito alm. Aprendemos que a Estatstica basicamente utiliza Informantes (Populao e Amostra) e Informaes (Variveis aleatrias
quantitativas e qualitativas) para descrever (Estatstica Descritiva),
projetar (Estatstica Inferencial) e estabelecer relaes (Estatstica
Aplicada). Neste curso vamos trabalhar esses trs nveis de conhecimento estatstico.

Referncias que consultamos especificamente para esta Unidade e sugerimos aos alunos
que consultem:
CHIAVENATO, Idalberto. Introduo Teoria Geral da Administrao. 4. ed. So Paulo:
Makron, 1993.
DRUCKER, Ferdinand P. A profisso de administrador. So Paulo: Pioneira Thompson
Learning, 1998.
FERREIRA, Aurlio Buarque de Holanda. Dicionrio da Lngua Portuguesa. Rio de Janeiro:
Nova Fronteira, 1995.
LACOMBE, F. J. M.; Heilborn, G. L. J. Administrao: princpios e tendncias. 1. ed. So Paulo:
Saraiva, 2003.
MONTANA, Patrick J. Administrao. 2. ed. So Paulo: Saraiva, 2003.
ARAJO, Luis Csar G. Teoria geral da Administrao: aplicao e resultados nas empresas
brasileiras. So Paulo: Ed. Atlas, 2004.
RIEGEL, John. Employee interest in company success-how can it be stimulated and maintained?
Address on industrial relations. Bureau of Industrial Relations; University of Michigan; Ann
Arbor, 1955. p. 25.

24

EaD

Unidade 2

mtodos estatsticos e a administrao

BANCO DE DADOS, TABELAS E GRFICOS:


Sistematizao e Apresentao de Dados
Ruth Marilda Fricke

OBJETIVO DESTA UNIDADE:


Dominar trs formas especiais de sistematizar e apresentar dados estatsticos transformando-os
em informaes de apoio na rea administrativa: bancos de dados, tabelas e grficos.

SEES DESTA UNIDADE:


Seo 2.1 Banco de Dados
Seo 2.2 Tabelas Simples Univariadas e Bivariadas com Variveis Qualitativas
Seo 2.3 Tabelas em Srie Numrica e Distribuio de frequncias com Variveis Quantitativas
Seo 2.4 Representao Grfica e sua Leitura
Seo 2.5 Aplicaes
As reas da Administrao e da Estatstica interagem a partir do momento em que ambas
trabalham com informaes da realidade. Estas informaes so mais bem conhecidas a partir do
tratamento estatstico, que permite uma viso mais global do comportamento dos dados quando
visualizados em sua individualidade, e das relaes que elas estabelecem entre si quando analisadas conjuntamente, em um plano bidimensional ou tridimensional. Esse tratamento, que se
inicia com o banco de dados, organizado em forma de tabelas e apresentado em forma de grficos. Com isso a Administrao potencializa as tomadas de deciso embasada em informaes
estatsticas que conduzem as ideias e sustentam os projetos da rea administrativa.
25

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Utilizaremos na apresentao deste contedo alguns indicadores calculados a partir de


estatsticas dos municpios gachos apresentados pelo IBGE; disponvel em: <www.ibge.gov.br/
cidades/default.php>. Acesso em: jun. 2009. Inicialmente precisamos entender que a diviso poltica do RS realizada em mesorregies, em nmero de 7, 35 microrregies e 496 municpios.
Vamos ento iniciar pela utilizao do banco de dados, uma espcie de planilha de dados
que apresenta no apenas os dados, mas as variveis, informa a populao, nmero de registros
e dados pareados1 de todas as unidades (populacionais ou amostrais) que esto sendo apresentadas.

Seo 2.1
Banco de Dados
Para dar incio ao tratamento estatstico necessitamos coletar dados que provm das perguntas que nos fazemos em relao nossa populao dentro da temtica que nos interessa.
Assim, se formos estudar a distribuio dos municpios da Microrregio de Trs Passos,
suas potencialidades econmicas e capacidade de atender demanda na regio em que est
estabelecida, podemos buscar dados sobre:

Pareados significa que todos os dados apresentados numa mesma linha referem-se mesma unidade e no podem ser isolados nem
misturados, pertencem quela unidade. Por exemplo, se temos idade, sexo, escolaridade, data de admisso na empresa, estas so sempre
informaes particulares do sujeito e no podem desconectar-se dele.

26

EaD

mtodos estatsticos e a administrao

Quadro 1: Codificao e varivel com classificao e categorias do banco de dados


X

N de ordem do municpio

X1

Mun

Municpio

X2

POP

Populao Residente Varivel aleatria quantitativa discreta

X3

PIB_cap

PIB per capita Varivel aleatria quantitativa contnua

X4

Cls_PIB

Classificao do PIB per capita Varivel aleatria qualitativa ordenvel [1) Pobre:
<7 mil dlares /ano; 2) Em desenvolvimento: de 7 a 24,99 mil dlares/ano; 3) Rico: >
25 mil dlares/ano ou mais]
N_agFin

N de agncias financeiras no municpio - Varivel aleatria quantitativa discreta

Valor_

Valor retorno do Fundo de Participao dos Municpios Varivel aleatria quantita-

FPM

tiva contnua

X7

Valor_ITR

Valor do Imposto Territorial Rural Varivel aleatria quantitativa contnua

X8

Ind_Res

N de indstrias por mil hab. Varivel aleatria quantitativa contnua

X5
X6

Classificao da relao entre indstrias por mil habitantes Varivel aleatria


qualitativa ordenvel [1) No industrializado < 1 indstria por 1000 hab.; 2) Pouco
X9

Cls_ind

industrializado 2 a 4,9 indstrias por 1000 hab.; 3) Mdia industrializao 5 a 10,9


indstrias por 1000 hab.; 4) Bem Industrializado 11 a 19,9 indstrias por 1000 hab.;
5) Industrial 20 indstrias por 1000 hab.;]

X10

rea

rea territorial do municpio em km Varivel aleatria quantitativa contnua


Classificao da rea territorial Varivel aleatria qualitativa ordenvel [1) Peque-

X11

Cls_rea

na < 200 km; 2) Mdio 200 a 500 km; 3) Grande 501 a 1000 km; 4) Extenso >
1000 km]

X12

Densidade

Densidade demogrfica Hab/km Varivel aleatria quantitativa contnua


Classificao da Densidade demogrfica Varivel aleatria qualitativa ordenvel

X13

Cls_Dens

[1) Alta densidade: > 1000 hab./km; 2) Grande densidade: 501 a 1000 hab./km; 3)
mdia densidade: 100 a 500 hab./km; 4) baixa densidade: < 100 hab./km]

Fonte: Elaborao da autora.

Nossa populao so todos os municpios da Microrregio de Trs Passos. Isso se constitui no nosso N, numeradas de 1 a N. Todas as informaes que obtivermos s nossas perguntas
constituiro nossas variveis. As informaes referem-se a cada um dos municpios, portanto
constituem informaes casadas, relacionadas, e no podem ser misturadas, pois cada uma est
ligada a um municpio em particular.
Trata-se, portanto, de uma relao de dados obtidos por meio de uma pesquisa, de um
levantamento de dados e contm todas as informaes que foram levantadas e as transformaes que foram realizadas para conseguir ampliar a base das mesmas. No banco de dados n 1,
27

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

as variveis bsicas so X1, X2, X3, X5, X6, X7, X8, X10. Com estas variveis foram feitas algumas
transformaes que resultaram nas variveis X4, X9, X11, X12, X13. Assim, o banco de dados vai se
constituindo com as variveis originais e as que so geradas a partir das mesmas.
As informaes dos municpios entraro nas linhas e as variveis nas colunas. O total de
municpios o N = 20, neste caso
Quadro 2: Banco de dados n 1 Municpios da Microrregio de Trs Passos
X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

Mun

POP

PIB_
cap

Cls_
PIB

N_
agFin

Valor_FPM

Valor_
ITR

Ind_
Res

Clsind Area

Barra do
Guarita

2.969

6.508

2.797.615,36

533,7

6.468

10.114

2.797.615,36

1.902,02

17

2.441

7.338

2.797.615,36

2.369,08

3.826

6.984

2.797.615,36

4.145,13

5.581

9.658

14.726
3.378

9.687
8.957

1
1

5.494

10.597

3.445

2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Boa Vista do
Buric
Bom Progresso
Braga
Campo
Novo
Crissiumal
Derrubadas
Dr Maurcio
Cardoso
Esperana
do Sul
Horizontina
Humait
Miragua
Nova Candelria
Redentora
So Martinho
Sede Nova
Tenente
Portela
Tiradentes
do Sul
Trs Passos
Vista Gacha

X11

X12

X13

X1

Cls
area

DenCls
sidadens
de

65

45,7

109

59,3

89

27,4

129

29,7

2.810.105,39

15.989,17 7

222

25,1

3
0

5.267.727,46
2.410.580,60

5.417,75
4.060,42

8
1

3
1

362
361

2
2

40,7
9,4

5
1

3.512.012,00

7.660,00

256

21,5

7.821

2.798.876,06

1.724,62

148

23,3

18.305
4.923
4.869

19.805
11.774
6.473

2
1
1

4
1
1

5.595.230,83 8.291,42
2.797.615,36 2.519,68
2.797.615,36 1.324,74

8
8
4

3
3
2

229
135
130

2
1
1

79,9
36,5
37,5

5
4
4

2.739

12.368

2.797.615,39

946,85

98

27,9

9.600

5.122

2.810.105,36

6.674,59

303

31,7

5.853

10.212

2.797.615,36

5.514,40

10

172

34,0

2.968

11.782

2.797.615,36

4.554,22

119

24,9

13.906

7.301

4.340.091,71

3.703,25

338

41,1

6.928

6.765

2.797.615,36

2.944,97

234

29,6

23.467

12.755

9.657.490,50

5.196,27

268

87,6

2.713

9.920

2.797.615,76

922,33

89

30,5

Fonte: IBGE/cidades.

O banco de dados na verdade uma listagem de todas as informaes obtidas, sejam elas
originais ou transformaes.
Nos casos em que as variveis forem qualitativas, utilizamos um cdigo para representar as
diversas categorias de resposta, como fizemos com a varivel Classificao do PIB per capita,
na qual utilizamos os seguintes cdigos, com as respectivas classificaes e faixa de dados:
28

EaD

mtodos estatsticos e a administrao

1) Pobre < 7 mil dlares/ano.


2) Em desenvolvimento 7 a 24,99 mil dlares/ano.
3) Rico-> 25 mil dlares/ano.
Se no obtivermos informao podemos assumir um cdigo nico para todo o banco de
dados representando a No Resposta: 99, 999 por exemplo. Essa informao ser contabilizada
como um valor no vlido e ser descontada do total para obtermos um percentual vlido sobre
as respostas vlidas. importante obtermos todas as respostas para os questionamentos feitos,
pois o excesso de No resposta pode inviabilizar a anlise e a retirada de concluses, isto ,
nossa base de informaes pode no estar realmente informando.
Na prxima seo vamos estudar os tipos de tabelas simples univariadas (uma nica
varivel na tabela) e bivariadas (duas variveis tratadas conjuntamente numa nica tabela,
apresentando o comportamento interativo das duas). Esse tratamento abrange as variveis qualitativas na maioria dos casos.

Seo 2.2
TABELAS SIMPLES Univariadas e Bivariadas Com Variveis Qualitativas
A tabela univariada apresenta uma nica varivel e tambm chamada de tabela simples.
utilizada para representar variveis qualitativas, cujas respostas so nominais, so categorias. A
estatstica neste caso est limitada a descrever o que ocorreu em termos de repeties. As partes
da tabela so: ttulo, barra de informaes, dados obtidos, barra de totais e fonte das informaes.
Nenhuma dessas partes pode faltar para que o trabalho estatstico tenha validade, seja feita uma
leitura das informaes obtidas e possam ser compreendidas.
1) Uma tabela deve apresentar um ttulo que apresenta a varivel que est sendo apresentada,
populao, local e tempo em que os dados foram coletados.
2) Na parte superior da tabela simples existe uma barra de informaes, em que constam todos
os tipos de informaes que sero apresentadas ou trabalhadas na tabela.
3) No corpo da tabela contabilizamos as repeties das respostas e calculamos o valor percentual.
As repeties so nmeros reais e absolutos, permitem avaliar a importncia das diferentes
categorias, no entanto s podemos comparar com outras variveis se o nmero de dados for
igual. Nesse caso, se a inteno fazer comparaes temos de utilizar um valor relativo, que
a porcentagem.
29

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

N: so as repeties de uma determinada resposta no banco de dados;


%: o valor relativo do N em relao ao total de respostas, o n

%=

N
*100
n

% vlido: o valor relativo calculado sobre o total de respostas vlidas, isto , n* = n NR,
N
no respostas. % =
*100, n* = n NR , ou seja:
n*

%.

%..vlido

f i*100
;
f i*100 ; % =
n NI
%=
n
NI :.mis sin g
Na parte inferior, uma barra com os totais, ou seja, as somatrias das colunas do N (fi) que

no caso representa o n, Total de dados, ( fi = n) e dos percentuais, cuja soma deve ser 100%.
Neste clculo vrios arredondamentos so possveis de serem utilizados: a) em primeiro
lugar, optamos por trabalhar com duas casas aps a vrgula para que os arredondamentos no
possuam efeito muito drstico, capaz de alterar a interpretao do resultado; b) utilizamos, preferencialmente, os seguintes critrios: se a 3 casa for um n no intervalo de 0 a 4, eliminamos
(exemplo % = 5/26*100 = 19,23077 19,23); se a 3 casa for um n no intervalo de 5 a 9, eliminamos e aumentamos um ponto na 2 casa (exemplo % = 6/26*100 = 23,07692 23,08).
Fonte: informa a provenincia dos dados, potencializando que se busquem mais informaes,
que as atualizemos e tambm referem a credibilidade dos dados.
Estes detalhes podem ser vistos na Tabela 1 a seguir.
Apresentamos um exemplo com base no banco de dados sobre a participao da populao
com 100 anos ou mais na populao com 60 anos ou mais segundo o local de moradia e sexo nas
UF/BR 2007. Esta tabela demonstra as duas possibilidades Presena de todas as Respostas e
presena de dados censurados NI (missing) ou seja, falta de informao:

%.deRaros.Mulher.Rural.com. > de.100anos


6
% = *100 = 23,08%
26

30

%..vlido.de.raros.MR.c. > 100.anos


6*100
%=
= 24%
.......26 1
NI :.mis sin g = 1

EaD

mtodos estatsticos e a administrao

Tabela 1: Participao de idosos com 100 anos ou mais no grupo de pessoas com 60 anos ou mais,
considerando sexo e local de moradia, nas diversas UF/BR 2007
Participao

MR

% MR

Raros (0 a 4/10 mil idosos)


N Mdio (5 a 14/10 mil idosos)
Grande N (15 ou +/10 mil idosos)
Total
NR
Total

6
14
5
25
1
26

23,08
53,85
19,23
96,15
3,85
100,00

% MR
vlido
24,00
56,00
20,00
100,00

HR

% HR

MU % MU

HU % HU

19
7

73,08
26,92

19
7

73,08
26,92

26

100,00

8
17
1
26

26

100,00

30,77
65,38
3,85
100,00

Fonte: IBGE/cidades.
Obs.: Siglas: MR Mulheres da rea Rural; HR Homens da rea Rural;
MU Mulheres da rea Urbana; HU Homens da rea Urbana;
Categorias da participao: Raros: % < 0,05; N Mdio: 0,05 a 0,14; Grande N: % > 0,14

Na Tabela 1 estamos avaliando a varivel Participao de Idosos com 100 anos ou mais no
grupo de Idosos da Populao com 60 anos ou mais, considerando diferentes informaes que
potencializam obter diferentes aspectos que podem ser comparados.
Estamos comparando os Estados segundo sua distribuio de longevidade a partir de diferenas apresentadas por sexo (H ou M) e por localizao (R ou U). Nesse caso a varivel a
mesma, as populaes apresentam caractersticas diferenciadas.
O comentrio que vamos apresentar a seguir de cada tratamento especfico dos dados
uma das diversas leituras dos resultados estatsticos. Procuramos, especialmente, nesse tipo
de comentrio:
apresentar inicialmente uma idia geral qual o tratamento estatstico permitiu chegar, auxiliando o leitor a enxergar nos resultados o que estes nos revelam, isto , encaminhando a
leitura na direo que compatvel com os objetivos para os quais os dados foram coletados;
sustentar as ideias, argumentaes com as estatsticas calculadas. Estas so argumentativas
por si prprias e devem convencer o leitor. Por exemplo, no basta dizer a maioria dos Estados, necessrio informar de quanto essa proporo para que ela convena o leitor sobre a
superioridade em termos de presena dessa categoria;
evitar referir todos os dados da tabela, apenas os que queremos colocar em destaque;
procurar apresentar informaes que esto subjacentes, retrabalhadas, tipo a soma de dois
dados, o complementar de algum deles.
Comentrio 1: Com base nesta tabela constatamos que a maior participao de
pessoas com 100 anos ou mais na populao idosa so as mulheres do meio rural (MR), que apresentam em 76% dos Estados um nmero mdio de idosos,
31

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

em torno de 5 a 14 idosos com 100 anos ou mais em cada 10 mil idosos (56%), 15 ou mais
idosos com 100 anos ou mais em cada 10 mil idosos (20%). A menor presena de homens
com mais de 100 anos, tanto no meio urbano como no rural. So raros (menos de 5 idosos com
100 anos ou mais em cada 10 mil idosos) em 73% dos Estados em ambos os casos.
Outro exemplo deste tratamento utilizando mltiplas tabelas para traar o perfil pode ser
vista na Tabela 2. Nesse caso, diferentes variveis so consideradas para uma mesma populao,
mas ainda tratadas isoladamente. O que muda a apresentao conjunta.
Vejamos ento, na Tabela 2, variveis da Microrregio de Trs Passos, apresentando seu
perfil econmico a partir de 5 delas: Porte dos municpios, Classificao da densidade demogrfica, Classificao pelo PIB per capita, N de Agncias Financeiras e Classificao n indstrias/
mil hab.

Tabela 2: Classificao dos municpios segundo potencial econmico da Microrregio de Trs Passos com 20 municpios 2
N=20
Porte dos Municpios
1 Pequeno Porte I (at 20 mil hab.)
2 Pequeno Porte II (20 a 50 mil hab.)

11

55,00

45,00

Classificao da densidade demogrfica*


1 (< 10hab. /km)

5,00

3 (20 a 29 hab./km)

40,00

4 (30 a 39 hab./km)

25,00

5 (40 e mais hab./km)

30,00

1 Pobre

19

95%

2 Em desenvolvimento

5%

45,00

15,00

25,00

5,00

5,00

5,00

Classificao pelo PIB per capita

N de Agncias Financeiras

Classificao n indstrias/mil hab.


1) No industrializado (<1/mil hab.)

5,00

2) Pouco industrializado (2 a 4,9/mil hab.)

35,00

3) Mdia industrializao ( 5 a 10,9 /mil hab.)

10

50,00

4) Bem Industrializado (11 a 19,9/mil hab.)

10,00

Fonte: IBGE/cidades.
* Todos os municpios apresentam densidade inferior a 100 hab./km2, logo tem baixa densidade demogrfica. A classificao evidencia 5 nveis (1 a 5) sendo 1 o menor e 5 o maior dentro do grupo

Fonte: Atlas de Desenvolvimento Humano, 2002.

32

EaD

mtodos estatsticos e a administrao

Estas variveis oferecem uma viso geral da Microrregio, no permitindo fazer destaques de municpios individualmente, mas pretende dar uma viso da Microrregio em termos
econmicos.
Comentrio 2: Utilizando o banco de dados da Microrregio de Trs Passos, buscamos fazer
uma avaliao do potencial econmico da riqueza da regio. Constata-se na Tabela 2 que so
20 municpios de pequeno porte (55% de nvel I com at 20 mil habitantes e 45% de nvel II com
20 a 50 mil habitantes), em sua maioria com baixo rendimento econmico e baixa densidade
demogrfica: menos de 100 hab./km2. Apenas trs municpios apresentam um destaque em
termos econmicos: Trs Passos, Crissiumal e Horizontina. Os demais apresentam populaes
pobres, com baixo rendimento e baixo potencial de desenvolvimento. Podemos observar que em
termos de PIB per capita (fatia do PIB por residente nos municpios da Microrregio), 95% dos
municpios podem ser considerados subdesenvolvidos/pobres, uma vez que o PIB per capita/
ano inferior a US $ 7 mil dlares/ano, o que daria uma base em torno de R$ 1000,00/ms.
Nessa Microrregio 45% dos municpios no dispem sequer de uma agncia financeira, e o
nmero mdio de agncias financeiras por municpio de 1,25. O nmero de indstrias para
cada mil habitantes indica que existem apenas dois municpios que apresentam uma maior
industrializao, com 11 a 20 indstrias por mil habitantes. 40% dos municpios so pouqussimo ou nada industrializados (menos de 5 indstrias por mil habitantes).

As tabelas bivariadas, por sua vez, apresentam simultaneamente duas ou mais variveis,
cada varivel uma dimenso. Quando trabalhamos com uma ou at duas dimenses os resultados do tratamento so simples de explicar e compreender, porm se trabalharmos com trs ou
mais dimenses torna-se bem mais complexo. Por isso vamos nos restringir a duas dimenses.
Ao sistematizar duas variveis vamos construir uma tabela bivariada, tambm chamada
de tabela cruzada, ou tabela de dupla entrada.
Estas variveis devem ser qualitativas ou ento transformadas em qualitativas pela organizao de dados quantitativos em intervalos tipo faixa etria, por exemplo. Uma varivel entra
na linha (li ) e outra na coluna (cj ) da matriz. Nas margens da Tabela teremos os dados de cada
varivel em separado, e no interior a frequncia conjunta (fij ), em que i representa a informao
da linha e j a informao da coluna. Se estamos tratando de sexo e consumo de determinado
bem, podemos ter os seguintes pares de informaes conjuntas: masculino e consome; masculino e no consome; feminino e consome; feminino e no consome. Resumidamente, temos os
seguintes pares: (M;C); (M;N); (F;C); (F;N). Vamos contar a repetio de cada par para formar
a frequncia conjunta. Se tivermos seis homens que consomem este bem, ento a primeira frequncia conjunta 6.
33

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Nas tabelas cruzadas temos trs tipos de frequncia relativa:


de linha (em relao a cada categoria da varivel que est na linha), permitindo saber como
essa categoria se distribuiu ante as que esto na coluna;
de coluna (em relao a cada categoria da varivel que est na coluna), permitindo saber como
essa categoria se distribuiu ante as que esto na linha;
do total (em relao ao total geral), permitindo saber como essa categoria se distribuiu ante o
grupo todo, total geral.
As frmulas para o clculo desses percentuais so estas:

%.de.linha
%i , j =

f i , j*100

li

%.de.coluna
; % = f i , j*100
i, j
cj

%.de.total
; % = f i , j*100
i, j
n

No exemplo:

%.de.consumo
%.de.total
%.de.sexo
6
f
6
;
;
%1,1 = *100 = 20,0% %1,1 = *100 = 11,8% %i , j = i , j*100
51
30
n
Para apresentar a tabela bivariada, ou tabela conjunta, estamos utilizando um exemplo do
banco de dados sobre o padro alimentar de um grupo de alunos. Encontramos inicialmente as
frequncias conjuntas e as frequncias marginais (estas formam os resultados como se fossem
uma tabela simples). A seguir, empregando as frmulas apresentadas anteriormente, calculamos
os percentuais, realizando logo a seguir o comentrio (leitura) das informaes sistematizadas
nessa tabela:
Tabela 3: Consumo de alimento light por sexo
Sexo\consumo
Masculino
% sexo
% consumo
% do total
Feminino
% sexo
% consumo
% do total
Total p/consumo
% sexo
% consumo
% do total

Consome
6
20,0
11,8
6,5
45
72,6
88,2
48,9
51
55,4
100,0
55,4

No Consome
24
80,0
58,5
26,1
17
27,4
41,5
18,5
41
44,6
100,0
44,6

Fonte: Registro de aula.

34

Total p/sexo
30
100,0
32,6
32,6
62
100,0
67,4
67,4
92
100,0
100,0
100,0

EaD

mtodos estatsticos e a administrao

Comentrio 3: Observa-se que a preocupao com o consumo de alimentos light, considerados com menor potencial de prejuzo sade, est associado com o sexo do consumidor:
mulheres consomem mais do que homens. Constata-se que maior entre as mulheres (72,6%
das mulheres) do que entre os homens (apenas 20% dos homens), referindo portanto que
88,2% do consumo realizado por pessoas do sexo feminino e 58,5% dos que no consomem
so homens.
Para fazer a anlise da tabela bivariada realizamos o mesmo tipo de recorte permitido nas
tabelas simples.
apresentar a idia sntese da inteno que motivou a tabela;
um cuidado o de no rediscutir todos os percentuais;
no utilizar todos os percentuais referentes a uma frequncia conjunta. Escolher o que melhor
expressa a inteno da pesquisa;
procurar embasar os comentrios com as estatsticas mais adequadas, isto , escolher o que vai
sustentar melhor, convencer melhor o leitor.
Ao fazermos a leitura da tabela temos de nos conscientizar de que o fazemos para terceiros,
que no tero a viso dos dados brutos e nem das diferentes maneiras pelas quais os mesmos
podem ser sistematizados, apresentados ou interpretados. Muitas relaes que esto subjacentes
aos dados podem ser ressaltadas nesses comentrios pelo autor, encaminhando a compreenso
que o leitor vai ter da temtica. Com isso, alertamos para a parcialidade do comentrio, no h
neutralidade nele. O autor deve assumir que conduz o leitor interpretao.
A seguir vamos apresentar outro exemplo: Condies Econmicas dos Municpios da Microrregio de Trs Passos, a partir do banco de dados n 1.
Tabela 4: N de Agncias financeiras segundo o porte dos municpios da Microrregio de Trs Passos em 2007.
Po r t e d o s m u n i c p i o s
Pe q u e n o Po r t e I
% rea
% agncias
% total
Pe q u e n o Po r t e I I
% rea
% agncias
% total
To t a l p o r Po r t e
% rea
% agncias
% total

N Agncias
0
7
63,6
77,8
35,0
2
22,2
22,2
10,0
9
45,0
100,0
45,0

1
2
18,2
66,7
10,0
1
11,1
33,3
5,0
3
15,0
100,0
15,0

2 ou mais
2
18,2
40,0
10,0
6
66,8
83,3
30,0
8
40,0
100,0
40,0

To t a l p o r A g n c i a s
11
100,0
55,0
55,0
9
100,0
45,0
45,0
20
100,0
100,0
100,0

Fonte: IBGE/cidades.

35

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Comentrio 4: O nmero de agncias financeiras no municpio depende do porte do mesmo.


Na Microrregio de Trs Passos observa-se que trs municpios apresentam melhores condies econmicas em termos de PIB per capita. O porte do municpio explica o nmero de
agncias financeiras observado em cada municpio. Assim, constata-se que 35% deles so
de Pequeno Porte nvel I, isto , com at 20 mil habitantes e no apresentam agncia financeira, enquanto que 30% so de Pequeno Porte nvel II, de 20 a 50 mil habitantes, e possuem
5 agncias financeiras.
Agora que construmos tabelas simples e cruzadas para sistematizar e apresentar as variveis
qualitativas, vamos ver como se organizam dados quantitativos. Basicamente a organizao de
dados quantitativos realizada com dois procedimentos distintos: Srie Numrica (uma relao
de dados no agrupados) e Distribuio de frequncias (os dados agrupados em intervalos).

Seo 2.3
Tabelas em Srie Numrica e Distribuio de Frequncias
com Variveis Quantitativas
A sistematizao dos dados de variveis quantitativas permite um pouco mais de tratamento estatstico. O nmero de informaes com as quais trabalhamos e a apresentao de um
comportamento padronizado ou no vo definir se a sistematizao ser feita por meio de Srie
Numrica (pequenas amostras, n<20), que trabalha com toda a informao individualizada, isto
, listada uma a uma, ou de Distribuio de frequncias (grandes amostras, n20), que distribui
as repeties dentro de intervalos, informando, portanto, que naquela faixa de valores existem
fi (frequncia, n), que so as observaes.
Na Srie Numrica, quando trabalhamos com pequenas amostras de tamanho menor do
que 20, listamos os valores de Xi (varivel aleatria) ordenados em ordem crescente, do menor
para o maior. Consideramos a listagem dos dados absolutos nesse caso, pois devido ao pequeno
tamanho da Amostra ou Populao, o agrupamento dos valores observados em intervalos significaria uma perda de informaes que inviabilizaria a compreenso do fenmeno. Aps fazer a
listagem dos dados ordenados o mximo que podemos obter, nessa fase inicial, so:
Informaes sobre o n, valor mnimo (Li Limite Inferior), o valor mximo (Ls Limite Superior), a amplitude total (At = Ls Li, Faixa de variao dos dados entre o maior e o menor).
Referncias para um agrupamento qualitativo, formao de categorias que reagrupem os
valores de forma nominal.
36

EaD

mtodos estatsticos e a administrao

Avaliao da composio do total pelo valor relativo da parte considerada. VR =

xi
n

xi

*100

i =1

Empregamos, para exemplificar, os dados referentes aos municpios que esto separados
por Porte, como municpios de Pequeno Porte Nvel I e II, da Microrregio de Trs Passos. No
caso dos Municpios de Pequeno Porte I ou II, observa-se que:

Quadro 3: Informaes bsicas da Microrregio de Trs Passos


Municpios de Pequeno Porte I
nI =
11
Li =
R$ 533,70
Li =
R$ 5.514,40
At =
R$ 4.980,70

Municpios de Pequeno Porte II


nII =
9
Li =
R$ 2.944,97
Li =
R$ 15.989,17
At =
R$ 13.044,20

Fonte: Elaborao da autora.

Apesar do nmero diferenciado de municpios de Pequeno porte por Nvel, n = 11 no


caso do Nvel I e n = 9 no Nvel II, a variao entre o menor valor do ITR no primeiro caso
de aproximadamente R$ 5.000,00 (0,5 a 5,5 mil reais), enquanto no segundo caso de quase 3
vezes mais (2,9 a 15,9 mil reais).

Tabela 5: Valor do ITR (Imposto Territorial Rural) nos municpios de Pequeno Porte Nvel I e II
da Microrregio de Trs Passos RS 2007.

N
1
2
3
4
5
6
7
8
9
10
11

Pequeno Porte I
Municpio
Valor_ITR
Barra do Guarita
533,70
Vista Gacha
922,33
Nova Candelria
946,85
Miragua
1.324,74
Esperana do Sul
1.724,62
Boa Vista do Buric
1.902,02
Bom Progresso
2.369,08
Humait
2.519,68
Braga
4.145,13
Sede Nova
4.554,22
So Martinho
5.514,40
Total
26.456,77

VR
2,02
3,49
3,58
5,01
6,52
7,19
8,95
9,52
15,67
17,21
20,84
100,00

N
1
2
3
4
5
6
7
8
9

Pequeno Porte II
Municpio
Valor_ITR
Tiradentes do Sul
2.944,97
Tenente Portela
3.703,25
Derrubadas
4.060,42
Trs Passos
5.196,27
Crissiumal
5.417,75
Redentora
6.674,59
Dr Maurcio Cardoso
7.660,00
Horizontina
8.291,42
Campo Novo
15.989,17
Total
59.937,84

VR
4,91
6,18
6,77
8,67
9,04
11,14
12,78
13,83
26,68
100,00

Fonte: IBGE/cidades.

37

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Estes dados so apresentados em forma de srie numrica pois em ambos os casos, n<20:3
municpios de Pequeno Porte I, nPPI = 11; Municpios de Pequeno Porte I, nPPII = 9. Agrup-los
e distribu-los em intervalos invivel porque ocorre muita perda de informao. Como so
valores quantitativos, procurou-se avaliar a contribuio total em cada grupo de municpios e a
participao de cada um deles nesse montante. Para calcular essa participao utilizamos o VR
= valor relativo, isto , a parte da cada municpio dentro do total do grupo.
Comentrio 5: O montante arrecadado de ITR nos Municpios de Pequeno Porte nvel II
aproximadamente o dobro do outro grupo, perfazendo quase 60 mil reais. O municpio que
mais contribui para o primeiro montante (R$ 26.456,77) So Martinho, que arrecada 20,84%
do valor total. O municpio que mais contribui para o segundo montante (R$ 59.937,84)
Campo Novo, que arrecada 26,86% do valor total. Aproximadamente 90,9% dos municpios de
Pequeno Porte I apresentam baixa arrecadao de ITR, enquanto que no grupo de municpios
de Pequeno Porte II, 66,7% dos municpios apresentam arrecadao mdia.
Com esse resultado poderamos formar 2 grupos de arrecadaes do ITR, apresentados a
seguir mediante tabelas simples, pois criaram-se a partir dessa informao estatstica dois grupos:
com baixa e mdia arrecadao, visualizados na Tabela 6:

Tabela 6: Classificao dos municpios segundo o porte e valor de ITR arrecadado na Microrregio de Trs Passos
Arrecadao

Intervalo

Baixa
Mdia
Total

< R$ 5.000,00
R$ 5.000,00

Pequeno Porte I
N
%
10
90,91
1
9,09
11
100,00

Pequeno Porte II
N
%
3
33,33
6
66,67
9
100,00

Fonte: Elaborao da autora com base nos dados do IBGE/cidades.

Na Distribuio de frequncias, quando trabalhamos com grandes amostras de tamanho


maior ou igual a 20, podemos adotar essa tcnica de agrupamento de dados, que uma ferramenta poderosa na sistematizao dos dados, pois apresenta bastante flexibilidade na escolha
da amplitude parcial e dos limites dos intervalos com pequena perda de informaes. As nicas
exigncias que se fazem nesse caso so:
a. que o Li seja includo no 1 intervalo, entendendo-se neste caso que o limite inicial do 1
intervalo no precisa necessariamente ser o Li, mas este deve estar obrigatoriamente contido
nele;

N PPI: nmero de municpios de pequeno porte I.


N PPII: nmero de municpios de Pequeno Porte II.

38

EaD

mtodos estatsticos e a administrao

b. que o Ls seja includo no ltimo intervalo, entendendo-se neste caso que o limite final do ltimo
intervalo no pode ser o Ls, mas tem de estar obrigatoriamente contido nele;
c. que todos intervalos precisam ter frequncia maior do que zero, isto , fi > 0.
Observadas risca estas exigncias, iniciamos o tratamento dos dados para um conjunto de
dados cujo n > 20.
Essa tarefa de sistematizao passa pelo levantamento das informaes bsicas, ordenao
em forma crescente do menor para o maior valor com o Ramo e Folhas, avaliao da ocorrncia de
valores soltos, fora do padro, por meio do Diagrama de Pontos, dimensionamento dos intervalos
mediante a Amplitude Parcial, construo da Distribuio de Frequncias (DF):
Informaes bsicas dos dados
Para iniciar o processo de agrupar os dados em intervalos precisamos saber o montante
de variao que deve ser distribudo em intervalos, usualmente de tamanho regular. Essas informaes podem ser obtidas sem qualquer tratamento prvio: n nmero de dados; Li valor
mnimo da distribuio de valores; Ls valor mximo do conjunto de observaes. De posse destas
informaes podemos calcular a faixa de variao dos dados pela diferena entre o mnimo e o
mximo. Este dado denominado de At = Amplitude total.

Quadro 4: Informaes bsicas necessrias para a construo de uma distribuio de frequncias


n=
Li =
Ls =
At =

N de valores
Menor valor
Maior valor
Faixa de Variao

Fonte: Elaborao da autora.

Ordenao dos dados por meio do Ramo e Folhas


Na natureza ou na sociedade quando obtemos os dados eles seguem uma sequncia aleatria que no mais das vezes no cumpre um ordenamento crescente. A distribuio de frequncias pressupe a construo de intervalos com padres regulares e crescentes de forma que
nos primeiros intervalos sero alocados os valores mais baixos e nos ltimos sero contados os
valores mais altos. Por isso, precisamos ordenar os dados de forma crescente. Como cada valor
representa uma observao, mesmo repetidas, cada uma deve constar para posterior contagem
da frequncia.
39

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Esta ordenao pode ser feita usando o programa Excel que classifica os dados por uma
varivel ou fazer uma ordenao manual. O modo manual comumente utilizado, o da ordenao
visual, muito demorado em grandes amostras. Temos uma outra alternativa, que da organizao em ramos e folhas.
Esta tcnica busca nos dados duas faixas de variao: uma para os ramos de variao
mais demorada, construda a partir da avaliao dos limites Li e Ls computada anteriormente
para o caso. Observamos de quanto a quanto os dados variam e construmos faixas de referncias de maior amplitude; outra para as folhas, que uma faixa de variao mais rpida dentro
da maior.
Por exemplo, se escolhemos uma variao nas dezenas para os Ramos, nas Folhas a variao ser das unidades. Aps organizar o Ramo e folhas, alocamos cada observao no Ramo
adequado e registramos a parte da observao que no aparece no ramo. A apresentao do Ramo
e Folhas fica assim, se as informaes bsicas fossem estas (referentes ao ITR dos municpios de
Pequeno Porte I da Microrregio de Trs Passos):

Quadro 5: Informaes bsicas necessrias para a construo de uma distribuio de frequncias


Li = R$ 0.533,00
Ls = R$ 15.989,00
Observaes:
534

1902

2369

4145

15989

5418

4060

7660

1725

8291

2520

1325

947

6675

5514

4554

3703

2945

5196

922

Fonte: Elaborao da autora.

Usando as informaes bsicas vamos considerar os valores de Li (R$ 0.533,00) e da Ls


(R$ 15.989,00) estrategicamente colocados um sobre o outro. Observando atentamente, verificamos que o primeiro valor inferior a mil, logo tem 0 (zero) milhares, e o mximo superior
a 15 mil. Podemos ento considerar o Ramo com a variao mais demorada: de 0 a 15 mil, e as
Folhas que apresentam uma Variao menor, ou seja, mais rpida na centena, dezena, unidade
000 a 999. Como verificamos que um grande vazio ocorre isolando o valor mximo, podemos
optar por informar todos os intervalos ou ento indicar apenas o vazio, como foi realizado no
quadro a seguir. Os dados so distribudos pelas linhas em acordo com o valor e a faixa correta,
registrando-se nas Folhas apenas o restante do nmero que no aparece no Ramo. Neste caso,
registramos centena, dezena e unidade. O passo seguinte ordenar os valores nas linhas. Este
processo pode ser acompanhado no Quadro 6:

40

EaD

mtodos estatsticos e a administrao

Quadro 6: Dados distribudos pela tcnica de Ramo e Folhas


RAMO E FOLHAS no ordenado
RAMO

FOLHAS

534

725

947

902

325

369

520

703

145

418

6
7

RAMO E FOLHAS ordenado na linha


RAMO

FOLHAS

922

534

725

922

947

325

902

945

369

520

945

703

.060

554

.060

145

554

514

196

196

418

514

675

675

660

660

291

291

15

989

15

989

Fonte: Elaborao da autora.

Com essa tcnica olhamos os dados apenas uma vez. So distribudos inicialmente j nas
faixas certas e posteriormente ordenados em cada faixa, de forma rpida.
Diagrama de Pontos
Outra tcnica importante para verificar se a padronizao dos dados est garantida, isto
, se no h nem um valor muito fora do padro, o Diagrama de Pontos. Faz-se uma rgua
parcial, dando conta da variao dos dados e se desenha um ponto para cada valor, respeitando
a primeira casa das Folhas apenas.
Com isso, ser possvel verificar se algum dos valores est muito fora do esquema e tambm concluir sobre a forma provvel da distribuio dos dados. Vamos enxergar as regies de
concentrao dos valores, e tambm, conseguimos visualizar as faixas de disperso em que os
pontos se tornam mais raros, dispersos.
Chamamos os valores fora do padro de pontos isolados, tecnicamente so os outliers.
Estes valores precisam ser reconhecidos, pois atrapalham a distribuio das observaes nos
intervalos, constituindo uma quebra da terceira regra que impe uma exigncia de frequncia
maior do que zero em todos os intervalos. Se a distncia entre o penltimo ponto e o outlier for
muito grande corremos o risco de ter fi = 0. Neste caso, este ponto deve ser descartado, colocado
em uma observao e o padro ser calculado com os pontos restantes. Necessariamente vamos
ter que redimensionar o n, Li ou Ls e o At. Vejamos como fica no exemplo dos Quadros 5 e 6.

41

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Quadro 7: Diagrama de Pontos dos municpios (em milhares)


o

10

11

12

13

14

15

Fonte: Elaborao da autora.

Neste Diagrama de Pontos observamos perfeitamente que a maioria dos municpios apresenta ITR de 0 a 8 mil reais; este , portanto, o padro destes municpios, no entanto encontramos
um valor que pode ser considerado um outlier: o 15.989. Ele se encontra afastado dos demais e
no poder ser agrupado, est fora do padro. Existe um vazio entre ele e o valor imediatamente
anterior de mais de 7.500 reais. O tratamento dos dados deve colocar este valor parte e informar
que temos um caso de valor fora do padro, outlier, portanto.
No se trata de perda de informao, mas sim de trat-la em separado para evitar tendenciosidades nas estatsticas. Os outliers tanto podem ser informaes corretas que apresentam
uma outra tendncia que no a do grupo de dados mais homogneos, quanto pode ser valor
incorretamente observado.
Excluindo-se este valor as informaes bsicas modificam e passam a ser:
Quadro 8: Informaes bsicas readequadas ao novo cenrio de ocorrncia de outlier
n=
Li =
Ls =
At =

19
R$ 534,00
R$ 8.291,00
R$ 7.757,00*

Fonte: Elaborao da autora.


* Excludo o valor de R$ 15.989 por estar fora do padro.

Amplitude Parcial (hi)


Aps o ajuste dos dados, o passo seguinte calcular o nmero e o tamanho dos intervalos
que vo dar lugar Amplitude Parcial (hi). A distribuio em faixas, usualmente, de igual tamanho, deve facilitar a leitura e a compreenso das informaes. Em alguns casos, como o de
faixas etrias da populao, interessante adotar as faixas comumente utilizadas pelo IBGE,
permitindo uma comparao com resultados censitrios. Este tambm o caso de faixa de renda,
tamanho de propriedades rurais que impem o uso de intervalos de tamanho diferenciado em
funo da extrema variao de renda e hectares, por isso interessante utilizar as faixas como
o faz o IBGE.
42

EaD

mtodos estatsticos e a administrao

O nmero de intervalos pode variar entre 4 e 10, tendo em vista que agrupar os dados pretende
facilitar a viso do conjunto de dados. Nesse caso o excesso de intervalos acabaria diluindo a
informao de forma a prejudicar a anlise. O nmero de intervalos dado pela

n . Caso o

resultado dessa raiz for superior a 10, possvel adaptar para um resultado mais favorvel.
A amplitude parcial (hi) o tamanho do intervalo, este resulta da aplicao de uma frmula,
cuja resposta deve ser olhada apenas como um indicador do entorno de amplitude a ser empregada. O ajuste deve sempre favorecer a visibilidade da informao, por isso nem sempre
o valor encontrado diretamente utilizado. necessrio fazer uma aproximao do mesmo
de forma a atingir os objetivos de sua utilizao. Essa aproximao permanece no entorno do
valor encontrado.

hi =

At
n

,. At = Ls Li

Distribuio de Frequncias (DF)


O passo seguinte a construo da tabela de Distribuio de Frequncias (DF). A ideia
distribuir a frequncia dos valores dentro das faixas construdas, mediante contagem delas no
Ramo e Folhas ordenado.
usual, tendo em vista a continuidade dos dados numa DF, utilizar um intervalo do tipo [ li
|------- ls ]. Esta forma indica que valores a partir de li estaro sendo contados no intervalo,
pertencem a ele, no entanto valores iguais a ls sero includos no intervalo seguinte;
deciso sobre o limite inicial do primeiro intervalo, lembrando que qualquer valor pode ser
utilizado, desde que se garanta a contagem de li nesse primeiro intervalo. A seguir, ls= li+ hi
permitir construir todos os intervalos;
checagem se o ltimo intervalo contm o ltimo valor. preciso verificar se ele no igual ao
limite superior (ls) do ltimo intervalo, pois nesse caso no ser contado no mesmo;
outra checagem fundamental quanto s frequncias (fi) em cada intervalo. Todas elas devem
ser maiores do que zero, fi> 0;
43

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Alm do fi, utilizaremos outros recursos para compreender o comportamento do fenmeno:


fa: frequncia absoluta acumulada. A ideia a de ir acumulando as frequncias observadas
de forma a verificar como elas se concentram. No primeiro intervalo, fa= fi; a partir de ento
ser acrescentada a do segundo intervalo e assim por diante fa2= fa1+ fi2
fr%: frequncia relativa percentual

fr % =

xi
* 100
n

fr%ac: frequncia relativa percentual acumulada, a primeira repete, a segunda fr%ac2= fr%ac1+
fr%2
Vejamos esta sequncia de tratamentos aplicados ao exemplo dos municpios da Microrregio de Trs Passos no que se refere ao ITR.
Informaes bsicas aps o ajuste de outlier
Como foi observada a presena de um outlier, a sua supresso gera modificaes nas
informaes bsicas.
Quadro 9: Informaes bsicas readequadas ao novo cenrio de ocorrncia de outlier
n=
Li =
Li =
At =

19
R$ 534,00
R$ 8291,00
R$ 7.757,00

Fonte: Elaborao da autora.

Clculo do tamanho do intervalo:

hi =

At
n

7.757,00 7.757, 00
=
= 1779,57 2. 000,00
4,3589
19

Como o valor para a raiz de n 4,3589, faremos aproximadamente 5 intervalos de tamanho


2 mil.
Tabela 7: Valor (R$ ) do Imposto Territorial Rural (ITR) arrecadado nos municpios da Microrregio de Trs Passos RS/2007
Valores de Xi
0

2.000
4.000
6.000
8.000

|-------|-------|-------|-------|-------

fi

fa

fr%

fr%ac

4.000
6.000

6
4
6

6
10
16

31,58
21,05
31,58

31,58
52,63
84,21

8.000

18

10,53

94,74

19

5,26

100,00

19

100,00

2.000

10.000

Fonte: IBGE/cidades.
Obs.: Exceto o municpio de Campo Novo com valor do ITR= R$15.989,17, representando 26,68% do
imposto arrecadado na microrregio, considerado outlier, isto , valor isolado, pois se encontra fora do
padro dos demais municpios.

44

EaD

mtodos estatsticos e a administrao

Comentrio 7: A arrecadao de ITR constitui-se de valores baixos (de 500 a 8,5 mil reais),
caracterizando pequenas propriedades na Microrregio, excetuando-se Campo Novo, que
apresenta um valor mais elevado, acima de R$ 15.000,00. Observa-se que em 84,21% dos
municpios a arrecadao do ITR foi inferior a 6 mil reais. Na faixa de menos de R$ 2.000,00
se concentram 31,58% dos municpios.
Na sequncia de nossos estudos vamos verificar como a utilizao de grficos facilita a
leitura dos dados que foram sistematizados em tabelas. A diferena entre usar tabela ou grfico
est na agilidade da informao ou no seu detalhamento: o grfico d um impacto direto, permitindo a visualizao rpida do comportamento geral dos dados, enquanto a tabela vai deixar
que o leitor conhea todos os detalhes desse comportamento, exigindo maior tempo de avaliao
para uma melhor compreenso do fenmeno. Vamos adiante?

Seo 2.4
Representao Grfica e Sua Leitura
Nada melhor do que um grfico para potencializar uma viso geral e rpida do comportamento dos dados. Os diagramas de colunas, barras, setores (pizza), linhas, pontos, so os mais
utilizados para apresentar tabelas simples e cruzadas e o histograma, polgono de frequncias e
setores (limitado a 7 intervalos na DF) para representar a distribuio de frequncias. O grfico
pode ser feito manualmente ou com auxlio de um software tipo Excel.
Um cuidado que devemos ter o de fazer uma escolha, ou utilizamos a tabela ou o grfico, nunca os dois ao mesmo tempo, pois apesar de permitirem vises diferenciadas (a tabela
um olhar detalhista, o grfico uma viso mais geral), as informaes so as mesmas, e faremos
uma repetio desnecessria e incmoda para o leitor. A nossa anlise que vai definir o que
pretendemos enfatizar naquele momento, permitindo a escolha.
A composio do grfico agrega essencialmente o ttulo, a figura e a fonte:
Ttulo: deve identificar a varivel apresentada, a populao de origem, local e tempo de ocorrncia. Quer dizer, o leitor do grfico deve ficar perfeitamente situado em relao s informaes
que lhe esto sendo apresentadas. O ttulo pode ser colocado na parte superior ou inferior da
figura, pode ser numerado e seguir um mesmo padro em todos eles.
Figura: A figura deve identificar as informaes que esto sendo apresentadas em cada eixo, de
preferncia apresentar os valores em % para permitir comparaes, uma vez que o valor absoluto
s permite comparaes quando os n so iguais. Outro cuidado extremamente importante
45

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

relativo escala de apresentao dos dados. Deve-se ter o cuidado de apresentar como se fosse
uma rgua, respeitando a base decimal. Algumas dicas na escolha dos grficos: escolha o de
colunas, se as categorias forem palavras curtas ou siglas; opte pelo de barras se as categorias
forem palavras longas ou expresses; adote o de linhas se estiver apresentando uma varivel
temporal, isto , que evolui no tempo; escolha o de setores (pizza) se o objetivo for comparar o
desempenho das alternativas e estas forem num nmero mximo de 7 categorias; o histograma
de frequncias se quiser representar uma Tabela de Distribuio de Frequncias.
Fonte: imprescindvel informar a fonte dos dados para agregar credibilidade e possibilidade
de voltar informao original se for o caso.
Um grfico sem estas trs partes no considerado um grfico.
Vejamos alguns EXEMPLOS de grficos:

GRFICO DE COLUNAS
Grfico 1: Distribuio dos municpios da Microrregio de Trs Passos

Grficosegundo
1: Distribuio
dosdemogrfica
municpios(hab./km
da Microrregio
2
a densidade
) RS/2007de Trs
Passos segundo a densidade demogrfica (hab./km) RS/2007
8

Municpios 4
2
0

1
(< 10)

(20 a 29)

(30 a 39)

(40 e mais)

Habitantes/km
Fonte: IBGE
Fonte: IBGE.

Comentrio: De forma geral podemos observar que a Microrregio de Trs Passos apresenta
uma densidade demogrfica igual a 20 hab./km, indicando uma boa concentrao populacional. O que mais ocorre so municpios com densidade entre 20 e 29 hab./km. O que menos
ocorre so municpios com pouca densidade, inferior a 10 hab./km.

46

EaD

mtodos estatsticos e a administrao

GRFICO DE BARRAS
Grfico 2: Distribuio dos municpios da Microrregio de Trs Passos por porte RS/2007

2 - Pequeno Porte II
(20 a 50 mil hab.)

Porte

Grfico 2: Distribuio dos municpios da Microrregio de Trs


Passos por porte - RS/2007.

11

1 Pequeno Porte I
(at 20 mil hab.)
0

10

12

N de muncpios
Fonte: IBGE
Fonte: IBGE.

Comentrio: A Microrregio de Trs Passos formada por 20 pequenos municpios. Observase que 55% deles so classificados como Pequeno Porte nvel I (< de 20 mil hab.) e 45% deles
como Pequeno Porte nvel II (de 20.001 a 50 mil habitantes).

GRFICO DE SETORES (PIZZA)


Avaliao
dodopotencial
municipal
a partir
doindstrias/10 mil hab.)
Grfico 3: Avaliao do Grfico
potencial 3:
municipal
a partir
Indicador de
Industrializao
(n de
Indicador de Industrializao (n de indstrias/10 mil hab.)
Microrregio de Trs Passos 2007
Microrregio d eTrs Passos - RS/2007.

10%

5%

35%

50%

1) No industrializado

2) Pouco industrializado

3) Mdia industrializao

4) Industrializado

Fonte: IBGE.

47

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Comentrio: A sociedade em geral tem a percepo que um municpio deve incentivar investimentos na instalao de indstrias visando a potencializar a criao de empregos. Observamos que 50% dos municpios tm de 5 a 10,9 indstrias/10 mil habitantes, uma concentrao
mdia. Apenas 5% das comunidades so No Industrializadas, certamente com atividades
mais rurais.

GRFICO DE LINHAS
Grfico
4: N de agncias
financeiras
no municpio
Grfico 4: N de agncias
financeiras
no municpio
Microrregio
de- Trs Passos RS/2007
Microrregio de Trs Passos - RS/2007.

50

40
30
20
10
0
0

N de Agncias
Fonte : IBGE

Fonte: IBGE.

Comentrio: Numa sociedade capitalista como a nossa, a funo das agncias financeiras
canaliza as movimentaes, no entanto, o avano das agncias virtuais por meio da Internet
minimiza a necessidade do acesso fsico no local de moradia. A agncia presencial facilita
a soluo de problemas por potencializar o contato pessoal. Na Microrregio, 45% das localidades no tm agncia financeira e isto explicado pelo porte dos municpios. Apenas trs
municpios apresentam trs ou mais agncias.

GRFICO DE TABELAS CRUZADAS (BIVARIADAS)


Grfico 5: Distribuio dos municpios (%) segundo o n de
Grfico 5:
Distribuio
dos municpios
segundo o -nMicrorregio
de agnciasde
financeiras
agncias
financeiras
e o porte(%)
do municpio
e o porte do municpio Microrregio de Trs Passos RS/2007
Trs Passos - RS/2007.
80

66,8

63,6

60
40

22,2

20

18,2

11,1

18,2

0
0

1
N de Agncias
Pequeno I Pequeno II

Fonte: IBGE.

48

2 ou mais

EaD

mtodos estatsticos e a administrao

Comentrio: A anlise dessa viso bidimensional corrobora com a opinio emitida no grfico
anterior. Os municpios que no tm agncia financeira so 63,6% dos de pequeno porte I
e os que possuem 2 ou mais agncias so 66,8% dos municpios de pequeno porte II. Desta
forma podemos verificar que existe uma associao entre a presena de agncias financeiras
e o porte do municpio na Microrregio de Trs Passos.

HISTOGRAMA DE FREQUNCIAS
Grfico 6: Arrecadao do ITR - Imposto Territorial Rural por

Grfico 6: Arrecadao do ITRmunicpio


Imposto na
Territorial
Rural pormunicpio
na Microrregio
Microrregio
de Trs Passos
- RS/2007. de Trs Passos RS/2007
35
30
25
20
15
10
5 0
0
0

31,58

31,58
21,05
10,53

2.000

4.000

6.000

8.000

10.000

ITR (R$)

Fonte:
IBGE.
Fonte:
IBGE

Comentrio: Entendemos que a Microrregio de Trs Passos tem uma tradio de pequenas
propriedades rurais e produo de alimentos com mo de obra familiar. As duas faixas de arrecadao que concentram os municpios incluem aqueles que arrecadam ITR < R$ 2.000,00
(31,58%) e ITR no intervalo de 4 a 6 mil reais tambm com 31,58% dos municpios. No geral,
85% das localidades arrecadam menos de R$ 6.000,00.
Nesses exemplos foi possvel comprovar que visualizar as informaes das tabelas por
meio de grficos torna a informao muito mais dinmica e rpida, porm tem suas limitaes
em termos de detalhes. Vejamos agora como aplicar estes conhecimentos. Seguem-se alguns
bancos de dados que precisam ser trabalhados conforme o conhecimento exemplificado at agora: tabelas simples uni e bivariadas, grficos, comentrios. Agilize-se e mostre o que aprendeu,
aproveitando para refazer os exemplos ampliando seu conhecimento.

Seo 2.5
Aplicaes
Para desenvolver habilidades na aplicao dos conceitos e tratamentos apresentados anteriormente, solicitamos que aplique o tratamento adequado nos seguintes bancos de dados:
49

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

1) Banco de dados nmero 2 apresenta algumas variveis sociais da Mesorregio Centro Ocidental Rio-Grandense por municpio, fornecidas pelo IBGE, com classificaes que foram
pesquisadas em artigos publicados na Internet para serem aqui atribudas. Como vimos, o RS
constitudo de sete mesorregies. A Centro-Ocidental abrange trs microrregies (Santiago,
Restinga Seca e Santa Maria) e 31 municpios. A abordagem pretendida com este tratamento
estatstico visa a construir um panorama referencial de informaes que dizem do exerccio
da democracia e cidadania por meio de Indicadores Sociais. Aproveite e complete os espaos
pontilhados:
Quadro 10: Informaes sobre variveis e categorias 456
N: N de ordem dos registros
Municpio: Varivel ............................ pois seus valores so ................................................................................;
X1: ndice de Pobreza, Varivel...............................................................................................................................;
X2: Classificao do ndice de Pobreza, Varivel aleatria ...................................................................................,
sendo 1) Baixa proporo (<15%); 2) Mdia Proporo (15 a 29%); 3) Alta proporo ( 30%)4
X3: ndice de Pobreza Subjetiva, V. A. ....................................................................................................................
X4: Classificao da Pobreza Subjetiva , V. A. ........................................................................................................
X5: ndice de Gini, Indicador de distribuio de renda, V. A. ...............................................................................
X6: Classificao do IG V. A. ........................... (0 a 8, (0-Igualdade e 8-Desigualdade), 0 -< 25; 1 25 a 29,9;
2 30 a 34,9; 3 35 a 39,9; 4-40 a 44,9; 5 45 a 49,9; 6 50 a 54,9; 7-55 a 59,9; 8 60 e mais5
X7: Residentes, V. A. ................................................................................................................................................
X8: Porte do municpio V. A, ...................................; ( 1: Pequeno I at 20 mil hab.; 2: Pequeno II 20001 a
50000; 3: Mdio 50001 a 100000; 4: Grande 100001 a 900000; 5: Metrpole > 900 000.6

Fonte: Elaborao da autora.

www.pnud.org.br/hdr/hdr97/rdh7-1.htm

Coeficiente de Gini, Origem: Wikipdia, a enciclopdia livre.

portalsocial.sedsdh.pe.gov.br/.../Gloss%E1rio%20tabela%20dos%20munic%EDpios.pdf

50

EaD

mtodos estatsticos e a administrao

Quadro 11: Banco de dados n 2: variveis sociais da Mesorregio Centro Ocidental Rio-Grandense por municpio
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

Mun
Agudo
Cacequi
Capo do Cip
Dilermando de Aguiar
Dona Francisca
Faxinal do Soturno
Formigueiro
Itaara
Itacurubi
Ivor
Jaguari
Jar
Jlio de Castilhos
Mata
Nova Esperana do Sul
Nova Palma
Pinhal Grande
Quevedos
Restinga Seca
Santa Maria
Santiago
So Joo do Polsine
So Martinho da Serra
So Pedro do Sul
So Sep
So Vicente do Sul
Silveira Martins
Toropi
Tupanciret
Unistalda
Vila Nova do Sul

Pobreza
17,35
34,21
999
20,31
23,21
21,99
20,37
29,94
25,67
15,96
19,72
20,12
30,37
22,12
28,63
17,49
22,83
22,66
21,02
25,26
26,76
14,18
18,29
26,3
27,43
23,61
18,86
15,79
30,05
25,9
24,67

Cls_pobr
2
3
999
2
2
2
2
2
2
2
2
2
3
2
2
2
2
2
2
2
2
1
2
2
2
2
2
2
3
2
2

Pobresubj
13,55
27,6
999
15,93
18,16
17,05
15,75
23,4
20,48
11,64
14,94
15,9
23,89
16,96
21,25
12,93
16,9
17,95
16,77
18,98
20,75
10,6
13,47
21
20,66
17,91
13,74
11,73
24,12
19,67
19,04

Cls_pobsubj
1
2
999
2
2
2
2
2
2
1
1
2
2
2
2
1
2
2
2
2
2
1
1
2
2
2
1
1
2
2
2

Igini
0,41
0,41
999
0,35
0,42
0,43
0,39
0,39
0,38
0,36
0,39
0,35
0,39
0,37
0,36
0,37
0,37
0,37
0,4
0,44
0,41
0,4
0,35
0,4
0,4
0,39
0,36
0,34
0,39
0,36
0,36

Cls_IG
4
4
999
3
4
4
3
3
3
3
3
3
3
3
3
3
3
3
4
4
4
4
3
4
4
3
3
2
3
3
3

Residentes
16.714
13.629
3.180
3.129
3.572
6.343
7.116
4.633
3.568
2.378
11.626
3.692
19.541
5.291
4.775
6.432
4.496
2.732
15.595
263.403
49.558
2.702
3.409
16.613
23.787
8.361
2.479
3.070
22.556
2.392
4.255

Porte
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
4
2
1
1
1
2
1
1
1
2
1
1

Fonte: IBGE, contagem 2007.


Obs.: 9)99 o cdigo para NI, NR, No Tem a informao.

Nossa pergunta relaciona-se com o Perfil da Pobreza na Mesorregio Centro Ocidental RioGrandense.
2) Banco de dados nmero 3 apresenta algumas variveis da Microrregio de Iju, com as
mesmas variveis do banco nmero 2, e responde mesma pergunta anterior, porm nesta
microrregio.

51

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Quadro 12: Banco de dados nmero 3: variveis sociais relacionadas com as condies de acesso
riqueza da Microrregio de Iju por municpio
N

Mun

Pobreza

Cls_

Pobre-

Cls_po-

pobr

subj

bsubj

Igini

Cls_IG

Residentes

Porte

Area_

Cls_

Densi-

Cls_

terr

area

dade

dens

1
2
3
4
5
6

Ajuricaba
Alegria
Augusto Pestana
Bozano
Chiapetta
Condor

19,3
25,42
16,4
999
24,55
23,17

2
2
2
999
2
2

13,79
20,1
11,98
999
19,3
17,76

1
2
1
999
2
2

0,37
0,38
0,37
999
0,37
0,38

3
3
3
999
3
3

7.261
4.789
7.273
2.296
4.078
6.607

1
1
1
1
1
1

323
173
347
201
396
465

2
1
2
2
2
2

22,5
27,7
21,0
11,4
10,3
14,2

4
4
4
4
4
4

Coronel Barros

15,98

12,36

0,35

2.441

163

15,0

8
9
10
11
12
13
14
15

Coronel Bicaco
Iju
Inhacor
Nova Ramada
Panambi
Pejuara
Santo Augusto
So Valrio do Sul

26,81
26,16
32,31
12,36
25,79
22,46
29,16
28,02

2
2
3
1
2
2
2
2

20,75
19,68
25,7
9,44
18,97
16,98
23,47
20,06

2
2
2
1
2
2
2
2

0,39
0,42
0,35
0,35
0,39
0,38
0,4
0,38

3
4
3
3
3
3
4
3

7.873
76.739
2.290
2.461
36.360
3.900
13.622
2.635

1
3
1
1
2
1
1
1

492
689
114
255
491
414
468
108

2 16,0
3 111,4
1 20,1
9,7
2
2 74,1
9,4
2
2 29,1
1 24,4

4
3
4
4
4
4
4
4

Fonte: IBGE/cidade.

necessrio acrescentar algumas definies de variveis s que j estavam definidas


anteriormente no Quadro 10.
Quadro 13: Informaes sobre variveis e categorias complementares
rea_territorial (km)

V. A. .....................

Cls_rea

V. A. ..................... (1. Pequeno (<200 km); 2. Mdio (200 a 500 km); 3. Grande (> 500 km)

Densidade Demogrfica
(hab./km)
Cls_densidade

V. A. .....................
V. A. ..................... (1. < 10; 2. 10 a 19; 3. 20 a 29; 4. 30 a 39; 5. 40 e mais)

Fonte: Elaborao da autora.

3) Banco de dados nmero 4 apresenta a srie histrica de algumas variveis econmico/sociais


coletadas na Regio Metropolitana de Porto Alegre.

52

EaD

mtodos estatsticos e a administrao

Quadro 14: Banco de dados nmero 4: variveis econmico/sociais coletadas


na regio Metropolitana de Porto Alegre por municpio
Ms
Perodo

na
srie

Tx desocupao

no
quer
trab

Cart
assim

Ms
Perodo

na
srie

Tx desocupao

no
quer
trab

Cart
assim

Ms
Perodo

na
srie

Tx desocupao

no
quer
trab

Cart
assim

mar/02

10,4

77,7

47,6

ago/04

30

7,3

84,8

47,6

jan/07

59

8,1

85,3

49,3

abr/02

11,2

80,7

48,1

set/04

31

8,4

86,5

47,3

fev/07

60

7,5

85,0

49,7

mai/02

10,8

80,0

49,3

out/04

32

7,0

87,3

46,9

mar/07

61

7,3

86,1

50,3

jun/02

9,4

80,3

47,3

nov/04

33

7,2

86,9

47,9

abr/07

62

7,1

86,1

48,8

jul/02

9,8

79,5

47,8

dez/04

34

6,5

88,7

46,4

mai/07

63

6,5

86,9

49,1

ago/02

8,5

80,7

47,4

jan/05

35

6,9

87,2

47,0

jun/07

64

7,8

87,4

49,5

set/02

9,4

81,7

47,8

fev/05

36

6,6

87,3

47,9

jul/07

65

7,5

88,2

49,3

out/02

8,3

79,8

47,0

mar/05

37

6,9

88,0

49,2

ago/07

66

7,9

88,8

50,8

nov/02

8,7

80,8

46,6

abr/05

38

6,5

87,3

49,5

set/07

67

6,7

89,0

49,8

dez/02

10

7,5

79,8

48,5

mai/05

39

6,9

86,6

49,2

out/07

68

5,9

89,3

49,3

jan/03

11

8,2

80,8

49,6

jun/05

40

6,2

86,0

49,6

nov/07

69

5,9

89,2

50,1

fev/03

12

8,7

81,8

49,1

jul/05

41

5,7

87,2

49,7

dez/07

70

5,1

88,6

50,2

mar/03

13

9,8

80,9

48,0

ago/05

42

6,7

87,0

49,7

jan/08

71

5,6

87,2

52,1

abr/03

14

9,3

79,0

47,2

set/05

43

7,6

87,9

48,9

fev/08

72

6,1

87,9

50,6

mai/03

15

9,7

79,4

46,9

out/05

44

6,4

88,4

49,1

mar/08

73

5,5

88,2

50,6

jun/03

16

11,0

81,5

45,7

nov/05

45

7,2

90,0

48,9

abr/08

74

6,9

87,0

50,3

jul/03

17

9,3

81,7

45,1

dez/05

46

6,5

89,1

49,8

mai/08

75

6,0

86,1

50,4

ago/03

18

10,0

82,9

47,2

jan/06

47

7,8

88,1

49,1

jun/08

76

5,9

86,3

50,9

set/03

19

10,6

83,2

46,9

fev/06

48

7,1

89,0

49,4

jul/08

77

5,8

86,6

52,1

out/03

20

9,9

84,3

47,7

mar/06

49

8,0

90,6

48,7

ago/08

78

5,6

87,4

51,0

nov/03

21

9,0

84,8

46,5

abr/06

50

7,8

91,0

48,8

set/08

79

5,6

87,7

51,4

dez/03

22

7,0

84,5

47,0

mai/06

51

8,9

88,4

48,6

out/08

80

5,7

87,9

51,5

jan/04

23

7,6

84,4

48,4

jun/06

52

7,9

87,4

48,4

nov/08

81

5,0

89,4

51,1

fev/04

24

7,4

84,4

48,2

jul/06

53

9,3

86,9

48,7

dez/08

82

4,4

86,8

51,6

mar/04

25

9,1

84,4

48,4

ago/06

54

7,7

87,0

49,2

jan/09

83

5,5

87,2

53,1

abr/04

26

9,2

83,5

48,4

set/06

55

8,1

88,1

49,9

fev/09

84

6,0

87,4

53,2

mai/04

27

8,8

86,2

48,0

out/06

56

8,2

88,7

49,8

mar/09

85

6,0

88,4

52,0

jun/04

28

8,7

84,0

48,6

nov/06

57

7,3

88,8

49,5

jul/04

29

7,8

83,9

47,8

dez/06

58

6,2

87,1

48,9

Fonte: IBGE, Diretoria de Pesquisas, Coordenao de Trabalho e Rendimento,


Pesquisa Mensal de Emprego mar. 2002-mar. 2009.

Classifique as variveis e crie a pergunta, faa o tratamento dos dados e analise.


5) Banco de dados nmero 5 apresenta dados das Unidades da Federao relativos participao
dos idosos e populao com 100 anos ou mais.

53

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Quadro 15: Banco de dados nmero 5: participao dos idosos e populao com 100 anos ou mais por UF/BR
Situao do domiclio
Urbana
Sexo
Idade
SP

Rural

Homens
100 ou
mais

Mulheres
100 e

60 e mais

mais/ 10
mil

87

464.003

100 ou
mais

Homens
100 e

60 e mais

mais/
10 mil

97

334.542

100 ou
mais

Mulheres
100 e

60 e mais

100 ou

mais/
10 mil

11

68.376

mais

100 e
60 e mais

mais/ 10
mil

17.690

RO

21.668

15.403

16.795

3.470

TO

24805

11

19721

13750

3171

PI

23

56.578

34

55.083

13

48.145

18.706

SC

22

102.609

32

79.422

45.780

14.038

CE

36

100.831

57

84.344

34

95.875

17

37.972

MO

16

55.743

14

37.788

21.794

3.659

PR

49

171.130

56

127.382

14

76.137

14

22.173

MS

21

59.602

15

45.913

14.288

3.140

PA

19

54.159

26

42.259

18

55.138

12

18.417

ES

19

40.829

41

31.419

13

24.310

7.625

MA

41

93.405

72

94.528

26

74.394

27

36.347

RS

32

188.766

76

156.827

14

101.524

24

32.002

AL

22

53.694

38

55.859

14

28.371

12

14.965

PB

37

87.113

58

90.234

23

45.917

20

21.044

10

PE

49

106.659

86

108.769

22

68.573

34

33.805

10

MG

139

369.719

235

303.217

49

156.357

57

55.542

10

GO

45

89.364

53

68.289

31.069

6.613

11

SE

26

32.837

48

38.943

12

19

19.580

10

15

12.032

12

RJ

31

104.947

53

87.452

18.150

11

8.324

13

BA

133

174.018

253

170.736

15

113

176.287

126

86.580

15

AM

11

39.727

14

38.731

17.301

4.619

17

AP

7336

6832

1381

502

20

RR

4273

3837

2324

496

20

RN

42

70.127

60

64.739

17

30.472

28

12.852

22

AC

9130

8565

4985

1305

Fonte: IBGE/Estados.

Classifique as variveis e crie a pergunta, faa o tratamento dos dados e analise.

RESUMO DA UNIDADE 2
Esta unidade foi dedicada a descrever um conjunto de dados obtidos por
meio de pesquisa, de levantamentos, de registros, de censos, mediante sua
sistematizao e apresentao em tabelas simples univariadas e bivariadas e grficos. Aprendemos que no se deve representar as informaes
obtidas por meio de grficos e tabelas simultaneamente, pois ambas vo
apresentar as mesmas descries. As tabelas sero elaboradas quando for
necessrio fornecer os detalhes e os grficos quando a inteno for obter
uma viso geral e rpida do comportamento da(s) varivel (eis).
54

EaD

Unidade 3

mtodos estatsticos e a administrao

MEDIDAS QUE DESCREVEM O CONJUNTO DE DADOS


Ruth Marilda Fricke

OBJETIVO DESTA UNIDADE:


Descrever o conjunto de dados quantitativos de forma sintetizada por meio da mdia e suas
alternativas e dominar a variao em torno das mesmas com a finalidade de conhecer sua
tendenciosidade, apoiando a escolha da medida apropriada para descrever comportamentos
padres na rea da administrao.

SEES DESTA UNIDADE:


Seo 3.1 Quadro-resumo das frmulas
Seo 3.2 Medida de Tendncia Central e de Variabilidade Conceitos e Operacionalizao
Seo 3.3 Aplicaes.
A coleta de dados e sua representao em tabelas e grficos permite uma viso detalhada
e circunstanciada da informao aliada ao espao e tempo que est descrevendo. Outra maneira de descrever esse conjunto de informaes express-lo por nmeros tpicos que consigam
sintetizar esse padro e forneam informaes comparveis entre diversos conjuntos de dados,
independentemente do tamanho da amostra que est sendo utilizada.
As medidas tpicas de uma varivel quantitativa so especialmente a mdia aritmtica, que
considera cada valor da varivel com a mesma importncia no conjunto de dados e verifica qual o
nmero que pode dar uma ideia desse comportamento. A populao , ento, analisada por esse
nmero, avaliando-se que cada observao entendida a partir dele, X i = mdia certo desvio.
Para facilitar o entendimento do tratamento descritivo e das relaes entre as medidas vamos
trabalhar de forma relacionada a mdia e a variabilidade e posteriormente as alternativas para
o caso de a mdia no se constituir numa informao vlida, isto , para o caso de apresentar
tendenciosidade.
55

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Seo 3.1
Quadro-Resumo das Frmulas
As medidas descritivas vo fornecer nmeros tpicos que descrevem o comportamento dos
dados. So elas as Medidas de Tendncia Central e as Medidas de Variabilidade. Para facilitar
o manuseio das frmulas necessrias para o clculo das estatsticas desta unidade vamos iniciar
com um quadro-resumo de frmulas.
As frmulas para o clculo das medidas descritivas so apresentadas somente para variveis
quantitativas com duas opes: para srie numrica (n< 20) e distribuio de frequncias (n
20), em dois quadros: um para as Medidas de Tendncia Central: Mdia ( X ), Mediana (Md)
e Moda (Mo), outro para as Medidas de Variabilidade: Varincia absoluta (s), Desvio padro
(s) e Coeficiente de Variao (CV).
Quadro 1: Quadro-resumo das frmulas das Medidas de Tendncia Central MTC
Me dida s

S r i e Nu m r i c a

Mdia Aritmtica
(

n a a m os t r a e

n a po pu la o )

X =
i =1

N par P =

Me dia n a (M d )

Di stri bui o de freqnci a s

xi
n

n
2

X =
i =1

, a M edi a na

n
2

(li + l s )
f i xi
,... X i =
n
2

a m d i a d o s d o i s v a lo res cen-

P =

t r a i s , i . . , d o P- simo valor e o

i nter v a lo m edi a no . Selec i o na o i n-

seguinte.

ter valo e retira todos os dados com

n +1
, a M edi a N mpar P =
2

exc e o da fa a que o fa a nteri o r.

n a o P- s i m o v alor.

lo ca li za r no

Md = li +

(P

f a o i m d,

faa )hi
fi

A m o d a n u m a s rie numrica
o v a l o r m a i s r e p etido, i., com

Moda (M o)

f i lo ca li za r no > f i o i m o , i nter-

c o n c e n t r a o m xima. A srie

valo modal. Seleciona o inter valo e

pode ser:

reti ra to do s o s da do s.

Am o d a l s e m m oda

d1
hi
Mo = li +
+
d
d
2
1
,
d1 = f m f ant d 2 = f m f post

U n i m o d al u m va lo r m o da l
B i m o d al d o i s va lo res m o da i s
P l u r i m o d a l m a is de do i s v a lo r e s m ai s r e p e t i d o s

f m : frequncia mxima
f ant : frequncia anterior mxima
f post : frequncia posterior mxima

Fonte: Elaborao da autora a partir da literatura estatstica.

56

EaD

mtodos estatsticos e a administrao

Entendemos que ser fcil para o estudante visualizar e comparar as diferenas que as frmulas apresentam quando so utilizadas em sries numricas ou distribuies de frequncias.
Fundamentalmente, compreendemos que a srie no apresenta grande dificuldade de
obteno das informaes e de compreenso de seu significado e do que elas indicam no caso
da tendncia central, pois apresenta uma listagem dos dados. A maior complexidade do clculo na distribuio de frequncias deve-se ao fato de que os intervalos no do visibilidade ao
valor em si, mas ao nmero de ocorrncias dentro do intervalo, respectiva faixa de variao
e principalmente ao fato de que no trabalhamos com o prprio valor, mas sim com um valor
representativo, que o ponto mdio. Isso exige uma certa disposio para recriar a informao.
As frmulas servem para recuper-la. Observa-se que para a Mdia Aritmtica e para a Varincia
as frmulas se modificam apenas pela incluso do Xi ponto mdio no caso da DF.

Quadro 2: Quadro-resumo das frmulas das Medidas de Variabilidade ou Disperso MV


Medidas

Srie Numrica

(s ou )

Distribuio de frequncias
n

2
i

x
2
S = (x )
i =1 n
se pequena amostra (n < 30) , aplica
2

Varincia Absoluta

Fator de Correo

n
FC =
n 1

S2 =
i =1

se pequena amostra (n < 30) , aplica


Fator de Correo

(s ou )
Coeficiente de
Va ria o ( C V )

FC =

S*2 = S. FC

S*2 = S. FC
D e s v io pa d r o

f i xi2
2
(x )
n

S = S2

S = S2

C V > 6 0 % , M o da pa dr o

S
CV = 100
X

S
CV = 100
X

n
n 1

C V < 3 0 % , M di a pa dr o
3 0 % C V 60% , M edi a na pa dr o
C V > 6 0 % , M o da pa dr o

IN 65% = X S ; X + S
In t e r v a lo d e N o rma lida de ( I N ) *

IN 95% = X 2 * S ; X + 2 * S
IN 99% = X 3* S ; X + 3* S

IN 65% = X S ; X + S
IN 95% = X 2 * S ; X + 2 * S
IN 99% = X 3* S ; X + 3* S

Fonte: Elaborao da autora a partir da literatura estatstica.


* O Intervalo de Normalidade s aplicvel quando a mdia vlida, isto , CV < 30%.

57

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Alguns conceitos bsicos so importantes e sero apresentados num quadro, permitindo


um debate e sua ampliao em pesquisa conceitual.
A seo a seguir vai tratar principalmente do clculo e interpretao dessas medidas.
importante para uma boa aprendizagem que todos os exemplos sejam retomados por voc.

Seo 3.2
Medida de Tendncia Central e de Variabilidade
conceitos e operacionalizao
Iniciamos com uma apresentao dos conceitos, propiciando que sejam discutidas as razes
que levam a sua utilizao. A ideia principal, como j foi expresso anteriormente, a de resumir
o comportamento dos dados em nmeros que sirvam de parmetro para sua anlise.
Como a informao mais usualmente empregada, e observa-se que ela influenciada pelos
valores extremos da varivel, importante que verifiquemos como os dados se concentram ou
se dispersam em relao mdia para avaliar a adequabilidade de seu uso ou a necessidade de
buscar medidas alternativas, como a mediana ou a moda.
Cada uma das Medidas de Tendncia Central vai olhar a centralidade dos dados por uma
tica:
Mdia centro em termos de massa
Mediana centro real
Moda centro em termos de concentrao
A variabilidade vai permitir concluir sobre a homogeneidade ou heterogeneidade dos valores obtidos em relao mdia aritmtica:
em sendo homogneos, a distribuio dos valores se concentra em torno da mdia;
em sendo heterogneos, a distribuio dos valores se dispersa em torno da mdia.

58

EaD

mtodos estatsticos e a administrao

Quadro 3: Quadro-resumo de conceitos bsicos para Medidas de Tendncia Central


e das Medidas de Variabilidade ou Disperso

MDIA ARITMTICA
MEDIANA

MEDIDAS DE TENDNCIA CENTRAL


Ponto de equilbrio da varivel em termos de massa
Ponto central da distribuio de dados separa o conjunto em dois grupos

MODA
VARINCIA ABSOLUTA
DESVIO PADRO
COEFICIENTE DE VARIAO
INTERVALO DE NORMALIDADE

de 50% cada
o valor mais frequente no conjunto de dados
MEDIDAS DE VARIABILIDADE
Mede os desvios quadrticos dos valores em relao mdia
Informa o desvio mdio dos valores em relao mdia
Valor relativo da variabilidade em torno da mdia, permite obter uma
concluso sobre a validade da mdia
Intervalo em torno da mdia considerando um afastamento mdio em
relao a ela

Fonte: Elaborao da autora com base em literatura estatstica.

As frmulas para o clculo das medidas descritivas so apresentados com duas variaes:
para Srie Numrica e para Distribuio de Frequncias (DF). Como podemos observar no
quadro resumo das frmulas, a principal diferena que na srie temos os valores individualmente e podemos som-los diretamente, enquanto que na DF eles esto dentro de um intervalo
de valores e o que sabemos a sua frequncia, isto , a sua repetio. Nesse caso, temos de
encontrar um valor que represente o intervalo. Este valor ser denominado de Xi, ponto mdio.
na verdade o meio do intervalo que adotamos como se todos os valores do intervalo fossem
iguais a ele. Por exemplo: num intervalo de 10 |----- 20 o ponto central 15 pois (10+20)/2
= 15, X =
i

(li + ls )

; logo, se nesse intervalo forem contados 5 valores, fi = 5, ento a soma dos


2
mesmos ser 5*15=75.
Vamos trabalhar com a aplicao desses contedos num banco de dados que traz informaes sobre o desenvolvimento das microrregies do RS e respectivas mesorregies.

59

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Quadro 4: Variveis, seus conceitos, categorias e tipo de varivel do banco de dados n 5


com as microrregies do RS e respectivas mesorregies
Microrregio , de acordo com a Constituio Brasileira de 1988, um agrupamento de
Microrregio

municpios limtrofes. Sua finalidade integrar a organizao, o planejamento e a execuo de funes pblicas de interesse comum, definidas por lei complementar estadual. VA qualitativa no ordenvel. Significado dos cdigos esto no banco de dados.
Mesorregio uma subdiviso dos Estados brasileiros que congrega diversos municpios de uma rea geogrfica com similaridades econmicas e sociais. Foi criada pelo

Mesorregio

IBGE e utilizada para fins estatsticos e no constitui, portanto, uma entidade poltica ou administrativa. VA qualitativa no ordenvel. Significado dos cdigos esto no
banco de dados.
O ndice de Desenvolvimento Humano (IDH) uma medida comparativa que engloba
trs dimenses: riqueza, educao e esperana mdia de vida. uma maneira padronizada de avaliao e medida do bem-estar de uma populao. O ndice vem sendo

IDH-Mdio

usado desde 1993 pelo Programa das Naes Unidas para o Desenvolvimento. Primeiros do mundo Islndia e Noruega IDH = 0,968. Va Quantitativa Contnua pode ser
transformada em VA qualitativa ordenvel ([1. Baixa (0 a 0,499); 2. Mdio (0,5 a 0,799);
3. Alto (0,8 a 1).
O produto interno bruto (PIB) representa a soma (em valores monetrios) de todos os
bens e servios finais produzidos numa determinada regio (quer seja pases, Estados,
cidades), durante um perodo determinado (ms, trimestre, ano, etc.). O PIB um dos
indicadores mais utilizados na macroeconomia com o objetivo de mensurar a ativida-

PIB per capita

de econmica de uma regio. Os indicadores econmicos agregados (produto, renda,


despesa) indicam os mesmos valores para a economia de forma absoluta. Dividindo-se
esse valor pela populao de um pas, obtm-se um valor mdio per capita. VA Quantitativa Contnua. Pode ser transformado em VA Qualitativa Ordenvel [ 1. Pobre PIB PC
< U$ 7 mil; 2.Em desenvolvimento (7 a 24,99 mil dlares); 3. Rico (> de 25 mil dlares)].
Densidade populacional, densidade demogrfica ou Populao relativa a medida
expressa pela relao entre a populao e a superfcie do territrio, geralmente aplicada a seres humanos, mas tambm a outros seres vivos (comumente animais). geralmente expressa em habitantes por quilmetro quadrado. O pas com a maior densidade

Densidade

populacional Mnaco (16.620) e a menor a Monglia (1). uma VA Quantitativa


contnua. Se transformada em faixas temos uma VA Qualitativa Ordenvel [1. Alta
densidade: mais de 1000 hab./km2; 2.Grande densidade: de 50 hab./km2 a 1000 hab./
km2; 3 Mdia densidade: de 10 hab./km2 a 500 hab./km2; 4 Baixa densidade: menos
de 100 hab./km2 ]

Fonte: Elaborao da autora com base em dados do IBGE.

60

EaD

mtodos estatsticos e a administrao

Quadro 5: Banco de dados nmero 5 com as Variveis sociais e econmicas


com as microrregies do RS e respectivas mesorregies

microrregio

cod_

cod_

microrre-

mesorre-

gio

gio

mesorregio

IDH_ mdio

PIB per capita

DENSIDADE

24. Restinga Seca

24

1 1.Centro Ocidental Rio-grandense

0,778

R$ 10.771,63

22,7

27. Santa Maria

27

1 1.Centro Ocidental Rio-grandense

0,824

R$ 7.107,62

31,8

29. Santiago

29

1 1.Centro Ocidental Rio-grandense

0,781

R$ 11.515,27

10,2

1. Cachoeira do Sul

2 2.Centro Oriental Rio-grandense

0,772

R$ 8.085,83

21,1

16. Lajeado-Estrela

16

2 2.Centro Oriental Rio-grandense

0,787

R$ 14.741,40

73,6

26. Santa Cruz do Sul

26

2 2.Centro Oriental Rio-grandense

0,782

R$ 15.779,80

57,1

2. Camaqu

3 3.Metropolitana de Porto Alegre

0,765

R$ 9.404,93

22,6

12. Gramado-Canela

12

3 3.Metropolitana de Porto Alegre

0,819

R$ 10.191,58

113,7

18. Montenegro

18

3 3.Metropolitana de Porto Alegre

0,819

R$ 14.885,89

94,4

20. Osrio

20

3 3.Metropolitana de Porto Alegre

0,792

R$ 7.222,50

37,1

23. Porto Alegre

23

3 3.Metropolitana de Porto Alegre

0,829

R$ 11.500,41

665,2

31. So Jernimo

31

3 3.Metropolitana de Porto Alegre

0,779

R$ 45.175,33

28,9

7. Caxias do Sul

4 4.Nordeste Rio-grandense

0,852

R$ 17.417,44

153

13. Guapor

13

4 4.Nordeste Rio-grandense

0,823

R$ 17.866,55

35,8

35. Vacaria

35

4 4.Nordeste Rio-grandense

0,754

R$ 11.381,48

9,4

6. Carazinho

5 5.Noroeste Rio-grandense

0,768

R$ 12.005,06

32,9

8. Cerro Largo

5 5.Noroeste Rio-grandense

0,756

R$ 10.470,75

30,17

9. Cruz Alta

5 5.Noroeste Rio-grandense

0,77

R$ 14.709,39

18,9

10. Erechim

10

5 5.Noroeste Rio-grandense

0,778

R$ 12.514,84

38,2

11. Frederico Westphalen

11

5 5.Noroeste Rio-grandense

0,758

R$ 8.743,02

33,8

14. Iju

14

5 5.Noroeste Rio-grandense

0,784

R$ 12.875,91

35,9

19. No-Me-Toque

19

5 5.Noroeste Rio-grandense

0,786

R$ 19.420,57

28,3

21. Passo Fundo

21

5 5.Noroeste Rio-grandense

0,797

R$ 13.922,97

45,3

25. Sananduva

25

5 5.Noroeste Rio-grandense

0,775

R$ 11.576,32

19,3

28. Santa Rosa

28

5 5.Noroeste Rio-grandense

0,813

R$ 11.606,43

47,1

30. Santo ngelo

30

5 5.Noroeste Rio-grandense

0,783

R$ 10.076,02

18,77

33. Soledade

33

5 5.Noroeste Rio-grandense

0,75

R$ 7.294,43

20

34. Trs Passos

34

5 5.Noroeste Rio-grandense

0,779

R$ 13.743,19

36,7

15. Jaguaro

15

6 6.Sudeste Rio-grandense

0,761

R$ 8.115,95

9,3

17. Litoral Lagunar

17

6 6.Sudeste Rio-grandense

0,786

R$ 16.766,70

27,9

22. Pelotas

22

6 6.Sudeste Rio-grandense

0,794

R$ 6.607,87

48,6

32. Serras de Sudeste

32

6 6.Sudeste Rio-grandense

0,744

R$ 8.152,46

7,4

3. Campanha Central

7 7.Sudoeste Rio-grandense

0,78

R$ 6.780,64

11,8

4. Campanha Meridional

7 7.Sudoeste Rio-grandense

0,777

R$ 8.631,31

12,6

5. Campanha Ocidental

7 7.Sudoeste Rio-grandense

0,789

R$ 10.588,69

12,8

Fonte: Elaborao da autora com base em dados do IBGE.

Para compreender a aplicao das medidas descritivas em ambos os casos, SN e DF, vamos
apresentar alguns exemplos usando e analisando as medidas propostas. Retome estes exercciosexemplos, pois esse procedimento muito importante. Se voc o fizer vai ter imediatamente a
noo de que acertou os resultados, pois pode compar-los com os que so apresentados na
seo seguinte.
61

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

3.2.1 OPERACIONALIZAO DE MEDIDAS DESCRITIVAS EM SRIE NUMRICA


A operacionalizao aqui pretendida vai desenvolver a busca de nmeros tpicos, conhecer
sua validade e utilizar a medida apropriada para avaliar o comportamento de variveis sociais
em algumas microrregies do RS.
Vamos trabalhar com a uma parte do banco de dados nmero 5. So 13 microrregies que
fazem parte da Mesorregio Noroeste Rio-Grandense. Como n = 13, vamos trabalhar em SN
Srie Numrica, listagem de dados por microrregio, uma a uma.
Quadro 6: Banco de dados nmero 5 com as variveis sociais e econmicas
com as microrregies do RS da Mesorregio Noroeste Rio-Grandense
n

Microrregio

6. Carazinho

0,768

12.005,06

32,9

0,589824

144.121.465,60

1.082,41

8. Cerro Largo

0,756

10.470,75

30,2

0,571536

109.636.605,56

912,04

9. Cruz Alta

0,770

14.709,39

18,9

0,5929

216.366.154,17

357,21

10. Erechim

0,778

12.514,84

38,2

0,605284

156.621.220,23

1.459,24

11. Frederico Westphalen

0,758

8.743,02

33,8

0,574564

76.440.398,72

1.142,44

14. Iju

0,784

12.875,91

35,9

0,614656

165.789.058,33

1.288,81

19. No-Me-Toque

0,786

19.420,57

28,3

0,617796

377.158.539,12

800,89

21. Passo Fundo

0,797

13.922,97

45,3

0,635209

193.849.093,62

2.052,09

25. Sananduva

0,775

11.576,32

19,3

0,600625

134.011.184,74

372,49

10

28. Santa Rosa

0,813

11.606,43

47,1

0,660969

134.709.217,34

2.218,41

11

30. Santo ngelo

0,783

10.076,02

18,8

0,613089

101.526.179,04

353,44

12

33. Soledade

0,750

7.294,43

20,0

0,5625

53.208.709,02

400,00

13

34. Trs Passos

0,779

13.743,19

36,7

0,606841

188.875.271,38

1.346,89

Total

10,097

158.958,90

405,4

7,845793

2.052.313.096,89

13.786,36

Fonte: Elaborao da autora com base em dados do IBGE.


Obs.: Denominamos as variveis neste estudo de X, Y e Z que so, respectivamente: X IDH_ mdio; Y
-PIB per capita (R$); Z -DENSIDADE

Questo em Estudo: Comportamento Padro da Mesorregio Noroeste Rio-Grandense em


Termos de Desenvolvimento.
Para desenvolver esta temtica precisamos conhecer as Medidas Descritivas dessa Mesorregio composta por 13 microrregies. Observando no Banco anterior temos trs variveis
quantitativas contnuas: IDH, PIB PC, Densidade, tal que X: IDH mdio (varia de 0,75 a 0,813);
Y: PIB pc (R$ 7.294,00 a R$ 19.421,00); Z: Densidade (18,8 a 47,1).
a. Medidas de Tendncia Central

()

a1. Mdia Aritmtica X

Inicialmente vamos calcular a Mdia Aritmtica, a mais conhecida das medidas de Tendncia Central para as 3 variveis (lembrando que X: IDH; Y: PIBpc ; Z: Densidade demogrfica).
62

EaD

mtodos estatsticos e a administrao

X =
i =1

xi 10,097
=
= 0,7766923 ,
n
13

Este IDH um ndice classificado como mdio pelas categorias expressas no Quadro 4, o
que no a pior situao, uma vez que a mdia do Estado de 0,785, ficando, portanto, estatisticamente na mesma situao do Estado.
n

Y =
i =1

yi 158.958,90
=
= R$12.227,61 ,
n
13

Este um PIB per capita mdio, que indica que nossa regio apresenta uma receita econmica insatisfatria, isto , a riqueza produzida no a retira da classificao de regio pobre,
em torno de US$ 7.000,00 (utilizando-se uma base de 2:1), prxima ao valor do estadual, R$
12.504,29, ficando, portanto, um pouco acima da do Estado, mas no seu entorno, indicando que
uma das mesorregies consideradas pobres no Estado, pois fica abaixo de US$ 7.000,00.
n

Z =
i =1

zi 405, 4
=
= 31,18hab. / km ,
n
13

Esta uma baixa densidade, uma vez que a mdia do Estado de 54,64 hab./km, ficando,
portanto, abaixo da do Estado, entendendo-se que pouco povoada, permitindo ainda expanso
em termos populacionais. Outro fator motivador dessa baixa densidade so as reas rurais, que
praticamente esto reduzidas a poucas famlias que resistem e concentrao da rea rural em
propriedades maiores com expanso do latifndio e s migraes urbanas em busca de melhores
condies de trabalho pela baixa industrializao da regio.
b. Mediana e Moda
Temos outras medidas descritivas alternativas para a Mdia: a Mediana e a Moda. As
outras medidas de Tendncia Central, Mediana (Md) e Moda (Mo), na srie numrica no dependem de grandes clculos, pois a mediana uma medida separatriz que separa o grupo em
dois, cada um com 50% das informaes e a moda informa qual o valor com maior frequncia,
isto , mais repetido.
Neste caso, a primeira providncia para o clculo destas duas medidas a ordenao dos
dados em ordem crescente. Essa providncia permite que rapidamente se visualize o valor central (Mediana) e o valor com maior repetio (Moda). Vamos agora calcular as outras medidas
de Tendncia Central para cada uma das 3 variveis: X, Y e Z.
63

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

b1. Varivel X: IDH-Mdio


Quadro 7: Varivel: IDH-Mdio, dados ordenados, para obteno da mediana e da moda
Valores por microrregies da Mesorregio Noroeste Rio-Grandense do RS
IDH_ mdio
Xi Ordenados
IDH_ mdio
Xi aproximados

0,750 0,756 0,758 0,768 0,770 0,775 0,778 0,779 0,783 0,784 0,786 0,797

0,813

10

11

12

13

0,75

0,76

0,76

0,77

0,77

0,78

0,78

0,78

0,78

0,78

0,79

0,80

0,81

Fonte: Elaborao da autora.

Para calcular a mediana (Md) consideramos que n = 13 mpar, logo a posio do valor
n + 1 13 + 1
mediano dada por: P=
=
= 7 valor , a mediana ento o P-simo valor de IDH. O
2
2
7 valor se observarmos no Quadro 7 0,778. Assim, conclui-se que 50% das microrregies no
apresenta IDH superior a 0,778, um valor considerado mdio (intervalo de 0,5 a 0,799).
Para calcular a moda (Mo) verificamos quais dentre as microrregies apresentam valores
iguais de IDH, implicando valor mais repetido. Para o caso de considerarmos trs casas decimais,
no encontramos valor repetido no IDH, podendo considerar a srie amodal.
Se considerarmos a aproximao para duas casas decimais, o valor mais repetido 0,78,
que ocorre 5 vezes, conforme pode ser observado no Quadro 7, formando uma srie unimodal.
Neste caso, o valor modal para IDH 0,78, confirmando a ideia de que a Mesorregio Noroeste
Rio-Grandense apresenta um ndice de Desenvolvimento Humano mdio. Como a Mdia de
0,776, Mediana 0,778 e Moda 0,78, podemos afirmar que a Moda no difere significativamente da Mdia e da Mediana e permitindo concluir que:

X Md Mo

Esta igualdade nos informa que estamos diante de dados com muita simetria, cuja concentrao central apresenta todas as 3 medidas, logo a curva dos dados tende a normal, simtrica
com concentrao central.
64

EaD

mtodos estatsticos e a administrao

b2. Varivel Y: PIB per capita


Quadro 8: Varivel: PIB per capita, dados ordenados, para obteno da Mediana e da Moda
PIB per capita ordenado
7.294,43 8.743,02 10.076,02 10.470,75 11.576,32 11.606,43 12.005,06 12.514,84 12.875,91 13.743,19 13.922,97 14.709,39 19.420,57

10

11

12

13

7,3

8,7

10,1

10,5

11,6

11,6

12,0

12,5

12,9

13,7

13,9

14,7

19,4

Fonte: Elaborao da autora.

Para calcular a Mediana (Md), novamente consideramos que n = 13 mpar, logo a posio
n + 1 13 + 1
do valor mediano dada por: P =
=
= 7 valor , a Mediana o P-simo valor que o
2
2
stimo valor do PIBC 12.005,06. Observa-se, portanto, que 50% das microrregies no apresenta
PIB per capita superior a R$ 12.005,06, um valor um pouco abaixo de US$ 7.000,00, confirmando
a classificao como regio pobre. Apenas dois municpios apresentam classificao de Regio
em desenvolvimento.
Para calcular a Moda (Mo), consideramos quais dentre as microrregies apresentam valores iguais de PIBpc. No encontramos valor repetido no PIB, podendo considerar a srie amodal.
Com uma aproximao para milhares, isto , dividindo todos os valores por mil, observamos que
o valor de PIBpc = 11,6 mil reais o nico repetido. Neste caso, como a Mdia de R$ 12.227,61
e a Mediana de R$ 12.005,06, verificamos que a Moda menor do que a Mediana e esta, por
sua vez, menor que a Mdia, indicando uma distribuio assimtrica:

X > Md > Mo

Esta desigualdade nos informa que estamos diante de dados com assimetria, cuja concentrao no central. Apresenta o ponto mais alto da distribuio, a Moda, nos valores mais
baixos, logo a curva assimtrica positiva.
b3.Varivel Z: Densidade
Quadro 9: Varivel densidade, dados ordenados, para obteno da Mediana e da Moda
DENSIDADE
DENSIDADE

18,8
1
19

18,9
2
19

19,3
3
19

20,0
4
20

28,3
5
28

30,2
6
30

32,9
7
33

33,8
8
34

35,9
9
36

36,7
10
37

38,2
11
38

45,3
12
45

47,1
13
47

Fonte: Elaborao da autora.

65

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Para calcular a Mediana (Md), novamente consideramos que n = 13 mpar, logo a posin + 1 13 + 1
o do valor mediano dada por: P =
=
= 7 valor , a Mediana o P-simo valor que
2
2
densidade= 32,9 hab./km. Observa-se, portanto, que 50% das microrregies no apresenta
densidade inferior a 32,9 hab./km, um valor um pouco maior que o valor mdio, que de 31,2
hab./km.
Para calcular a Moda (Mo), consideramos quais dentre as microrregies apresentam valores iguais de densidade. No encontramos valor repetido na densidade, podendo considerar
a srie amodal. Com uma aproximao para inteiros observamos que o valor de densidade =
19 hab./km o nico repetido. Neste caso, a Moda menor do que a Mediana e esta maior
do que a Mdia, indicando uma distribuio assimtrica, no entanto no dentro do padro, e
podemos concluir que:

X < Md > Mo

Esta desigualdade nos informa que estamos diante de dados com assimetria, cuja concentrao no central. Apresenta o ponto mais alto da distribuio, a Moda, nos valores mais
baixos, mas como a Mediana maior que a Mdia, podemos entender como uma curva tendendo
assimtrica negativa.
c. Medidas de Variabilidade
Para avaliarmos qual das trs medidas de Tendncia Central (Mdia, Mediana ou Moda)
consegue apresentar melhor o padro dos dados avaliamos a variabilidade. Como a Mdia
a mais utilizada e uma medida paramtrica, esta o melhor nmero tpico para evidenciar
a forma do padro de afastamento dos valores observados. Eles estabelecem uma relao, informam a variao em torno da Mdia. Vamos analisar a homogeneidade (valores distribudos
proximamente Mdia) ou heterogeneidade (valores muito espalhados, dispersos em relao
Mdia) dos dados com base nos afastamentos.
Entende-se que se a variao relativa dos afastamentos em torno da Mdia forem menores
do que 30%, esta considerada baixa, aceitvel, ento a Mdia representativa, vlida como
padro dos dados; caso a variao fique entre 30% e 60%, a variao considerada grande,
66

EaD

mtodos estatsticos e a administrao

grupo heterogneo, e a melhor medida para informar o padro a Mediana; em ltimo caso, se
a variao for maior que 60%, sem limite final, o grupo heterogneo e a medida que pode ser
considerada um padro para os dados a Moda.

()

| mdia X | mediana (Md )| mod a (Mo )


| .......................30%....................60%......................

CV

c1. Varivel X: IDH-mdio


Varincia Absoluta (s)
Vamos utilizar a frmula para srie numrica, pois o conjunto de dados tem n = 13 < 20.
n

S 2 = [
i =1

xi2
2 n , com fator de correo para pequenas amostras
(x ) ]
n 1
n

Vamos utilizar os somatrios que j foram realizados junto ao banco de dados. Vamos precisar da soma de xi, entendendo-se que cada valor da varivel vai ser colocado ao quadrado e
por fim somado.
n

S 2 = [
i =1

xi2
7,845793
2 n
13
(x ) ]
=[
(0,7766923)]* = 0,000294243

n 1
n
13
12

Apesar de este valor estar expresso na mesma unidade de valor da varivel, como uma
mdia quadrtica, isto , de diferenas elevadas ao quadrado, o resultado no vai ser avaliado
efetivamente.
Desvio Padro (s)
A partir deste momento os clculos seguem em sequncia, por isso o melhor deix-los
no visor da calculadora, sem deslig-la.

S = S 2 = 0,000294243 =0,01753533 unidades de IDH de diferena mdia entre os valores


e a mdia com um limite de 4 desvios padres a mais e 4 a menos.
Coeficiente de Variao (CV)
Com valores absolutos a comparao e compreenso do significado torna-se complicada,
por isso utilizamos uma medida relativa dessa variao, que o Coeficiente de Variao.

0,01753533
S
CV = 100 =
*100 = 2, 26%
X
0,7766923
67

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Como CV<30%, pois o desvio encontrado representa apenas 2,26% de afastamento em


relao mdia, podemos afirmar que se trata de um grupo homogneo e o padro do IDH o
indicado pela mdia = 0,777, revelando que a Mesorregio Noroeste Rio-Grandense tem um
ndice de Desenvolvimento Humano mdio.
c2. Varivel Y: PIB per capita
Varincia Absoluta (s)
Vamos utilizar a frmula para srie numrica, pois n = 13 < 20.
n

S 2 = [
i =1

xi2
2 n , com fator de correo para pequenas amostras
(x ) ]
n 1
n

Vamos empregar os somatrios que j foram realizados junto ao banco de dados. Vamos
precisar da soma de xi, entendendo-se que cada valor da varivel vai ser colocado ao quadrado
e por fim somado.
n

S 2 = [
i =1

xi2
2.052.313.096,89
2 n
13
(x ) ]
=[
(12227,61)]* = 9.052.107,829

n 1
n
13
12

Apesar de este valor estar expresso na mesma unidade de valor da varivel, como uma mdia quadrtica, isto , de diferenas elevadas ao quadrado, no vai ser avaliado efetivamente.
Desvio Padro (s)
A partir deste momento os clculos seguem em sequncia, por isso o melhor deix-los
no visor da calculadora, sem deslig-la.

S = S 2 = 9.052.107,829 =3.008,672104 reais de diferena mdia entre os valores e a mdia


com um limite de 4 desvios padres a mais e 4 a menos.
Coeficiente de Variao (CV)
Com valores absolutos a comparao e compreenso do significado torna-se complicada,
por isso utilizamos uma medida relativa dessa variao, que o Coeficiente de Variao.

3.008,672104
S
CV = 100 =
X
12.227,61

*100 = 24,6%

Como CV<30%, pois o desvio encontrado representa 24,6% de afastamento em relao


mdia, podemos afirmar que se trata de um grupo homogneo e o padro do PIB per capita o
indicado pela mdia = R$12.227,61, revelando que a Mesorregio Noroeste Rio-Grandense tem
um padro abaixo de 7 mil dlares.
68

EaD

mtodos estatsticos e a administrao

c3. Varivel Z: Densidade


Varincia Absoluta (s)
Vamos utilizar a frmula para srie numrica, pois n = 13 < 20.

xi2
2 n
, com fator de correo para pequenas amostras
S = [ (x ) ]
n 1
i =1 n
n

Vamos utilizar os somatrios que j foram realizados junto ao banco de dados. Vamos precisar da soma de xi, entendendo-se que cada valor da varivel vai ser colocado ao quadrado e
por fim somado.

xi2
13.786,36
13
2 n
(31,18)] * = 95, 6549 [hab./km]
S = [ (x ) ]
=[
13
12
n 1
i =1 n
2

Apesar de este valor estar expresso na mesma unidade de valor da varivel, como uma mdia quadrtica, isto , de diferenas elevadas ao quadrado, no vai ser avaliado efetivamente.
Desvio Padro (s)
A partir deste momento os clculos seguem em sequncia, por isso o melhor deix-los
no visor da calculadora, sem deslig-la.

S = S 2 = 95,6549 =9,780332305 hab./km de diferena mdia entre os valores e a mdia


com um limite de 4 desvios padres a mais e 4 a menos, neste caso, 36 a mais ou a menos.
Coeficiente de Variao (CV)
Com valores absolutos a comparao e compreenso do significado torna-se complicada,
por isso utilizamos uma medida relativa dessa variao, que o Coeficiente de Variao.

9,780332305
S
CV = 100 =
*100 = 31, 4%
X

31,18
Como 30%<CV<60%, pois o desvio encontrado representa 31,4% de afastamento em relao mdia, podemos afirmar que se trata de um grupo heterogneo e o padro da densidade
demogrfica no bem informada pela Mdia, sendo indicado usar a Mediana Md=32,9 hab./
km, indicando que a Mesorregio Noroeste Rio-Grandense tem um padro baixo de povoamento,
havendo espao ainda para o crescimento populacional.
69

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Concluso: Observa-se que a Mesorregio Noroeste Rio-Grandense um lugar com potencial


para se viver com espao de crescimento em termos de desenvolvimento, merecendo maior
ateno tanto por parte da esfera pblica como dos moradores. Observou-se um IDH mdio na
Mesorregio de 0,777, considerado um mdio indicador, sendo que este varia de 0,75 a 0,813,
um PIBPC baixo de R$ 12.227,61, um padro ainda abaixo do esperado, pois no garante
a superao da faixa de 7 mil dlares per capita, que a colocaria na condio de regio em
desenvolvimento. Apresenta espao de crescimento populacional, pois as estatsticas indicam
que as microrregies tm uma densidade em torno de 31,18 hab./km. A regio precisa ser
incentivada para gerar mais riqueza e promover maior distribuio da renda e da riqueza.

No tpico seguinte vamos mostrar como se calcula e interpretam as Medidas Descritivas


em dados agrupados em forma de Distribuio de Frequncias.

3.2.2 OPERACIONALIZAO DE MEDIDAS DESCRITIVAS EM DISTRIBUIO DE FREQUNCIAS


Considerando a situao em que os valores observados so em n> 20 e podem ser agrupados em faixas de frequncia, precisamos rever as frmulas a serem aplicadas no clculo das
medidas descritiva: tendncia central e de variabilidade.
Na prtica, a alterao observada na Mdia e nas medidas de variabilidade limitam-se
necessidade de calcular o ponto mdio do intervalo que representa os xis, e considerar que os
mesmos apresentam uma repetio expressa em termos de frequncia (fi). Este valor que vai
ser acrescentado nas frmulas da Mdia e da Varincia. Os demais clculos permanecem os
mesmos.
Estamos analisando agora o padro estadual a partir do banco de dados nmero 6, que
contm os dados das 35 microrregies do Estado do RS. Vamos utiliz-lo e as variveis presentes
para responder seguinte questo e poder comparar com o resultado da Mesorregio Noroeste
Rio-Grandense tratada a partir de uma anlise descritiva realizada em srie numrica, pois n=13
microrregies que fazem parte da mesma.
Questo em estudo: Qual o comportamento padro do Estado do Rio Grande do Sul em
termos de desenvolvimento?
70

EaD

mtodos estatsticos e a administrao

Neste momento, ao tratar do mbito estadual, vamos trabalhar com dados agrupados em
faixas empregando a Distribuio de Frequncias. No vamos desenvolver os clculos para a
construo da DF, mas apresentaremos as informaes bsicas necessrias para voc refazer
essa construo.
As medidas de Tendncia Central so medidas de posio, porque posicionam o conjunto
de dados na reta, isto , nos informam sobre os pontos em que ocorrem as respostas de nossas
variveis, neste caso, as mesmas utilizadas anteriormente: IDH-mdio, PIB per capita e Densidade populacional. O tratamento estatstico vai partir de uma DF, com os clculos necessrios
para realizar a anlise pretendida.
a1. Varivel X: IDH-mdio
Vamos comear pelo procedimento usual de agrupamento de dados (construo da Distribuio de Frequncias).
Quadro10: Informaes bsicas sobre o IDH-mdio das microrregies do RS
N
Li
Ls
At
Raiz n
Hi

35

0,744
0,852
0,108
5,916079783
0,018255332

0,02

Fonte: Elaborao da autora.

Depois destas informaes construmos a Distribuio de Frequncias com 6 intervalos


de tamanho 0,02, iniciando em 0,74, pois Li = 0,744, e finalizando em 0,86, uma vez que Ls =
0,852.
Tabela 1: Distribuio do IDH-mdio do RS por microrregio
0,74
0,76
0,78
0,80
0,82
0,84

Valores de Xi
|------|------|------|------|------|------Total

0,76
0,78
0,80
0,82
0,84
0,86

fi
5
11
12
3
3
1
35

fa
5
16
28
31
34
35

fr%
14,29
31,43
34,29
8,57
8,57
2,86
100,00

fr%ac
14,29
45,72
80,00
88,58
97,15
100,00

Xi
0,75
0,77
0,79
0,81
0,83
0,85

fi*xi
3,75
8,47
9,48
2,43
2,49
0,85
27,47

fi*xi
2,8125
6,5219
7,4892
1,9683
2,0667
0,7225
21,5811

Fonte: Elaborao da autora com dados do IBGE.

71

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Mdia Aritmtica ( x )
Para preparar a DF para o clculo da Mdia precisamos da coluna do Xi, ponto mdio (soma
dos limites do intervalo dividida por 2). Aps obter o ponto mdio, multiplicamos cada um pela
frequncia (fi*xi), que ser a soma dos valores nesse intervalo. Aps o clculo do ltimo produto
somamos e obtemos a soma geral que ser utilizada na frmula, como evidenciamos a seguir:
n

X =
i =1

f i xi 27, 47
=
= 0,785 , IDH-mdio do Estado do RS.
n
35

Apesar de ser um valor alto, ainda no se encontra na faixa dos melhores IDHs, que se inicia
em 0,8. O Brasil entrou pela primeira vez para o grupo de pases com elevado desenvolvimento
humano, com um ndice medido em 0,800 no ano de 2005. Em 2006 obteve uma melhora no
ndice de 0,007, com uma pontuao de 0,807. Encontra-se na 70 colocao mundial, posio
que j mantinha no ano anterior(Wikipdia, IDH, 14/7/2009).
Mediana (Md)
O clculo da Mediana numa DF deve ser feito a partir de uma frmula que recupere o
valor que separa o grupo em duas partes, com 50% cada. Inicialmente precisamos encontrar o
ponto central, ou seja, sua posio (P), que vai nos indicar em qual intervalo se encontra o valor
mediano.
Sua localizao ser feita na coluna do fa, aquele que contm o p-simo valor. Nossa referncia que o valor que se encontra naquele intervalo a posio do ltimo valor que foi contado
naquele intervalo. Nesse caso, o intervalo deve conter o valor P. Explicando mais concretamente,
se os valores do fa so 1, 5, 20,... isto significa que no primeiro intervalo s entrou um dado, do
2 ao 5 entrou no segundo intervalo, do 6 ao 20 no terceiro intervalo e assim por diante. Com
isso, se n=30, P = 15, valor que estar contido no 3 intervalo. Do intervalo mediano, que foi o
selecionado, retiraremos toda a informao necessria. A nica informao que no segue este
critrio o fa a (frequncia acumulada do intervalo anterior ao mediano). Quando o intervalo
mediano ocorrer no primeiro intervalo o fa a ser zero.

P =

n 35
=
= 17,5 l o c a l i z a o f a n o t e rc e i ro i n t e r v a l o , p o i s a s m i c ro r re g i e s
2 2

17 at a 28 se encontram nesse inter valo mediano, o im d . Seleciona o inter valo


e r e t i r a t o d o s o s d a d o s d o m e s m o c o m exc e o d a f a a , q u e o f a a n t e r i o r.

Md = li +

72

(P f aa )hi
fi

= 0,78 +

(17,5 16)0,02
= 0,7825
12

EaD

mtodos estatsticos e a administrao

Com isso entende-se que 50% das microrregies do RS no ultrapassam um IDH-mdio


de 0,783, tm ndices inferiores, mas no limite de 0,75, informando-nos que no RS nenhuma
microrregio muito problemtica em termos de desenvolvimento humano.
Moda (Mo)
Para obtermos informao sobre o valor que mais ocorre no conjunto de dados, aps o
agrupamento dos valores, devemos nos concentrar no intervalo que agrega o maior nmero de
informaes (> fi). Este ser denominado de intervalo modal (Imo). Esta localizao independe
da localizao da Mediana, pois so duas informaes diferentes, no entanto algumas vezes,
principalmente em funo da simetria da distribuio, as duas medidas utilizam o mesmo intervalo como referncia para o clculo. uma coincidncia, no uma regra. Quando o intervalo
modal ocorrer no primeiro intervalo o fa n t ser zero, e o mesmo ocorre se o> fi se encontrar no
ltimo, nesse caso, fp o s t ser zero.

f i localizar no > f i que 12, no terceiro intervalo, d1 = f m f ant = 12 11 = 1


o mesmo da Mediana neste caso, este considerado
em relao a ele o Imo (Intervalo modal). Seleciona o

d 2 = f m f post = 12 3 = 9

intervalo e retira todos os dados.

f m : frequncia mxima

d1
1
Mo = li +
hi = 0,78 +
* 0,02 = 0,782

1 + 9
d1 + d 2

f ant : frequncia anterior mxima


f post : frequncia posterior mxima

Comparando-se as trs informaes ( x = 0,785.. ..Md = 0,783.. ...Mo = 0,782 ) verificamos


que se trata de uma curva simtrica, pois a Moda no difere significativamente da Mdia e da
Mediana e podemos concluir que:

X Md Mo

Esta igualdade nos informa que estamos diante de dados com muita simetria, cuja concentrao central apresenta todas as 3 medidas, logo a curva dos dados tende normal, simtrica
com concentrao central, concluindo-se que o grupo bastante homogneo.
73

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Tendo em vista a necessidade de nos reportarmos Tabela 1 para avaliar a validade da


Mdia, vamos calcular logo a variao em torno da Mdia por meio das Medidas de Variabilidade, antes de fazermos o tratamento das outras variveis.
Com as Medidas de Variabilidade queremos responder seguinte questo:
O IDH mdio do RS vlido como padro para analisar o Estado?
Varincia absoluta (s)
Para calcular a varincia absoluta precisamos de uma coluna com o produto de cada fi
pelo quadrado do Xi, ponto mdio. Ao finalizarmos todos os produtos, a soma dos mesmos que
vai ser utilizada na frmula. Se n > 30, no h necessidade de aplicar o Fator de Correo [n/
(n-1)]. Neste caso n=35, ento a varincia ser calculada sem ele.
n

S2 =
i =1

f i xi2
(21,5811)
2
(x ) =
(0,785) = 0,000377857
n
35

Desvio Padro (s)


Ao calcular o desvio padro, ou seja, a informao que nos dir qual , em mdia, o afastamento dos dados em relao mdia, comumente vamos lembrar que nas pesquisas eleitorais
os resultados so informados num intervalo, por exemplo: (3% para mais ou 3% para menos).
Isto nos auxilia a perceber a importncia do desvio padro.

S = s = 0,000377857 = 0,019438544
Coeficiente de Variao (CV)
Para avaliar a validade da Mdia precisamos verificar quanto representa o desvio padro
em relao Mdia e aps tirar uma concluso com base no esquema que foi apresentado anteriormente.

0,019438544
S
CV = 100 =
100 = 2, 48%
X

0,785
Observa-se que a Mdia vlida, pois a disperso em torno dela tende a zero, < 30%.
Trata-se de um grupo homogneo de dados com pouqussima variao entre as microrregies,
uma vez que CV = 2,48%, caso tpico de simetria, como vimos anteriormente.
Nesse caso, a aplicao do Intervalo de Normalidade perfeitamente aplicvel.
74

EaD

mtodos estatsticos e a administrao

IN 65% = X S ; X + S =
{0,785-0,0004;0,785+0,0004}={0,7846;0,7854}

IN 95% = X 2 * S ; X + 2 * S =
{0,785-2*0,0004;0,785+2*0,0004}={0,7842;0,7858}

IN 99% = X 3* S ; X + 3* S =
{0,785-3*0,0004;0,785+3*0,0004}={0,7838;0,7862}
Respondendo, ento, questo inicial, formulamos a seguinte concluso:
Concluso: O padro de IDH do Estado gacho 0,785 com pouqussima diferena entre as
microrregies, podendo-se definir este IDH como representativo do comportamento estadual.
Tendo em vista que o IDH variando de 0,5 a 0,799 considerado um ndice de Desenvolvimento Humano mdio, entendemos que o RS apresenta um mdio padro de desenvolvimento.
Observando-se o intervalo de normalidade, conclumos que ainda esto faltando mais investimentos na rea social para que o IDH do Estado supere esse nvel, pois no IN99% o valor
mximo possvel de 0,786, no superando os limites desse intervalo.
a2. Varivel Y: PIB per capita
Vamos comear pelo procedimento usual de agrupamento de dados (construo da Distribuio de Frequncias).
Quadro 11: Informaes bsicas do PIB per capita das microrregies do RS
n

34

Li

R$ 6.607,87

Ls
At
Raiz n
Hi

R$ 19.420,57
12812,7
5,830951895
2197,359922

Fonte: Elaborao da autora com base em dados do IBGE.

Encontramos um outlier = R$ 45.175,33 da Microrregio de So Jernimo que se encontra


fora do padro. Por isso no conjunto analisado no Estado para fins deste tratamento estatstico
este foi descartado por ser impossvel agrup-lo com os demais. N = 34 ento 3 mil reais.
Depois destas informaes construmos a Distribuio de Frequncias com 6 intervalos
de tamanho 3 mil, iniciando em 6, pois Li = R$ 6.607,87 e finalizando em 21, uma vez que Ls
= R$ 19.420,57.
75

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Tabela 2: Distribuio do PIB per capita (em milhares de reais) do RS por microrregio

6
9
12
15
18

Valores de Xi
|-------|-------|-------|-------|-------Total

9
12
15
18
21

fi
10
11
8
4
1
34

fa
10
21
29
33
34

fr%
29,41
32,35
23,53
11,76
2,94
100,00

fr%ac
29,41
61,76
85,29
97,06
100,00

Xi
7,5
10,5
13,5
16,5
19,5

fi*xi
75
115,5
108
66
19,5
384

fi*xi
562,5
1212,75
1458
1089
380,25
4702,5

Fonte: Elaborao da autora com base em dados do IBGE.

Mdia Aritmtica ( x )
Para preparar a DF para o clculo da Mdia precisamos da coluna do Xi, ponto mdio (soma
dos limites do intervalo dividida por 2). Aps obter o ponto mdio multiplicamos cada um pela
frequncia (fi*xi), que ser a soma dos valores nesse intervalo. Aps o clculo do ltimo produto,
somamos e obtemos a soma geral que ser utilizada na frmula, como evidenciamos a seguir:
n

X =
i =1

f i xi 384
=
= 11, 294 mil reais
n
34

O PIB per capita estadual de R$11.294,00, abaixo do valor mnimo razovel: 7 mil dlares. Este desempenho indica que, no Estado, existem microrregies que fazem decrescer o valor
mdio e pelos padres mundiais uma regio pobre.
Mediana (Md)
O clculo da Mediana numa DF necessita ser feito a partir de uma frmula que recupere
o valor que separa o grupo em duas partes, com 50% cada. Inicialmente precisamos encontrar o
ponto central, ou seja, sua posio (P), que vai nos indicar em qual intervalo se encontra o valor
mediano. Sua localizao ser feita na coluna do fa, aquele que contm o p-simo valor. Deste
intervalo retiraremos toda a informao necessria. A nica que no segue este critrio o valor
do fa a (frequncia acumulada do intervalo anterior ao mediano). Quando o intervalo mediano
ocorrer no primeiro intervalo o valor do fa a ser zero.

n 34
=
= 17 localiza o f a no terceiro intervalo, pois as microrregies 17 at
2 2
a 28 se encontram nesse intervalo mediano, o imd. Seleciona o intervalo e retira todos
P=

os dados do mesmo, com exceo da faa que o fa anterior.

Md = li +

76

(P f aa )hi
fi

=9+

(17 10) *3
= 10,91
11

EaD

mtodos estatsticos e a administrao

Com isso, entende-se que 50% das microrregies do RS no ultrapassam um PIB per capita de R$ 10.910,00, tem ndices inferiores, mas no limite de R$ 6.607,87, informando-nos que
no RS a maioria das microrregies pode ser considerada pobre (26 delas tm classificao de
regio pobre, pois o PIB per capita inferior a 7 mil dlares, 9 delas podem ser consideradas em
desenvolvimento, pois o PIB fica entre 7 e 25 mil dlares.
Moda (Mo)
Para obtermos informao sobre o valor que mais ocorre no conjunto de dados, aps o
agrupamento dos valores, devemos nos concentrar no intervalo que agrega o maior nmero
de informaes (> fi). Este ser denominado o intervalo modal. Esta localizao independe da
localizao da Mediana, pois so duas informaes diferentes, no entanto algumas vezes, principalmente em funo da simetria da distribuio, as duas medidas utilizam o mesmo intervalo
como referncia para o clculo. uma coincidncia, no uma regra. Quando o intervalo modal
ocorrer no primeiro intervalo o fant ser zero, e o mesmo ocorre se o> fi se encontrar no ltimo,
nesse caso fpost ser zero.

f i loca liz a r no > f i que 1 2, n o s e - d1 = f m f ant = 11 10 = 1


gundo intervalo, o mesmo da mediana
neste caso, este considerado em relao

d 2 = f m f post = 11 8 = 3

a ele o i mo, i n t e r v a l o m o d a l . S e l e c i o n a o

f m : fr e q u n c i a m xi m a

i n ter valo e retira t odos os d a dos .

f ant : fr e q u n c i a a n t e r i o r m xi m a

d1
1
Mo = li +
hi = 9 +
*3 = 9,75

1 + 3
+
d
d
1
2

f post : fr e q u n c i a p o s t e r i o r m xi ma

O que mais frequente no Rio Grande do Sul so microrregies que apresentam um PIB
per capita em torno de R$ 9.750,00, um valor muito abaixo do esperado.
Comparando-se as trs informaes
( x = R$ 11.294,00, > ..Md = R$ 10.910,00.. > ...Mo = R$ 9.750,00 ) verificamos que se trata
de uma curva assimtrica positiva, pois a Moda o menor valor difere da Mdia e da mediana
e podemos concluir que:

X > Md > Mo

77

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Esta desigualdade nos informa que estamos diante de dados cuja distribuio assimtrica,
concluindo-se que o grupo heterogneo.
Tendo em vista a necessidade de nos reportarmos Tabela 2 para avaliar a validade da
Mdia, vamos calcular logo a variao em torno da Mdia por meio das Medidas de Variabilidade, antes de passarmos o tratamento das outras variveis.

Medidas de Variabilidade
O PIB per capita mdio do RS vlido como padro para analisar o Estado?
Varincia absoluta (s)
Para calcular a varincia absoluta precisamos de uma coluna com o produto de cada fi pelo
quadrado do Xi, ponto mdio. Ao finalizarmos todos os produtos a soma destes que vai ser
utilizada na frmula. Se n > 30, no h necessidade de aplicar o Fator de Correo [n/(n-1)].
Neste caso n=34 (um dos valores foi isolado por no apresentar o mesmo padro dos demais),
ento a varincia ser calculada sem ele.
n

S =
2

i =1

f i xi2
(4702,5)
2
(x ) =
(11, 294) = 10,75438753milreais
n
34

Desvio Padro (s)


Ao calcular o desvio padro, ou seja, aquela informao que nos dir qual , em mdia, o
afastamento dos dados em relao Mdia, importante lembrar que nas pesquisas eleitorais
os resultados so informados num intervalo, por exemplo: (3% para mais ou 3% para menos).
Isto nos auxilia a entender a importncia do desvio padro.

S = s = 10,75438753 = 3, 279388286 mil reais


Entende-se que o desvio mdio para mais e para menos em torno da mdia de R$
3.279,00.
Coeficiente de Variao (CV)
Para avaliar a validade da Mdia, precisamos verificar quanto representa o desvio padro
em relao Mdia e aps tirar uma concluso com base no esquema que foi apresentado anteriormente.

3, 279388286
S
CV = 100 =
100 = 29,04%
X
11, 294
78

EaD

mtodos estatsticos e a administrao

Observa-se que a Mdia vlida, pois a disperso em torno dela < 30%. Trata-se de um
grupo homogneo de dados com variao entre as microrregies, uma vez que CV = 29,04%,
no limite do permitido em termos de variao tendendo a 30%.
Concluso: que o PIB per capita do Estado gacho R$11.294,00 com pouca diferena entre
as microrregies, podendo-se considerar este PIB representativo do comportamento estadual,
indicando que uma grande parte das microrregies e o prprio Estado podem ser considerados
pobres.
a3. Varivel Z: Densidade
Vamos comear pelo procedimento usual de agrupamento de dados (construo da Distribuio de Frequncias).
Quadro 12: Informaes bsicas da densidade (hab./km) das microrregies do RS
N

34

Li

7,4

Ls
At
Raiz n
Hi

153
145,6
5, 830951895
24, 970194

Fonte: Elaborao da autora com base em dados do IBGE.

Encontramos um outlier = 665,2 hab. /km da Microrregio metropolitana de PoA que se


encontra fora do padro. Por isso no conjunto analisado no Estado para fins deste tratamento
estatstico este foi descartado por ser impossvel agrup-lo com os demais. N = 34 ento 25.
Depois destas informaes construmos a Distribuio de Frequncias com 6 intervalos
de tamanho 25, iniciando em 5, pois Li = 7,4 hab./km e finalizando em 150, uma vez que Ls =
145,6 hab./km.
Tabela 3: Distribuio da Densidade Populacional (hab./km) do RS por microrregio
Valores de Xi
5
|-------30
|-------55
|-------80
|-------105
|-------130
|-------Total

30
55
80
105
130
155

fi
17
12
2
1
1
1
34

fa
17
29
31
32
33
34

fr%
50,00
35,29
5,88
2,94
2,94
2,94
100,00

fr%ac
50
85,29
91,18
94,12
97,06
100,00

Xi
17,5
42,5
67,5
92,5
117,5
142,5

fi*xi
297,5
510
135
92,5
117,5
142,5
1152,5

fi*xi
5206,25
21675
9112,5
8556,25
13806,3
20306,3
58356,3

Fonte: Elaborao da autora com base em dados do IBGE.

79

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Mdia Aritmtica ( x )
Para preparar a DF para o clculo da Mdia precisamos da coluna do Xi, ponto mdio (soma
dos limites do intervalo dividida por 2). Aps obter o ponto mdio, multiplicamos cada um pela
frequncia (fi*xi), que ser a soma dos valores nesse intervalo. Aps o clculo do ltimo produto
somamos e obtemos a soma geral que ser utilizada na frmula, como evidenciamos a seguir.
n

X =
i =1

f i xi 1.152,5
=
= 33,9hab. / km
n
34

A densidade populacional mdia no Estado de 33,9 hab./km, classificada como razovel.


Este o padro das 34 microrregies, que diferem muito da microrregio metropolitana de Porto
Alegre, que apresenta uma densidade de 665,2 hab./km.
Mediana (Md)
O clculo da Mediana numa DF feito a partir de uma frmula que recupere o valor que
separa o grupo em duas partes, com 50% cada. Inicialmente precisamos encontrar o ponto central, ou seja, sua posio (P), que vai nos indicar em qual intervalo se encontra o valor mediano.
Sua localizao ser feita na coluna do fa, aquele que contm o p-simo valor. Deste intervalo
retiraremos toda a informao necessria. A nica que no segue este critrio o fa a (frequncia
acumulada do intervalo anterior ao mediano). Quando o intervalo mediano ocorrer no primeiro
intervalo o fa a ser zero.

n 34
=
= 17 localiza o f a no terceiro intervalo pois as microrregies 17 at
2 2
a 28 se encontram nesse intervalo mediano, o imd. Seleciona o intervalo e retira

P=

todos os dados do mesmo com exceo da faa, que o fa anterior.


(P f aa )hi = 5 + (17 0) * 25 = 30.hab. / km
Md = li +
fi
17
Com isso, entende-se que 50% das microrregies do RS no ultrapassam uma densidade
de 30 hab./km, apresentando uma densidade inferior a 30, indicando que no RS a maioria das
microrregies pode ser considerada pouco povoada.
Moda (Mo)
Para obtermos informao sobre o valor que mais ocorre no conjunto de dados, aps o
agrupamento dos valores, devemos nos concentrar no intervalo que agrega o maior nmero de
informaes (> fi). Este ser denominado de intervalo modal. Esta localizao independe da
80

EaD

mtodos estatsticos e a administrao

localizao da Mediana, so duas informaes diferentes, no entanto algumas vezes, principalmente em funo da simetria da distribuio, as duas medidas utilizam o mesmo intervalo como
referncia para o clculo. uma coincidncia, no uma regra. Quando o intervalo modal ocorrer
no primeiro intervalo o fa n t ser zero, e o mesmo ocorre se o (> fi) se encontrar no ltimo, ou
seja, fp o s t ser zero.

f i localizar no > f i que 17, no primeiro intervalo, d1 = f m f ant = 17 0 = 17


o mesmo da Mediana neste caso, este considerado em
relao a ele o imo intervalo modal. Seleciona o intervalo

d 2 = f m f post = 17 12 = 5

e retira todos os dados.

f m : frequncia mxima

d1
17
Mo = li +
hi = 5 +
* 25 = 24,3.hab. / km

17 + 5
d1 + d 2

f ant : frequncia anterior mxima


f post : frequncia posterior mxima

Entendemos que a densidade populacional mais frequente de 24,3 hab./km. Comparandose as trs informaes, ( x = 33,9.hab. / km .. > ..Md = 30.ha. / km .. > ..Mo = 24,3.hab. / km ), verificamos
que se trata de uma curva assimtrica positiva, pois a Moda o menor valor, difere da Mdia e
da Mediana e podemos concluir que:

X > Md > Mo

Esta desigualdade nos informa que estamos diante de dados cuja distribuio assimtrica,
concluindo-se que o grupo heterogneo.
Tendo em vista a necessidade de nos reportarmos Tabela 3 para avaliar a validade da
Mdia, vamos calcular logo a variao em torno da Mdia por meio das Medidas de Variabilidade, antes de realizarmos o tratamento das outras variveis.

Medidas de Variabilidade
A densidade populacional mdia do RS vlida como padro para analisar o Estado?

81

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Varincia absoluta (s)


Para calcular a varincia absoluta precisamos de uma coluna com o produto de cada fi pelo
quadrado do Xi, ponto mdio. Ao finalizarmos todos os produtos a soma destes que vai ser
utilizada na frmula. Se n > 30, no h necessidade de aplicar o Fator de Correo [n/(n-1)].
Neste caso n=34 (um dos valores foi isolado por no apresentar o mesmo padro dos demais),
ento a varincia ser calculada sem ele.
n

S2 =
i =1

f i xi2
(58356,3)
2
(x ) =
(33,9) = 567,1517647(hab. / km )
n
34

Desvio Padro (s)


Ao calcular o desvio padro, isto , aquela informao que nos dir qual , em mdia,
o afastamento dos dados em relao Mdia, comumente vamos lembrar que nas pesquisas
eleitorais os resultados so informados num intervalo, por exemplo: (3% para mais ou 3% para
menos). Isto nos auxilia a perceber a importncia do desvio padro.

S = s = 567,1517647 = 23,81494835.hab. / km
Entende-se que o desvio mdio para mais ou para menos em torno da mdia de 23,815
hab./km.
Coeficiente de Variao (CV)
Para avaliar a validade da Mdia precisamos verificar quanto representa o desvio padro
em relao Mdia e aps tirar uma concluso com base no esquema que foi apresentado anteriormente.

23,815494835
S
CV = 100 =
100 = 70, 25%
X

33,9
Observa-se que a Mdia no vlida, pois a disperso em torno dela > 60%. Trata-se
de um grupo heterogneo de dados com variao entre as microrregies, uma vez que CV =
70,25%. Neste caso a medida padro a ser utilizada a Moda = 24,3 hab./km. Assim sendo, a
densidade populacional do Estado est num padro de baixa ocupao, pois o que mais ocorre
so densidades em torno de 24,3 hab./km.
Concluso: Verificamos que o Estado do RS apresenta um IDH mdio de 0,785, PIB per capita de R$ 11.294,00, inferior ao padro de 7 mil dlares, podendo ser considerado um Estado
pobre, e por fim com baixa densidade demogrfica, uma vez que a mesma de 24,3 hab./
km<100 hab./km2. O Estado reflete uma postura cultural que d destaque educao e
sade, porm ainda est dominado por polticas pblicas que privilegiam a concentrao de
renda, a no realizao da reforma agrria, protegendo a concentrao de terra. Percebe-se
82

EaD

mtodos estatsticos e a administrao

tambm a falta de investimento para o crescimento das regies. Para tanto, importante que
o foco, tanto da organizao e da administrao pblica quanto da sociedade civil, esteja
no cidado e na cidad com vistas a ampliar os espaos de participao popular em todos
os nveis. As estatsticas refletem uma falta de vontade poltica de viabilizar a Qualidade de
Vida com qualidade.
A Estatstica uma cincia presente em todos os aspectos da vida, seja ela humana ou animal, seja ela com elementos no vivos, mas que se repetem na nossa sociedade e/ou na natureza.
Muitos clculos aparentemente, mas que no decorrer de sua aplicao vamos compreendendo
que se trata de formataes que se apoiam umas nas outras, repetindo raciocnios e clculos, com
uma importante contribuio na descrio do comportamento de fatos j ocorridos, na projeo
de resultados, nas tomadas de deciso. Essa nossa inteno com as aplicaes: que voc se
torne apto a conhecer estatisticamente e tomar as melhores decises, com uma grande margem
de segurana.
Como sugesto para tornar esta unidade menos complexa, insistimos que voc se disponha
a refazer os exemplos apresentados antes de partir para as aplicaes. Alm do que, importante
retomar todos os captulos anteriores ao realizar as aplicaes.

Seo 3.3
Aplicaes
Considere o seguinte banco de dados para construir suas questes e desenvolver as estatsticas necessrias para obter as respostas. Este banco traz informaes educacionais da:
Mesorregio 2 Centro Oriental Rio-Grandense com 54 municpios, sendo composta por trs
Microrregies (1. Cachoeira do Sul; 16. Lajeado-Estrela; 26. Santa Cruz do Sul).
Ao fazer o estudo, sugerimos que trabalhe em separado as trs Microrregies, oportunizando duas sries numricas e uma DF:
1. Cachoeira do Sul (n = 7);
16. Lajeado-Estrela (n = 31);
26. Santa Cruz do Sul (n = 16);
Tambm trabalhe estatisticamente a Mesorregio como um todo para comparar os achados
estatsticos.
83

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Quadro 13: Banco de dados nmero 6 Mesorregio 2 Centro Oriental Rio-Grandense


N

Mun

Microrregio

MatrEF07

MatrEM07

Matr07

Doc_EF07

Doc_
EM07

Doc07

Nal_
docEF

Nal_
docEM

Nal_
doc07

Cachoeira do Sul

11.889

3.288

15.177

851

265

1116

14

12

14

Cerro Branco

689

171

860

60

14

74

11

12

12

Novo Cabrais

587

154

741

44

12

56

13

13

13

Pantano Grande

1.777

389

2.166

110

28

138

16

14

16

Paraso do Sul

947

231

1178

67

11

78

14

21

15

Passo do Sobrado

825

239

1064

89

16

105

15

10

Rio Pardo

5.679

1.407

7.086

369

123

492

15

11

14

Arroio do Meio

16

2.360

781

3.141

183

52

235

13

15

13

Bom Retiro do Sul

16

1.710

499

2.209

121

35

156

14

14

14

Boqueiro do Leo

16

1.298

240

1.538

106

21

127

12

11

12
10

Canudos do Vale

16

274

274

27

27

10

999

Capito

16

402

127

529

40

16

56

10

Colinas

16

257

66

323

26

12

38

10

Coqueiro Baixo

16

193

193

19

19

10

999

10

Cruzeiro do Sul

16

1.440

358

1.798

105

33

138

14

11

13

Doutor Ricardo

16

290

76

366

35

10

45

10

Encantado

16

2.588

817

3.405

203

66

269

13

12

13

11

Estrela

16

4.238

1.345

5.583

298

122

420

14

11

13

12

Fazenda Vilanova

16

541

154

695

25

34

22

17

20
11

13

Forquetinha

16

303

96

399

29

36

10

14

14

Imigrante

16

291

96

387

34

14

48

15

Lajeado

16

9.346

2.991

12.337

673

236

909

14

13

14

16

Marques de Souza

16

524

95

619

50

17

67

10

17

Muum

16

640

194

834

77

21

98

18

Nova Brscia

16

400

196

596

32

17

49

13

12

12

19

Paverama

16

886

215

1101

68

18

86

13

12

13

20

Pouso Novo

16

303

76

379

33

11

44

21

Progresso

16

1.081

225

1.306

89

19

108

12

12

12

22

Relvado

16

257

76

333

32

39

11

23

Roca Sales

16

1.123

423

1.546

100

45

145

11

11
15

24

Santa Clara do Sul

16

710

243

953

49

15

64

14

16

25

Srio

16

346

108

454

25

13

38

14

12

26

Taba

16

579

201

780

59

12

71

10

17

11

27

Taquari

16

3.860

1.144

5.004

277

87

364

14

13

14

28

Teutnia

16

3.571

1.187

4.758

259

96

355

14

12

13

29

Travesseiro

16

257

85

342

29

38

30

Vespasiano Correa

16

175

67

242

20

29

31

Westflia

16

347

98

445

36

45

10

11

10

Arroio do Tigre

26

1.991

601

2.592

168

45

213

12

13

12

Candelria

26

4.485

814

5.299

284

79

363

16

10

15

Estrela Velha

26

613

104

717

55

63

11

13

11

Gramado Xavier

26

787

101

888

70

12

82

11

11

Herveiras

26

582

101

683

41

11

52

14

13

Ibarama

26

761

144

905

80

17

97

10

Lagoa Bonita do Sul

26

470

104

574

45

11

56

10

10

Mato Leito

26

555

133

688

43

18

61

13

11

Passa Sete

26

981

222

1203

77

15

92

13

15

13

10

Santa Cruz do Sul

26

16.667

4.333

21.000

1.056

332

1.388

16

13

15

11

Segredo

26

1.284

227

1.511

116

20

136

11

11

11

12

Sinimbu

26

1.542

343

1.885

107

30

137

14

11

14

13

Sobradinho

26

2.193

628

2.821

168

48

216

13

13

13

14

Vale do Sol

26

1.727

176

1.903

93

14

107

19

13

18

15

Venncio Aires

26

9.321

2.221

11.542

653

200

853

14

11

14

16

Vera Cruz

26

3.445

841

4.286

220

46

266

16

18

16

Fonte: Elaborao da autora com base em dados dos censos do IBGE.


Obs.: 999 o cdigo de NR

84

EaD

mtodos estatsticos e a administrao

Alguns complementos para apoiar o estudo:


Quadro 14: Variveis presentes no banco de dados nmero 6 Mesorregio 2
Centro Oriental Rio-Grandense e sua classificao
Variveis Aleatrias
N
N de ordem
Nm

Numerao dentro da microrregio

Mun

Municpio

Microrregio

Codigo da Microrregio

Mesorregio

Cdigo da Mesorregio

MatrEF07

Matrcula no Ensino Fundamental em 2007

MatrEM07

Matrcula no Ensino Mdio em 2007

Matr07

Matrcula total em 2007

Doc_EF07

Docentes do Ensino Fundamental em 2007

Doc_EM07

Docentes do Ensino Mdio em 2007

Doc07

Total de Docentes em 2007

Nal_docEF

N de alunos por docente no Ensino Fundamental 2007

Nal_docEM

N de alunos por docente no Ensino Mdio 2007

Nal_doc07

N de alunos por docente geral 2007

Classificao das variveis

Fonte: Elaborao da autora com base em dados dos censos do IBGE.

RESUMO DA UNIDADE 3
Nesta unidade abordamos tcnicas e mtodos estatsticos com a finalidade
de sistematizar os dados coletados, descrever seu padro comportamental a partir de medidas descritivas. Estas se repartem em dois tipos de
medidas: as de tendncia central, que so Mdia, Mediana e Moda; e
as de variabilidade que so basicamente a varincia, o desvio padro e o
coeficiente de variao.

85

EaD

Unidade 4

mtodos estatsticos e a administrao

INTRODUO AMOSTRAGEM
Ruth Marilda Fricke

OBJETIVO DESTA UNIDADE


Entender os meandros do processo de amostragem, que substitui os levantamentos censitrios
exaustivos, os quais se tornam inviveis nos processos decisrios do mundo moderno em termos
de delineamento e seleo da amostra.

AS SEES DESTA UNIDADE


Seo 4.1 Padres a Seguir no Processo Amostral
Seo 4.2 Delineamento Amostral: Dimensionamento e Seleo
Seo 4.3 Aplicaes
A coleta de dados e sua representao em tabelas e grficos permite uma viso detalhada
e circunstanciada dos fenmenos. Apesar do apoio de suporte computacional, no entanto, a
demanda por anlise estatstica na tomada de deciso e a necessidade de agilizar a informao
retiram da coleta populacional o carter de fonte nica de dados.
O domnio dos mecanismos de uma amostra cientificamente delineada capaz de representar a populao em estudo faz desse mtodo estatstico um elemento de extrema importncia na
gesto empresarial da atualidade. O objetivo introduzir o aluno no processo de amostragem sem
um carter definitivo, isto , a proposio a de estudar os procedimentos bsicos na definio
do tamanho da amostra, delineamento e seleo amostral.
O processo amostral muito til numa sociedade como a nossa, com grandes populaes,
sejam elas de pessoas, animais, coisas, negcios... Este fato, de ocorrerem grandes nmeros
quando realizamos um levantamento de dados, agrega ao processo amostral uma caracterstica
fundamental: a agilidade de coleta, a menor demanda de tempo, rapidez na obteno de infor87

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

maes, a diminuio de erros, a possibilidade de qualificar instrumentos e tcnicos em coleta


de dados de forma a minimizar os erros no amostrais. Estes erros ocorrem independentemente
do delineamento, decorrem de fatores alheios diferena entre populao e amostra (Nn).
A coleta censitria exaustiva, nico meio de realizar estudos populacionais, s vivel em
casos em que o tamanho da mesma mnimo, ou em situaes em que a magnitude de recursos
para a sua realizao de um montante extraordinrio.
Mesmo a preciso no atingida em sua totalidade, pois o custo leva:
diminuio no tempo de treinamento dos coletores de dados;
supresso ou insuficiente pesquisa-piloto para melhorar o instrumento de coleta;
necessidade de um oramento de grande dimenso;
m qualidade dos softwares de tratamento dos dados;
utilizao de tcnicos com baixa capacidade, sem experincia e pouca capacitao.
Estes fatores demandam um retrabalho sobre os dados coletados, na verificao de ocorrncia de dados censurados, na necessidade de refazer o processo de coleta, de tratamento, a
acessibilidade a tcnicos de alto padro para validar e liberar o uso dos dados oficialmente.
Com um processo por amostragem, que apresenta uma srie de garantias tcnicas, cientificamente comprovadas iremos inferir, a partir de uma quantidade menor de dados da populao,
estimar os parmetros populacionais com base nas estatsticas amostrais. Este n provavelmente
sempre menor do que N. Isso, por si s, j vai garantir mais rapidez e menor custo, alm de que
a demanda por coletores e tcnicos tambm se reduz, contribuindo de fato para minimizar os
erros no processo de coleta e tratamento.
Uma das principais vantagens do processo amostral que temos informao sobre a margem de erro (podemos estipular o mximo permitido) e a confiana no potencial de resposta com
os dados coletados.
importante observar que alguns critrios de dimensionamento e seleo devem ser rigorosamente seguidos para garantir bons resultados:
definio do instrumento com pesquisa piloto prvia;
treinamento do pessoal em todas as reas envolvidas;
traado prvio da temtica, rea e perodo de abrangncia, objetivos, hipteses, referencial
terico, metodologia de campo e de tratamento estatstico;
dimensionamento da amostra conforme critrios definidos previamente;
88

EaD

mtodos estatsticos e a administrao

delineamento para realizar a amostra respeitando as propores de caractersticas de interesse


na populao;
aleatoriedade na seleo das unidades amostrais;
criteriosidade na construo do banco de dados;
adequao dos mtodos e tcnicas estatsticas para o tratamento dos dados;
correo nos mtodos e tcnicas para apresentao dos resultados.

Seo 4.1
Padres a Seguir no Processo Amostral
O trabalho quando realizado por amostragem e no de forma censitria, populacional,
requer algumas estratgias para seu desenvolvimento:
Seguindo uma certa lgica presente neste texto, estamos disponibilizando conceitos no
processo amostral e os meios para sua utilizao.

4.1.1 FATORES INTERVENIENTES


Alguns fatores que afetam o tamanho da amostra, conforme j estudamos:
a variabilidade dos dados se os dados so homogneos, isto , com baixo coeficiente de variao, vo exigir um tamanho de amostra menor para representarem bem a populao em
estudo; se os dados populacionais forem heterogneos vo exigir maior tamanho de amostra
para conterem essa heterogeneidade e, dessa maneira, conseguirem transmitir com maior
adequao as informaes pretendidas;
a margem de erro amostral mxima aceita o erro fixado um erro relativo e diz respeito ao
fato de que o tamanho da amostra (n) difere do tamanho da populao (N), de tal modo que
n<N. Esse erro quando absolutizado representa uma poro relativa da mdia, nesse caso
( = r ;.. = r X ). O erro relativo deve ter um valor baixo (0,10; 0,05; 0,01 e menores)
porque representa o montante de afastamento entre o resultado obtido e o verdadeiro parmetro;
89

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

a probabilidade de confiana (Pf) a confiabilidade na capacidade da amostra realizada de


responder s expectativas de estimativa do parmetro. A confiana que devemos ter sempre
um valor alto e no complementar ao erro, pois se trata de medidas diferentes, que dizem
respeito a aspectos diferentes no dimensionamento da amostra. A Pf deve atingir um valor em
torno de 0,90; 0,95; 0,99 e ser expressa em termos de:
a. desvios padro de afastamento da mdia dos valores limites(z) da normal padro que tm
mdia 0 e varincia 1 no caso de conhecermos os valores da varincia populacional ou em
caso de estarmos trabalhando com estimativas calculadas a partir de uma amostra piloto de
no mnimo 30 informaes;
b. no caso em que a estimativa da varincia for feita com uma amostra pequena, n < 30, usamos os limites da distribuio t de Student, obtidos a partir dos graus de liberdade (n-1) e
da Pf desejada.
Outra informao que pode afetar o tamanho da amostra a condio de N ser conhecido ou
no. Isto , estarmos calculando o tamanho da amostra para uma populao com tamanho finito
(conhecido) ou uma tendendo a infinito (N desconhecido ou muito grande).

4.1.2 MTODOS DE CLCULO DA AMOSTRA


Existem diversos mtodos para o clculo do tamanho da amostra. O mais famoso o Mtodo
de Cochran (1965), adotado no mundo inteiro. Este mtodo leva em considerao:
se a varincia populacional conhecida ou estimada;
se a populao finita (N conhecido) ou tendendo a infinita (N desconhecido).
Um fator determinante nesse processo a quantidade de informao que temos para municiar as frmulas que iremos utilizar. Essa quantidade, maior ou menor, tem um efeito direto
no resultado do tamanho da amostra (n):
se as informaes que podemos utilizar no clculo so pobres, provavelmente o tamanho da
amostra ser superdimensionado para compensar;
se as informaes forem mais confiveis, vlidas, ricas, o tamanho da amostra ser minimizado.
Vejamos, ento, dois mtodos e suas variantes:

1 Mtodo de Cochran:
Necessita definir previamente a preciso margem de erro r, sendo =r., a fidedignidade z valor da curva normal e conhecer/estimar a variabilidade populacional ou s.
Para trabalharmos de forma mais operacional e simplificada, considerando que o depende da
90

EaD

mtodos estatsticos e a administrao

mdia e que o coeficiente de variao tambm, podemos multiplicar as expresses de clculo


da amostra pela frao /, que igual a 1, portanto no altera a frmula, e substituir os valores
absolutos pelos relativos.
Para obter os valores de z e de t precisamos nos reportar s tabelas da Normal no caso de
z e de Student no caso de t. A primeira fcil de obter, pois os valores da Normal padro so
fixos, basta que seja fixado o valor de probabilidade de confiana desejado, consultando a tabela,
localizando no interior da tabela a metade da probabilidade fixada e retornando ao valor inicial
da linha em questo (os da 1 coluna) e subindo ao topo da coluna para constituir o valor de z.
Como na maioria dos casos, os valores prefixados so muito repetidos, pois quase sempre
so utilizados os mesmos. possvel determinar os valores da curva normal para esses Pf e deixar num quadro para uso constante. Os valores mais usuais de Pf so: 0,99; 0,95; 0,90. Vemos
no Quadro a seguir os valores de Z da curva normal. Nos casos em que utilizamos estimativas
da varincia, Pf ser dado por t de Student, no entanto esse dimensionamento depende de uma
informao varivel, que o tamanho da amostra piloto utilizada para estimar a varincia, mudando de caso para caso, no permitindo ter um quadro prvio.
Quadro 1: Valores de Z prefixados para trs valores de Pf: 0,90; 0,95; 0,99
Pf
0,90
0,95
0,99

Valor a procurar no corpo da tabela


0,45
0,475
0,495

z
1,64
1,96
2,58

Fonte: Elaborao da autora com base na literatura estatstica.

Para encontrarmos o valor de t na tabela t de Student precisamos fixar o valor de Pf e encontrar os graus de liberdade fixados por (n-1), sendo n o tamanho da amostra piloto, e localizar
o valor de t no interior da tabela. Por exemplo, se n = 30; 20; 10, = 0,05, veja os resultados no
quadro a seguir para os valores de t:
Quadro 2: Valores de t calculados para um valor de Pf: 0,95, com n variado: 30; 20 e 10
Pf
0,95
0,95
0,95

n-1
30 -1=29
20 -1=19
10 -1=9

t
2,262
2,093
2,045

Fonte: Elaborao da autora com base na literatura estatstica.

Quando estamos trabalhando com base em estimativa da varincia e n > 120, os valores
de t se aproximam de z e podemos utilizar a aproximao normal.
91

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Para facilitar o dimensionamento da amostra, fizemos uma transformao da Varincia ()


para valores relativos (CV), o que nos permite utilizar o erro relativo (r) em lugar do erro absoluto
(). Os resultados dessa transformao j esto apresentados nas frmulas a seguir.
Estas frmulas para o clculo da amostra so de Cochran (1965). Para utilizar as frmulas
necessitamos:
conhecer a variabilidade da populao ou estim-la por meio de uma amostra piloto. A variabilidade mnima reflete diretamente no tamanho da amostra, pois sendo pequena, inferior a
30%, temos um grupo homogneo e os dados so muito assemelhados, ento a amostra pode
ser pequena, caso contrrio vai exigir um tamanho maior;
definir a margem de erro mxima que podemos admitir tendo em vista os objetivos de nossa
investigao, isto , precisamos estabelecer um mximo de preciso. Quanto menor essa margem, maior ser o tamanho da amostra para procurar garanti-la;
estabelecer a probabilidade de confiana (Pf) na amostra que for realizada. Esta Pf deve ser
mxima, altos valores, sua interferncia no tamanho da amostra menor do que a margem de
erro.
A seguir as frmulas:
1 frmula:
2

CV

n = z / 2 z / 2

* Esta frmula utilizada para populaes infinitas ou com N desconhecido, com conhecido.
2 frmula:
2

s
CV

n = t / 2 = t / 2

* Esta frmula para populaes infinitas ou com N desconhecido, com estimado.


3 frmula:

n=

N z2 / 2 2
N z2 / 2 cv 2

( N 1) 2 + z2 / 2 2 ( N 1) r 2 + z2 / 2 cv 2

* Esta frmula para populaes finitas, com conhecido.


4 frmula:

n=

N t2 / 2 s 2
N t2 / 2 cv 2

( N 1) 2 + t2 / 2 s 2 ( N 1) r 2 + t2 / 2 cv 2

* Esta frmula para populaes finitas, com estimado.


92

EaD

mtodos estatsticos e a administrao

2 Mtodo: Populaes infinitas


Este mtodo uma espcie de estimativa do tamanho de n, sem considerar os princpios
bsicos do clculo de amostragem. Respeita apenas a preciso, desconsiderando fidedignidade
e variabilidade. , portanto, um mtodo com baixa cientificidade e com pouca segurana.
Este mtodo pobre de informaes adicionais, logo vai compensar superestimando o
tamanho da amostra.
5 frmula:

1
n=

Seo 4.2
Delineamento Amostral: Dimensionamento e Seleo
Esta seo vai nos apresentar a metodologia do delineamento amostral e da seleo aleatria que ir garantir a cientificidade dos resultados.

O delineamento amostral prev algumas atividades fundamentais:


A definio dos fatores de incluso na amostra, como caractersticas especiais da populao
e sua distribuio na mesma, deve ser as mesmas populao. Por exemplo, se na populao a
diviso por gnero igualitria, devemos delinear a amostra para ter 50% feminino e 50% masculino; se na populao 3,5% so pessoas sem escolaridade, a amostra deve ser delineada para
conter 3,5% de pessoas sem escolaridade. Ento, delineamento trata de estabelecermos critrios
de pertencimento amostra para melhor representar a populao.

Os cuidados na seleo amostral


Outro fato importante trata-se da seleo aleatria dos indivduos que comparecem
amostra. Com isso queremos garantir que cada unidade populacional tenha as mesmas chances
de vir a ser sorteada. Atualmente esse procedimento facilmente obtido mediante a gerao de
nmeros aleatrios multiplicados pelo tamanho da populao e restritos ao tamanho da amostra.
No Excel utiliza-se a seguinte funo: Aleatrio ()*N repetido at obtermos o n necessrio com
alguns de reserva para o caso de gerarmos nmeros repetidos.
93

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

A seguir, seleciona-se as unidades populacionais na Listagem da Populao. Por exemplo:


no caso de estarmos sorteando n = 40 municpios do RS, geramos 40 nmeros aleatrios por
meio da funo Aleatrio()*496, este nmero N, a populao de municpios gachos, e obtemos nossa amostra. Em seguida vamos lista e selecionamos os municpios correspondentes.
Posteriormente, vamos base de dados que pode ser a FEE ou o IBGE, cidades ou outra base de
dados conhecida e reconhecida, e organizamos um banco de dados com as variveis de interesse
para nosso estudo.

Exemplificao do processo amostral


Seja o seguinte quadro de informaes provenientes de uma populao:
Quadro 3: Informaes bsicas sobre as variveis em estudo
Po pu l a o
Un ida de b s i c a
N

RGS
M u n i c p io s
496
P I B p e r c a p i t a em m i -

Va ri ve l
Mdia
D e s v io Pa d r o
Coeficiente de
Va ria o
r
PF

E m presa
Func i o n ri o s
2.500

Pro du o
Pro duto s
Desco nheci do

l ha r e s d e rea i s
1 1 ,2 9 4 1 18
3 ,2 7 8 9 8 3 1 valo r po -

Ida de

Peso da pe a

32,27
3,8724 v a lo r esti m a -

2,3 kg
0,8625 v a lo r esti m a-

p u l ac i o na l

do, n = 20

do , n= 40

0 ,2 9 0 3 2 6 63

0,12

0,375

0 ,0 5
0 ,9 0

0,05
0,95

0,10
0,99

400

10.000

100

Ta m a n h o e s t i m a d o
s com base no Erro,
frmula 5

Fonte: Elaborao da autora com base nos dados do IBGE.

Utilizando os dados do Quadro 3 vamos dimensionar a amostra para cada grupo, considerando as informaes disponveis na hora de escolher a frmula adequada e proceder seleo
aleatria.
Dimensionamento da amostra
Grupo 1: RGS municpios
Como N conhecido, N = 496 e =3,278931, varincia populacional conhecida, vamos
escolher a frmula 3:

n=

94

N z2 / 2 cv 2
496 * (1,64) * (0, 29032663)
=
= 76,8 77 municpios
2
2
2
( N 1) r + z / 2 cv
(496 1) * (0,05) + (1,64) * (0, 29032663)

EaD

mtodos estatsticos e a administrao

O estudo deve considerar uma amostra de 77 municpios sorteados aleatoriamente para


fazer o estudo entre os 496 que compem o Estado do RS.
Realizamos o sorteio aleatrio utilizando a funo do Excel, retirando municpios repetidos,
com a funo: =Aleatrio ( )*496 e se encontra no Quadro 4 a seguir.
O sorteio realizado uma AAS Amostra Aleatria Simples que considera todas as unidades
populacionais com a mesma chance de serem sorteadas para participar da amostra. As unidades
populacionais so os municpios gachos enumerados de 1 a 496.
A seguir apresentamos as 77 unidades amostrais sorteadas no Excel, com o respectivo
nmero de sorteio, que o nmero do prprio municpio.
Quadro 4: Seleo aleatria por sorteio entre os municpios do RS
Sorteado

Municpio

Sorteado

Municpio

Sorteado

Municpio

17

Antnio Prado

27

162

Farroupilha

53

356

Salto do Jacu

20

Aratiba

28

164

Faxinalzinho

54

368

Santa Tereza

26

Arroio Grande

29

171

Forquetinha

55

376

Santo Antnio do Palma

27

Arvorezinha

30

179

Getlio Vargas

56

379

Santo Cristo

28

Augusto Pestana

31

190

Harmonia

57

385

So Gabriel

37

Barra do Ribeiro

32

191

Herval

58

393

So Jos do Inhacor

39

Barra Funda

33

197

Ibia

59

394

So Jos do Norte

46

Boa Vista do Cadeado

34

202

Iju

60

395

So Jos do Ouro

48

Boa Vista do Sul

35

203

Ilpolis

61

403

So Martinho da Serra

10

60

Cacequi

36

215

Itati

62

404

So Miguel das Misses

11

63

Cacique Doble

37

222

Jaguaro

63

408

So Pedro das Misses

12

68

Cambar do Sul

38

232

Lajeado

64

411

So Sebastio do Ca

13

73

Campo Novo

39

244

Marau

65

416

So Vendelino

14

74

Campos Borges

40

254

Minas do Leo

66

419

Sapucaia do Sul

15

83

Capo da Canoa

41

267

Muliterno

67

427

Serafina Corra

16

99

Cerro Branco

42

270

Nonoai

68

434

Sinimbu

17

116

Coqueiros do Sul

43

279

Nova Pdua

69

441

Taquara

18

120

Cotipor

44

283

Nova Ramada

70

443

Taquaruu do Sul
Trs Forquilhas

19

124

Cristal do Sul

45

289

Novo Machado

71

458

20

131

Dilermando de Aguiar

46

294

Palmares do Sul

72

459

Trs Palmeiras

21

138

Dona Francisca

47

296

Palmitinho

73

461

Trindade do Sul

22

141

Eldorado do Sul

48

302

Parob

74

466

Tupanciret

23

144

Engenho Velho

49

333

Protsio Alves

75

472

Unistalda

24

151

Erval Seco

50

334

Putinga

76

486

Victor Graeff

77

491

Vista Alegre

25

156

Estncia Velha

51

343

Rio Grande

26

160

Eugnio de Castro

52

354

Sagrada Famlia

Fonte: Elaborao da autora com base na relao de municpios do RS no Wikipdia.

Grupo 2: Empresa de Grande Porte Funcionrios


Delineamento: proporcionalidade por sexo: 50%.
Condies: Independente de setor, cargo, tempo de servio.
Como N conhecido, N = 2500 e S = 3,8724 a partir de uma amostra piloto de tamanho 20,
logo varincia populacional desconhecida, varincia estimada, vamos escolher a frmula 4:
95

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

n=

N t2 / 2 cv 2
2.500 * (2,093) * (0,12)
=
= 24,99 25 funcionrios
2
2
2
( N 1) r + t / 2 cv
(2.500 1) * (0,05) + (2,093) * (0,12)

O estudo deve considerar uma amostra de 25 funcionrios para garantir uma margem
mxima de erro de 5% e uma confiabilidade de 95%. Utilizamos a funo da calculadora para
fazer o sorteio com os seguintes passos:
(2nd F+RND)*2500, gerando os 25 nmeros da amostra e mais as 6 reservas, controlando
para no haver repeties.
No sorteio devemos considerar um delineamento que garanta uma distribuio igualitria
por sexo, quer dizer, uma amostra estratificada por sexo. Para tanto, separamos os funcionrios
em dois grupos e metade ser sorteada entre os do sexo masculino e a outra metade entre as de
sexo feminino.
Como se trata de pessoas que eventualmente podem se negar a responder ou faltar, ou ainda no serem encontradas, sorteia-se tambm um grupo de nomes-reserva chamado de reserva
tcnica para fazer substituies caso seja necessrio.
O pressuposto, neste caso, a existncia de uma listagem com a relao de trabalhadores.
A cada um deles vai ser atribudo um nico nmero que varia de 1 a N=2.500.
Neste caso, as reservas tambm tm de ser meio a meio por sexo.
Quadro 5: Amostra sorteada e respectiva seleo.
n2
1
2
3
4
5
6
7
8
9
10
11
12
13
1

Masculino
sorteado
94
202
272
340
363
498
907
944
1.467
1.688
1.725
1.914
2.216
reserva M
278

Feminino
nome
Gustavo
Adolfo
Maximino
Carlos
Ernesto
Franois
Gabriel
Mateus
Frederico
Homero
Elvis
Cassiano
Jo s i a s

n2
14
15
16
17
18
19
20
21
22
23
24
25

sorteado
960
1.049
1.467
1.640
1.745
1.798
1.825
2.101
2.148
2.217
2.217
2.415

nome
Anastcia
Tarsila
Fabiana
Raquel
Eliana
Edivania
Alice
Luciana
Guilhermina
Jamilia
Constancia
Zuleica
reserva F

Ricardo

727

Ins

1.250

Fabrcio

996

Janaina

2.107

Jonas

1.137

Dbo ra

Fonte: Elaborao da autora com base nos dados da empresa.

96

EaD

mtodos estatsticos e a administrao

Aps a seleo amostral, proceder-se- coleta das assinaturas nos Termos de Consentimento
Livre e Esclarecido (TCLE) para iniciar a coleta de dados. Este procedimento garante que o pesquisado conhece os objetivos da pesquisa e sua participao, bem como os procedimentos metodolgicos. Tambm lhe garantido sigilo de sua participao e em nenhum momento as informaes
prestadas sero relacionadas a sua pessoa e lhe causaro prejuzo na empresa ou em qualquer
lugar. Garante ainda que a qualquer momento estar livre para retirar seu consentimento.
Grupo 3: Produo contnua de uma empresa de mdio porte peas
Delineamento: como a produo contnua, entende-se que a populao de peas produzidas tendem a infinito, por isso no dimensionamos o N. Tambm impossvel conhecer a
varincia populacional, apenas podemos estim-la mediante uma amostra piloto com uma varivel
quantitativa que nos assegure mdia, varincia, desvio padro e coeficiente de variao. Neste
caso a variabilidade foi estimada a partir de uma grande amostra, n=40. Podemos considerar
ento a utilizao da primeira frmula.
Como N conhecido, N e CV = 0,375 a partir de uma amostra piloto de tamanho 40,
logo temos varincia populacional desconhecida, mas estimada numa grande amostra, com uma
margem de erro fixada em r= 0,10 e uma probabilidade de confiana, PF=0,99, vamos escolher
a frmula 1:
2

CV
0,375

= 2,58*
= 93,6 94.lote.de. peas
n = z / 2

r
0,10

No possvel aplicar os mtodos de sorteio neste caso, pois se trata de uma produo
contnua e as peas no so numeradas nem identificadas, apenas fazem parte de lotes que
identificam o perodo, turno e dia em que foram produzidas, o responsvel pela mquina, a prpria mquina e o conferente. Cada lote constitudo de dez peas, o que favorece, por exemplo,
o clculo da proporo de peas defeituosas por lote, etc. A forma que pode ser adotada a de
fazer uma amostra aleatria sistemtica, em que uma razo estabelecida para o momento da
coleta. Considerando a experincia na produo estabeleceu-se o momento da coleta de 6 em 6
horas, com sorteio da primeira coleta do dia e a partir da de 6 em 6 horas coleta-se uma amostra,
sendo que a unidade amostral o lote daquele perodo. O sistema repetido at ser composto
o nmero de lotes definido pelo dimensionamento da amostra.
Sabe-se que a empresa funciona ininterruptamente, 24 horas por dia. O turno de trabalho
para o sorteio inicial da meia noite s 6 da manh. nesse intervalo de tempo que ser sorteado
o horrio da primeira amostra e a partir da inicia-se a coleta do lote de 6 em 6 horas. O intervalo
contabilizado em meia hora e hora completa, formando assim 12 intervalos de tempo:
Enumerao dos perodos de tempo para o sorteio inicial:
N
Horrio

1
0,5

2
1

3
1,5

4
2

5
2,5

6
3

7
3,5

8
4

9
4,5

10
5

11
5,5

12
6

97

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Sorteio da hora de incio da coleta dos lotes, um em cada perodo previsto. Sero sorteados nmeros
de 1 a 12, correspondente ao nmero de perodos de meia hora da meia-noite s 6 da manh.
Quadro 6: Amostra de perodos sorteados como hora de incio da coleta
1
2
3
4
5
6
7
8
9
10
11
12

Sorteio da primeira hora


8
3
6
5
9
3
1
10
1
4
8
1

4
1,5
3
2,5
4,5
1,5
0,5
5
0,5
2
4
0,5

13
14
15
16
17
18
19
20
21
22
23
24

Sorteio da primeira hora


11
8
6
6
12
10
2
12
3
1
11
8

5,5
4
3
3
6
5
1
6
1,5
0,5
5,5
4

Fonte: Elaborao da autora.

A hora inicial considerada a semente geradora dos horrios para o processo amostral, a
qual ser ento somada com (+ 6) gerando os demais horrios do dia. Para completar o ltimo
dia de coleta, o 24, aproximamos para n = 96.
Quadro 7: Amostra de perodos sorteados gerados a partir da hora sorteada inicialmente
n3
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

Coleta
4
10
16
22
1 ,5
7 ,5
1 3 ,5
1 9 ,5
3
9
15
21
2 ,5
8 ,5
1 4 ,5
2 0 ,5
4 ,5
1 0 ,5
1 6 ,5
2 2 ,5
1 ,5
7 ,5
1 3 ,5
1 9 ,5

N3
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48

C oleta
5
11
17
23
0,5
6,5
1 2,5
18,5
5,5
1 1,5
17,5
2 3,5
4
10
16
22
3
9
15
21
3
9
15
21

n3
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72

Fonte: Elaborao da autora.

98

C o leta
5,5
11,5
17,5
23,5
4
10
16
22
3
9
15
21
3
9
15
21
6
12
18
24
5
11
17
23

n3
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96

Co leta
1
7
13
19
6
12
18
24
1,5
7,5
13,5
19,5
0,5
6,5
12,5
18,5
5,5
11,5
17,5
23,5
4
10
16
22

EaD

mtodos estatsticos e a administrao

Dessa forma o delineamento est concludo e as amostras sero coletadas em 24 dias.


Para fixarmos os contedos, o que acham de resolver algumas questes? Vamos adiante,
pessoal, para finalizar mais esta unidade do nosso livro.

Seo 4.3
Aplicaes
O gerente de uma empresa do ramo de calados populares quer conhecer a interferncia
de algumas variveis na conduo de seus negcios. Como o estatstico deve conduzir o processo
amostral?
Em cada proposio identifique:
a populao
a unidade amostral
o delineamento
o clculo da amostra
a seleo aleatria
Caso 1) Se ele pretende entrevistar a clientela utilizando a varivel gasto na ltima aquisio para delinear a amostra, vai precisar de uma amostra piloto. Com base em 26 notas de
clientes da empresa monte o processo amostral, definindo margem de erro, probabilidade de
confiana e coeficiente de variao a partir dos valores das notas:
Quadro 8: Banco de dados da amostra piloto
1

2
3
4
5
6
7
8
9
10
11
12
13

R$ 136,40
R$ 119,87
R$ 124,33
R$ 112,60
R$ 102,53
R$ 87,90
R$ 99,12
R$ 127,45
R$ 132,90
R$ 123,10
R$ 107,34
R$ 264,00
R$ 148,00

14
15
16
17
18
19
20
21
22
23
24
25
26

R$ 64,00
R$ 117,00
R$ 145,00
R$ 186,90
R$ 166,99
R$ 268,00
R$ 54,80
R$ 145,00
R$ 219,00
R$ 104,00
R$ 131,60
R$ 59,23
R$ 84,50

Fonte: Escritrio da empresa.

99

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Caso 2) Se ele pretende utilizar a informao sobre o nmero de pares de calados que
vendeu nas ltimas exportaes para os vizinhos da Amrica Latina, onde tem 180 clientes,
enviando uma mala investigativa via Internet por processo amostral.
Quadro 9: Banco de dados de todos os clientes
n

pares

pares

pares

pares

pa res

pa re s

1
2
3
4
5
6
7
8
9
10

411
577
564
507
202
435
513
292
394
404

31
32
33
34
35
36
37
38
39
40

239
132
445
265
219
430
519
225
485
259

61
62
63
64
65
66
67
68
69
70

183
1 90
4 42
190
410
1 62
4 27
417
481
403

91
92
93
94
95
96
97
98
99
100

267
238
198
552
167
210
310
409
458
217

121
122
123
124
125
126
127
128
129
130

312
384
599
282
289
392
493
150
532
461

151
152
153
154
155
156
157
158
159
160

451
188
252
317
437
365
512
248
142
514

11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

127
485
165
352
128
435
520
435
137
415
204
527
450
569
175
463
559
249
500
103

41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60

148
401
555
259
320
365
223
107
580
141
560
572
356
391
429
260
148
212
536
542

71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90

406
3 50
110
534
176
3 27
325
562
396
1 39
476
445
333
3 44
188
574
296
3 88
291
446

101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120

195
180
132
201
495
224
453
514
533
545
454
213
258
473
295
476
436
585
503
405

131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150

327
389
554
585
427
480
169
137
565
136
118
412
526
233
104
159
248
238
287
485

161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180

266
284
573
274
571
535
137
458
127
258
271
564
422
290
259
550
334
586
584
155

Fonte: Departamento de vendas.

Caso 3) Se ele deseja saber como seria a aceitao de um novo produto entre seus clientes
usuais. No sabe quantos clientes costumam vir a sua loja e comprar um tipo de calado como
esse novo produto.
Caso 4) Se ele deseja encontrar o perfil de clientes na aceitao de um novo plano de
promoes. Toma como informao a proporo de clientes que costuma frequentar a loja nos
sbados tarde: p = 0,54
100

EaD

mtodos estatsticos e a administrao

Caso 5) Sabendo que tem 228 sapateiras, toma uma amostra de 35 delas tomando a informao sobre o tempo de trabalho na indstria caladista, deseja conhecer o grau de satisfao
dos trabalhadores da empresa.
Quadro 10: Amostra piloto
n
1
2
3
4
5
6
7
8
9
10
11
12

TS
0
13
3
12
24
4
12
1
24
27
18
12

n
13
14
15
16
17
18
19
20
21
22
23
24

TS
6
23
16
14
11
20
13
20
12
29
9
11

n
25
26
27
28
29
30
31
32
33
34
35

TS
4
23
26
10
7
14
29
25
2
27
0

Fonte: Registro empresarial.

RESUMO DA UNIDADE 4
Nesta unidade introduzimos o estudante em um dos principais procedimentos dentro da Estatstica, que distingue um trabalho de senso comum
de um trabalho cientfico: o processo amostral. Procuramos trabalhar as
principais frmulas, o rigor do delineamento e da seleo aleatria das
unidades amostrais.

101

EaD

Unidade 5

mtodos estatsticos e a administrao

Noes de Inferncia Estatstica


Ruth Marilda Fricke

OBJETIVO DESTA UNIDADE


Mostrar como, por meio do processo amostral, fizemos a extenso dos resultados amostrais
para descrever o comportamento da populao, dominando algumas tcnicas de generalizao,
como a estimao e teste de hipteses.

SEES DESTA UNIDADE


Seo 5.1 Conceitos e definies
Seo 5.2 Estimativas e sua projeo
Seo 5.3 Aplicaes.
A Inferncia o processo de generalizao e de projees realizadas a partir da amostra
por meio de Estimativas, Intervalos de Confiana e de Testes de Hiptese. A ideia fazer as
medidas numa amostra (calculada e selecionada aleatoriamente com critrios cientficos, como
foi visto na Unidade 4, aplicar as tcnicas estatsticas nessa amostra e projetar os resultados para
a populao.
Com isso ganhamos tempo, preciso, agilidade, avaliando tambm as relaes e tendncias
futuras. Desse modo, as estatsticas amostrais serviro para conhecer o comportamento de uma
populao, que s poderia ser estudada censitariamente, o que nem sempre possvel.

103

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Seo 5.1
Conceitos e Definies
Estimadores:
Os estimadores so as estatsticas amostrais que sero calculadas na amostra e projetadas
por meio de estimativas por ponto (a estimativa utilizada como se fosse o parmetro populacional) ou por intervalo (uma estimao que parte da estatstica amostral calculada, mdia ou
proporo, no caso deste texto e acrescentando uma margem de erro para mais e para menos,
que nos informa a faixa de ocorrncia do verdadeiro valor populacional).

Intervalo de Confiana:
O Intervalo de Confiana dimensiona uma faixa de possvel ocorrncia do parmetro populacional, ou seja, do verdadeiro valor, desconhecido mas estimado por meio da amostra. Este
intervalo construdo aps a definio da probabilidade de confiana que pretendemos ter na
estimativa realizada.

Teste de Hiptese:
Aps o clculo da estimativa precisamos conferir se o valor encontrado est garantido como
uma projeo do valor populacional. Para tal, estabelecemos um nvel de significncia (uma espcie de margem de erro) para nossa estimativa e conseguimos estabelecer uma garantia para
a informao obtida, possibilitando que as decises sejam tomadas tendo por base a informao
amostral.
Na seo 5.2 vamos apresentar a metodologia estatstica que permite inferir os parmetros
populacionais a partir de uma amostra, ou seja, generalizar a partir dela. No processo amostral
no interessam por si mesmas as estatsticas da amostra, mas sim as estimativas construdas a
partir dela e que inferem o comportamento populacional.

Seo 5.2
Estimativas e sua Projeo
Nesta seo vamos apresentar as estimativas e os testes de hipteses que permitem a
projeo dos resultados amostrais. As estimativas so calculadas com valores das estatsticas
amostrais. As projees so realizadas quando testamos se os valores encontrados na amostra
trazem evidncia suficiente para inferirmos os parmetros populacionais.
104

EaD

mtodos estatsticos e a administrao

5.2.1 ESTIMATIVAS
As estimativas da informao populacional a partir da amostra podem ser realizadas:
Por ponto: quando se projeta o valor calculado na amostra como se fosse o prprio parmetro,
o valor populacional. Este procedimento desconsidera a margem de erro presente no processo
amostral e no oferece garantia estimativa.
Por intervalo: ao estabelecer a estatstica amostral como estimativa, constri-se em torno dela
um intervalo baseado no potencial de erro de estimativa do processo. Como se diz popularmente, o valor verdadeiro projetado como a estatstica calculada na amostra mais ou menos um
determinado valor que a margem de erro agregada da confiana. Por isso, denominado de
Intervalo de Confiana. Usualmente este intervalo calculado para garantir 95% de confiana
de conter o verdadeiro parmetro.
Ao utilizarmos a mdia amostral, j temos comprovao anterior que esta medida um
estimador timo para a mdia populacional, pois o valor esperado da mdia amostral o prprio
parmetro, (

)= e a varincia mnima, V(

)= /n.

Mesmo assim a estimativa por ponto arriscada, pois fazemos o clculo amostral a partir
de uma amostra entre todas as possveis, ento importante que na projeo trabalhemos com
uma estimativa por intervalo, considerando a confiana dentro da margem de erro. Vrios so
os parmetros que podem ser estimados, mas vamos trabalhar somente com os estimadores da
mdia , e proporo, .

Intervalo de Confiana para a Mdia


IC 95% = X z / 2
= Pf
n

Esta a frmula para o Intervalo de Confiana no caso de varincia populacional conhecida


ou estimada com grandes amostras.

IC 95% = X t( n 1); / 2
= Pf
n

Esta a frmula para o Intervalo de Confiana no caso de varincia estimada. O valor da


varincia amostral estimada precisa de uma correo ao valor da varincia amostral, pois esta
n
a expresso da varincia amostral corriapresenta uma tendenciosidade logo s = s *
n 1
gida para pequenas amostras, em que n < 30.
105

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Intervalo de Confiana para a proporo


( p ) * (1 p )

IC 95% = p z / 2
= Pf
n

Esta a frmula para o Intervalo de Confiana no caso de proporo. Utilizamos sempre


a padronizao normal e o clculo da mdia dado por = p , tal que o smbolo da mdia
populacional, o parmetro mdia; a varincia dada por = (p)*(1-p) em que o smbolo da
varincia populacional e p o valor da proporo obtida na amostra, enquanto a proporo
populacional desconhecida.

5.2.2 TESTES DE HIPTESES PARA GENERALIZAO DE ESTATSTICAS AMOSTRAIS


Outro tratamento importante que deve ser realizado antes de projetarmos as estimativas
o teste de hipteses. O teste de hipteses deve ser aplicado aos valores amostrais para verificarmos se os mesmos podem ser projetados para a populao. Este item merece um estudo mais
aprofundado, no entanto nos restringiremos aos testes da mdia e da proporo, que so os mais
utilizados nas pesquisas por amostragem.
Quadro 1: Parmetros, estimadores e teste de hipteses
Medida

Teste de hipteses
Mdia
Estimador: X (xbarra)

Parmetro: (mi)

H0: =0, a mdia atual igual antiga.


Ha: 0, >0, <0, a mdia atual diferente, menor ou maior que a antiga.
Grandes amostras

zo =

X 0

Rejeitar H0 se: z0<-z; z0>+z; Aceitar H0 se: -z< z0<+z


Pequenas amostras:

to =

X 0
sx

Rejeitar H0 se: t0<-t(n-1); t0>+ t(n-1); Aceitar H0 se: t(n-1)/2 < t0<+ t(n-1)/2
Proporo
Parmetro: (pi) Estimador: p (p proporo)
H0: =0, a proporo atual igual antiga.
Ha: 0, >0, <0, a proporo atual diferente, menor ou maior que a antiga.

zo =

p ' 0

(p0 )(1 p0 )

, p= p estimado na amostra, 0= Valor j existente

Rejeitar H0 se: z0<-z; z0>+z; Aceitar H0 se: -z< z0<+z

Fonte: Elaborao da autora com base na literatura estatstica.

106

EaD

mtodos estatsticos e a administrao

EXEMPLO:
Sabe-se que o mdulo da propriedade rural na nossa regio de 25 ha. Devido ao modelo
agrcola e sistema de organizao social em funo de lucro e de acumulao, a populao urbana
vem crescendo e a rural diminuindo em funo do xodo rural. Os agricultores e suas famlias
saem do meio rural por causa do endividamento, busca de instituies de sade e de educao,
do custo elevado de produo agrcola, da dificuldade de acesso s novas tecnologias, etc.
Hiptese: Em funo disso entende-se que o mdulo rural esteja se modificando.
1) Fazemos uma amostra de propriedades rurais de nossa regio
Dados disponveis para o dimensionamento da amostra:
Seja um estudo de propriedades rurais, avaliando-se a concordncia atual com o mdulo
rural em 25 ha. O censo agrcola revela que nesta regio o nmero total de propriedades rurais
de 2.049 estabelecimentos e o nmero total de hectares de 51.508.
Dessa relao podemos tirar uma razo de ha/propriedade:

Razo =

total.de.ha
51.508.ha
=
= 25,13.ha / propriedade
n de propriedades rurais 2.049 propriedades rurais

Segundo essa razo (25,13 ha/propriedade), observamos que na prtica ela corresponde
ao mdulo rural.
Como comprovaremos a hiptese de que o modelo de concentrao de terras est modificando o tamanho das propriedades rurais?
Estabelecemos ento uma proporcionalidade com a finalidade de ter uma informao bsica para o clculo da amostra:
P=25/25, 13=0,99 logo q=(1-p)= 0,01
=p=0,99; =s =p*q= 0,99*0,01=0,0099;
s=( p*q)= (0,0099)=0,09949874 e
CV= q/p=0,01/0,99)=0,10050378
Estabelecendo r=0,03 e uma Pf=0,95z / 2 =1,96, vamos dimensionar o tamanho da
amostra utilizando a frmula para proporo com N finito:

n=
=

N z2 / 2 2
=
( N 1) 2 + z2 / 2 2

N z2 / 2 CV 2
2049 * (1,96) * (0,10050378)
=
=
2
2
2
( N 1) r + z / 2 CV
(2049 1) * (0,03) + (1,96) * (0,10050378)
= 42,25 43 propriedades na amostra.
107

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Como percebemos, em princpio no temos muita informao sobre as propriedades para fazer
um clculo da amostra; buscamos ento um apoio numa proporo que na realidade uma razo.
A estatstica que mais agregaria informao seria a Mdia, pois ela uma medida que faz
um aporte de dados individual, isto , teramos uma informao conhecida para o clculo da
Mdia de cada uma das propriedades.
Como, no entanto, a razo calculada representa baixssima variabilidade, entendemos que
a amostra no sofrer superestimao para compensar. Posteriormente, com base na amostra
realizada, poderemos estimar um real tamanho da amostra para verificar o nvel de satisfao
com os clculos realizados.

2) Redimensionamento dos requisitos em termos de erro e confiana, se adotarmos uma amostra


menor do que a calculada.
Uma vez que o n calculado foi de 43 para um r=0,03 e uma Pf=0,95 e o n realizado foi
de 30, devemos atualizar o erro e/ou a confiana.
Vamos assumir que a Probabilidade de Confiana no se modificou e apenas vamos mexer
na margem de erro, portanto:
Continua Pf=0,95z/2=1,96
E vamos deixar como incgnita o r. Refazemos a conta do dimensionamento da amostra,
substituindo o n, incgnita na verso anterior, por n = 30, tamanho que foi realmente efetivado
e a incgnita agora o r. Desse modo, refazendo os clculos vamos redimensionar o montante
de erro que realmente foi praticado quando a deciso foi reduzir de 43 para 30 o tamanho da
amostra.
Retomemos a frmula com todos os seus valores substitudos, com exceo do erro.

30 =

n0 =

N z2 / 2 CV 2
2049 * (1,96) * (0,10050378)
=
2
2
2
( N 1) r + z / 2 CV
(2049 1) * ( r ) + (1,96) * (0,10050378)

N z2 / 2 CV 2
N z2 / 2 CV 2
2

1)

=
z2 / 2 CV 2
N
r
( N 1) r 2 + z2 / 2 CV 2
n0
1/ 2

N z2 / 2 CV 2
N z 2 CV 2
1
1
r = /2
z2 / 2 CV 2

=
z2 / 2 CV 2

n0
n0

( N 1)
( N 1)
2

1/ 2

2
2


1
(2049)(1,96) (0,10050378)
(1,96) 2 (0,10050378) 2
r =

30

(2049 1)

108

= 0,036

EaD

mtodos estatsticos e a administrao

Ento, diminuindo o tamanho da amostra para 30, considerando que PF = 0,95, estaremos
trabalhando com um erro mximo de r=0,036
3) Coletamos dados referentes s 30 propriedades rurais, selecionadas aleatoriamente.
4) Construmos o banco de dados das propriedades sorteadas para compor a amostra.
Quadro 2: Relao das variveis coletadas por meio do instrumento de coleta e sua classificao
X1
X2
X3
X4
X5
X6

Tamanho da propriedade (ha)


Produo: soja (0.No produz; 1.Produz)
Produo: milho(0.No produz; 1.Produz)
Produo: aves(0.No produz; 1.Produz)
Produo: leite(0.No produz; 1.Produz)
N de moradores da propriedade

VA quantitativa contnua
VA qualitativa no ordenvel
VA qualitativa no ordenvel
VA qualitativa no ordenvel
VA qualitativa no ordenvel
VA quantitativa

Fonte: Elaborao da autora.

Quadro 3: Banco de dados n 6 com as variveis coletadas por meio do instrumento de coleta
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

X1
Tam
28
12
15
5
8
55
80
36
27
10
47
62
87
13
25
42
53
84
27
18
15
61
76
34
29
50
42
24
16
49
1130

X2
soja
1
1
1
0
0
1
1
1
1
0
1
1
1
0
1
1
1
1
0
1
1
1
1
0
1
1
1
1
0
1

X3
milho
1
0
1
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
1
1
1
0
1
1
0
1
0
1
1
1

X4
aves
1
1
0
1
1
0
0
1
1
1
0
0
0
1
0
0
1
0
0
1
1
0
0
1
1
0
0
1
1
0

X5
leite
1
1
1
1
1
1
0
1
1
1
0
0
0
1
1
0
1
0
1
1
1
0
1
1
1
1
0
1
1
0

0,77

0,87

0,50

0,70

X6
moradores
5
7
7
9
8
2
3
4
5
8
2
3
3
6
5
2
3
2
4
5
6
2
4
3
5
3
2
2
8
4
132

X1
tam
784
144
225
25
64
3025
6400
1296
729
100
2209
3844
7569
169
625
1764
2809
7056
729
324
225
3721
5776
1156
841
2500
1764
576
256
2401
59106

X6
moradores
25
49
49
81
64
4
9
16
25
64
4
9
9
36
25
4
9
4
16
25
36
4
16
9
25
9
4
4
64
16
714

Fonte: Elaborao da autora, com base em tcnicas de simulao.

109

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Clculo das estatsticas amostrais das variveis quantitativas


Quadro 4: Estatsticas descritivas
Medida

Frmula
n

Mdia

X =

Aritmtica:

Varincia

i =1

xi
n

x2
2
S = i (x )
i =1 n
2

X1: Tamanho

X1 =

Coeficiente de
Variao

1.130
= 37,67.ha
30

X6 =

2 30
59.106
S2 =
(37,67 )

30
30 1
= 570,177 ha

132
= 4, 4 moradores
30

2 30
714
S2 =
(4, 4)

30
30 1
= 22,59310345 moradores

S = (570,177 2 =

Desvio
Padro

X6: Moradores

S = (22,59310345) 2 =

S = S2

= 23,87837934.ha

S
CV = 100
X

23,87837934
CV =
100 =

37,67

4,753220324
CV =
100 =

4, 4

= 63, 4%

= 108%

= 4,753220324

Fonte: Elaborao da autora.

Quadro resumo das estatsticas e dos resultados da aplicao do intervalo de confiana e


do teste de hipteses para as variveis quantitativas
Quadro 5: Quadro resumo: intervalo de confiana e teste de hipteses
Medidas
Tamanho Propriedade
Moradores

Intervalo Confiana
Li
Ls

Parmetros

estimativa

37,67

29,12

4,4

2,67

TH

Sig.

46,21

2,096

0,0180, *

6,10

1,325

0,0918 n.s.

Fonte: Elaborao da autora.


Li: Limite Inferior; Ls: Limite Superior; TH: Teste de Hipteses

Intervalo de confiana de 95% para a Mdia; utiliza-se o intervalo de confiana com base
na distribuio normal devido ao tamanho da amostra piloto, n = 30.

110

EaD

mtodos estatsticos e a administrao

X1: Tamanho da propriedade (conforme o quadro 3):


23,87837934

IC 95% = X z / 2
= Pf IC 95% = 37,67 1,96
= 0,95
n
30

IC 95% = {29,12 46, 21} = 0,95


Constatamos que o tamanho mdio das propriedades rurais nessa regio est estimado em
37,67 ha, o qual pode ser avaliado potencialmente como um valor entre 29,12 e 46,21 h, com
um nvel de significncia de 5%.
O intervalo de confiana calculado evidencia que o zero no um valor possvel para a
verdadeira mdia, com 95% de confiana. A verdadeira inteno do estudo, no entanto, saber
se o mdulo rural nessa regio continua sendo 25 ha. Para isso vamos construir um teste de hiptese com essa premissa, de que o mdulo no se alterou e tem 25 ha.
H 0 : = 0 , =25 ha a mdia atual igual antiga.
H a : >25 ha , a mdia atual maior que a antiga.
Regio crtica do teste
Pf=0,95, =0,05 Z=1,96
Logo:
Aceita H0 se z0 1,96
Rejeita H0 se z0 > 1,96
Estatstica de teste:
Grandes amostras

zo =

X 0

37,67 25
= 2,906
23,87837934 30

Concluso:
Como zo= 2,906 > zt =1,96, tem uma chance de 1,79% de ocorrer no caso da igualdade com
o mdulo rural antigo ser verdadeira, garantindo que a diferena estatisticamente significativa (P<0,05). Rejeitamos H0 concluindo que houve mudana no padro de propriedades,
ocorrendo uma concentrao de terras nessa regio, constatando-se que o padro mdio no
mais 25 ha, cresceu e com um nvel de significncia estatstico de 5%, podemos estimar o
tamanho mdio das propriedades em 37,67, com um potencial de variar entre 29 e 46 ha.
111

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

X6: N de moradores por propriedade (conforme o quadro 3):


4,753220324

IC 95% = X z / 2
= Pf IC 95% = 4, 4 1,96
= 0,95
n
30

IC 95% = {2,67 6,10} = 0,95


Constatamos que o nmero mdio de moradores das propriedades rurais nessa regio est
estimado em 4,4 moradores, e que o tamanho mdio pode ser avaliado potencialmente como um
valor entre 2,67 e 6,10 moradores, com um nvel de significncia de 5%.
O intervalo de confiana calculado evidencia que o zero no um valor possvel para a
verdadeira mdia, com 95% de confiana, no entanto h informaes de que o nmero mdio
de membros nas famlias gachas de 3,25 pessoas. Queremos saber se o nmero mdio dessa
regio maior do que o do Estado. Para isso vamos construir um teste de hiptese com essa
premissa, de que o nmero mdio igual ao do Estado.
H0: =0 , =3,25 moradores, a mdia da regio igual do Estado.
Ha: >3,25 moradores por famlia, a mdia da regio maior que a do Estado.

Regio crtica do teste


Pf=0,95, =0,05 Z=1,96
Logo:
Aceita H0 se z0 1,96
Rejeita H0 se z0 > 1,96
Estatstica de teste:
Grandes amostras

zo =

X 0

4, 4 3, 25
= 1,325
4,753220324 30

Concluso:
Como zo= 1,325 < zt =1,96 aceitamos H0, h uma chance de ocorrer de 9,18% no caso de a
igualdade com o nmero de moradores ser verdadeiramente 3,25, garantindo que a diferena
no estatisticamente significativa (P>0,05). Aceitamos H0 concluindo que no h diferena
estatisticamente significativa entre a mdia estadual = 3,25, e a mdia da regio = 4,4. As
famlias, atualmente, como decorrncia da vida moderna, do planejamento familiar, acesso
aos meios de contracepo, tendem a ter menos filhos, restringindo-se a 1 ou 2 no mximo.
112

EaD

mtodos estatsticos e a administrao

X2: Produz soja, p: sim; (1-p): no tal que p = 0,77 (1-p) = 0,23

IC 95% = p z / 2

p(1 p)
0,77 * 0, 23

= Pf IC 95% = 0,77 1,96


= 0,95
n
30

IC 95% = {0,71 0,83}= 0,95

Constatamos que a proporo de propriedades que produz soja estimada em 0,77, e que
a proporo pode ser avaliada potencialmente como um valor entre 0,71 e 0,83, com um nvel
de significncia de 5%.
O intervalo de confiana calculado evidencia que o zero no um valor possvel para a
verdadeira mdia, com 95% de confiana. Supondo, no entanto, que metade das propriedades
rurais produz soja, queremos saber se a proporo estimada significativamente maior do que a
suposta. Para isso vamos construir um teste de hiptese com essa premissa, de que a proporo
real igual a 0,50.
H0: = 0,50 a proporo de propriedades que produzem soja de 0,50.
Ha: = 0,50 a proporo de propriedades que produzem soja > que 0,50.
Regio crtica do teste
Pf=0,95, =0,05 Z=1,96
Logo:
Aceita H0 se z0 1,96
Rejeita H0 se z0 > 1,96
Estatstica de teste:
Grandes amostras

zo =

p 0
p (1 p )

=
n

0,77 0,50
= 3,514
0,77(0, 23)
30

Concluso:
Como zo= 3,514 > zt =1,96 tem uma chance de 0,02% de ocorrer no caso da igualdade
com a hiptese de que 50% das propriedades produzem soja seja verdadeira, altamente
improvvel, garantindo que a diferena altamente significativa estatisticamente (P<0,01).
Rejeitamos H0, concluindo que h diferena altamente significativa estatisticamente entre a
proporo suposta = 0,50 e a proporo da regio = 0,77 quando se trata de produo de soja
113

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

com um nvel de significncia de 1%. Apesar de a soja ser uma produo que exige grandes
extenses rurais e cultivo com maquinrio agrcola, a maioria das propriedades (independentemente do tamanho) dedica-se a essa cultura pelo manejo exigido e retorno bastante
garantido, bem como pela poltica agrcola que favorece esta cultura. Podemos ento afirmar
que a proporo estimada de produtores de soja de 77% com grandes possibilidades de o
intervalo de 71% a 83% conter a real proporo da regio em termos de produtores de soja,
tenha uma chance de 95% de conter a verdadeira proporo.
X : Produz milho, p: sim; (1-p): no tal que p = 0,87 (1-p) = 0,13
3

IC 95% = p z / 2

p (1 p )
0,87 * 0, 23

= Pf IC 95% = 0,87 1,96


= 0,95
n
30

IC 95% = {0,83 0,91}= 0,95

Constatamos que a proporo de propriedades que produzem milho estimada em 0,87,


e que a proporo pode ser avaliada potencialmente como um valor entre 0,83 e 0,91, com um
nvel de significncia de 5%.
O intervalo de confiana calculado evidencia que o zero no um valor possvel para a
verdadeira mdia, com 95% de confiana. Supondo, no entanto, que metade das propriedades
rurais produz milho, queremos saber se a proporo estimada significativamente maior do que
a suposta. Para isso vamos construir um teste de hiptese com essa premissa, de que a proporo
real igual a 0,50.
H0: = 0,50 a proporo de propriedades que produzem milho de 0,50.
Ha: = 0,50 a proporo de propriedades que produzem milho > que 0,50.
Regio crtica do teste
Pf=0,95, =0,05 Z=1,96
Logo:
Aceita H0 se z0 1,96
Rejeita H0 se z0 > 1,96
Estatstica de teste:
Grandes amostras

zo =

114

p 0
p (1 p )

=
n

0,87 0,50
= 6,026
0,87(0,13)
30

EaD

mtodos estatsticos e a administrao

Concluso:
Como zo= 6,026 > zt =1,96 rejeitamos H0, tem uma chance de ocorrer de 0,0000..% no caso
da igualdade com a suposio 0,50 ser verdadeira, garantindo que a diferena altamente
significativa estatisticamente (P<0,01). Conclumos que h diferena altamente significativa
estatisticamente entre a proporo suposta = 0,50 e a proporo da regio = 0,87 quando se
trata de produo de milho com um nvel de significncia de 1%. Apesar de o milho ser uma
produo que exige uma terra de boa qualidade, quase sempre uma terra de mato, uma
cultura de grande utilidade tanto para a comercializao quanto para a demanda interna
da propriedade, por isso a maioria das propriedades (independentemente do tamanho) se
dedica a essa cultura pelo manejo exigido e retorno bastante garantido, bem como pela poltica agrcola que favorece esta cultura. Podemos ento afirmar que a proporo estimada de
produtores de milho de 87% com grandes possibilidades de o intervalo de 83% a 91% conter
a real proporo da regio em termos de produtores de milho, tenha uma chance de 95% de
conter a verdadeira proporo.

X : Produz aves, p: sim; (1-p): no tal que p = 0,50 (1-p) = 0,50


4

IC 95% = p z / 2

p (1 p )
0,50 * 0,50

= Pf IC 95% = 0,50 1,96


= 0,95
n
30

IC 95% = {0, 41 0,59} = 0,95

Constatamos que a proporo de propriedades que produzem aves estimada em 0,50,


e que a proporo pode ser avaliada potencialmente como um valor entre 0,41 e 0,59, com um
nvel de significncia de 5%.
O intervalo de confiana calculado evidencia que o zero no um valor possvel para a
verdadeira mdia, com 95% de confiana. Sabendo, no entanto, que 65% das propriedades rurais
produzem aves, queremos saber se a proporo estimada significativamente maior do que a
suposta. Para isso vamos construir um teste de hiptese com essa premissa, de que a proporo
real igual a 0,50.

H0: = 0,65 a proporo de propriedades que produzem aves de 0,65.


Ha: < 0,65 a proporo de propriedades que produzem aves < que 0,65.
115

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Regio crtica do teste


Pf=0,95, =0,05 Z=1,96 Logo:
Aceita H0 se z0 -1,96
Rejeita H0 se z0 < -1,96
Estatstica de teste:
Grandes amostras

zo =

p 0
p (1 p )

=
n

0,50 0,65
0,50 * (0,50)

= 1,643
30

Concluso:
Como zo= -1,643 > zt =-1,96 aceitamos H0, tem uma chance de ocorrer de 0,0505% no caso
da igualdade com a suposio de 0,50 ser verdadeira, garantindo que a diferena no significativa estatisticamente (P>0,05). possvel concluir que no h diferena estatisticamente
significativa entre a proporo suposta = 0,65 e a proporo da regio = 0,50 quando se trata
de produo de aves com um nvel de significncia de 5%. Apesar de ave ser uma produo
que no exige grandes extenses rurais, de fcil manuseio e consumo garantido, a maioria
das propriedades, independentemente do tamanho, no se dedica muito a essa produo. Podemos ento afirmar que o a proporo estimada de produtores de aves de 50% com grandes
possibilidades de que o intervalo de 41% a 59% conter a real proporo da regio em termos
de produtores de aves, tenha uma chance de 95% de conter a verdadeira proporo.,
X : Produz leite, p: sim; (1-p): no tal que p = 0,70 (1-p) = 0,30
5

IC 95% = p z / 2

p(1 p)
0,70 * 0,30

= Pf IC 95% = 0,70 1,96


= 0,95
n
30

IC 95% = {0,62 0,78} = 0,95

Constatamos que a proporo de propriedades que produzem leite estimada em 0,70,


e que a proporo pode ser avaliada potencialmente como um valor entre 0,62 e 0,78 com um
nvel de significncia de 5%.
O intervalo de confiana calculado evidencia que o zero no um valor possvel para a
verdadeira mdia, com 95% de confiana. Supondo, porm, que as propriedades rurais so pequenas entende-se que se dediquem produo de leite em torno de 90%, queremos saber se a
proporo estimada significativamente menor do que a suposta. Para isso vamos construir um
teste de hiptese com essa premissa, de que a proporo real igual a 0,90.
116

EaD

mtodos estatsticos e a administrao

H0 : = 0,90 a proporo de propriedades que produzem leite de 0,80.


Ha: < 0,90 a proporo de propriedades que produzem leite > que 0,80.
Regio crtica do teste
Pf=0,95, =0,05 Z=1,96
Logo:
Aceita H0 se z0 1,96
Rejeita H0 se z0 < 1,96
Estatstica de teste:
Grandes amostras

zo =

p 0
p (1 p )

=
n

0,70 0,90
= 2,390
0,70(0,30)
30

Concluso:
Como zo= -2,390 < zt =-1,96 rejeitamos H0, tem uma chance de ocorrer de 0,0084% no caso
de a igualdade com a suposio ser 0,50 a verdadeira proporo, garantindo que a diferena
altamente significativa estatisticamente (P<0,01). Concluindo que h diferena altamente
significativa estatisticamente entre a proporo suposta = 0,90 e a proporo da regio =
0,70 quando se trata de produo de leite com um nvel de significncia de 5%. Apesar de o
leite ser um produto altamente comercializvel, pois vrias empresas de beneficiamento do
leite operam na regio, a proporo de produtores menor do que a esperada. Podemos ento
afirmar que a proporo estimada de produtores de leite de 70% com grandes possibilidades
de que o intervalo de 62% a 78% conter a real proporo da regio em termos de produtores
de leite tenha uma chance de 95% de conter a verdadeira proporo.,

Seo 5.3
Aplicaes
Organize uma pesquisa de campo em que voc precise entrevistar, coletar dados de qualquer natureza.
117

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Estabelea um tema, objetivos, hipteses


Descreva a metodologia de coleta
Descreva a metodologia estatstica
Faa uma reviso bibliogrfica da estatstica
Faa uma reviso de literatura do assunto abordado
Calcule amostra
Faa o delineamento amostral
Sorteie as unidades amostrais
Colete os dados
Construa o banco de dados
Aplique o mximo de estatsticas possveis
Faa uma discusso dos resultados embasada na reviso da literatura sobre o assunto
Elabore concluses
Bibliografia

RESUMO DA UNIDADE 5
Nesta unidade aprendemos a projetar os resultados de uma amostra
para uma populao. As garantias que temos de resultados confiveis
estabelecida a partir de estimativas calculadas por meio de intervalo
de confiana de 95%. Alm das estimativas, aprendemos a testar se
os valores estimados por intermdio da amostra diferem significativamente de valores antigos.

118

EaD

Unidade 6

mtodos estatsticos e a administrao

REGRESSO LINEAR SIMPLES


Antonio dson Corrente

Objetivos desta Unidade


Examinar a relao entre duas variveis.
Compreender o significado da correlao entre variveis.
Compreender o significado da regresso linear simples.
Identificar situaes em que a tcnica de regresso possa ser aplicada.
Compreender que o modelo de regresso linear permite fazer projees futuras e fornece explicaes por meio de seus coeficientes.
Compreender os resultados da regresso linear simples.
As sees desta Unidade
Seo 6.1 Correlao entre as variveis
Seo 6.2 Diagrama de disperso
Seo 6.3 Coeficiente de correlao
Seo 6.4 Coeficiente de determinao (R2)
Seo 6.5 Anlise de regresso
Seo 6.6 Banco de dados
Esta ferramenta ajuda o administrador a interpretar variveis no facilmente compreendidas, e mediante a anlise do comportamento quantitativo passado das variveis em estudo,
equaciona-os possibilitando projetar seu comportamento no futuro.
A descrio e a inferncia estatstica tratam de uma s varivel de cada vez. Por exemplo,
quando temos uma amostra de uma empresa, como o ndice de liquidez. Quando, porm, temos de
estabelecer novas metas em uma empresa, a amostra apresentar diversas variveis que podero
119

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

ser observadas em cada unidade amostrada: o ndice de liquidez da empresa, o faturamento, as


vendas, o nmero de funcionrios, os salrios, outras despesas, etc. Obrigatoriamente teremos
de trabalhar com mais de uma varivel.
No momento vamos considerar o caso de duas variveis (anlise bivariada). Nosso objetivo
ser estabelecer o comportamento quantitativo passado das variveis em estudo e o equacionarmos, proporcionando projetar o seu comportamento no futuro, pois prioritariamente a anlise de
regresso usada com o propsito de previso.
A busca de associao entre variveis o propsito de toda pesquisa cientfica, pois a
possvel existncia de relao entre variveis orienta anlise, concluses e evidencia novas descobertas, ou seja, ressalta relaes subjacentes a uma s varivel.
Ao dispormos de uma amostra de n unidades, contamos com um par de valores das variveis X i e Yi , por exemplo, os valores dos investimentos reais em funo dos anos, em bilhes
de dlares. O grupo pode ser descrito separadamente, no entanto nosso interesse ser o de estabelecer uma possvel relao funcional (matemtica) entre as duas variveis e se a relao for
boa, us-la para fazer previses.
No exemplo dado nosso interesse ser estabelecer uma relao matemtica (linear) entre
os anos ( X i ) e os investimentos reais ( Yi ). No podemos esquecer que o ajuste de um conjunto
de dados com a finalidade de fazer projees futuras s vivel mediante o conhecimento a
priori das possveis influncias de causa e efeito que uma ou mais variveis exercem sobre as
demais.

Seo 6.1
Correlao entre Variveis
O termo correlao significa relao em dois sentidos que serve para designar a fora
que mantm unidos dois conjuntos de dados. A correlao mede a intensidade, a direo e
estabelece o grau de associao linear entre duas variveis quantitativas.

120

EaD

mtodos estatsticos e a administrao

Exemplo de Aplicao:
Tabela 1: Valores dos investimentos reais, em bilhes de dlares, no perodo entre 1968 e 1982 nos Estados Unidos
ANO

Xi

Yi

X iYi

X i2

Yi 2

1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

161
172
158
173
195
217
199
163
195
231
257
259
225
241
204

161
344
474
692
975
1302
1393
1304
1755
2310
2827
3108
2925
3374
3060

1
4
9
16
25
36
49
64
81
100
121
144
169
196
225

25921
29584
24964
29929
38025
47089
39601
26569
38025
53361
66049
67081
50625
58081
41616

120

3 050

26004

1240

636520

Fonte: Fundao Getlio Vargas. Disponvel em: <www.ibre.fgv.br/>.

X i : Tempo em anos codificado e Yi : Invest: Investimentos reais.

Seo 6.2
Diagrama de Disperso
O clculo do coeficiente de correlao bastante trabalhoso, assim conveniente fazermos
primeiro o diagrama de disperso, que uma representao grfica bidimensional.
O diagrama de disperso uma representao grfica da relao entre duas variveis
quantitativas. Esta representao feita sob a forma de pares ordenados ( X i , Yi ), onde X i
um valor observado de uma varivel e Yi o correspondente valor da outra varivel.
Na construo do grfico podemos comear com qualquer um dos eixos. No nosso exemplo
a varivel X i representa os gastos, pois entre o valor que representa o menor investimento e o que
indica o maior investimento, que so 2 e 20, devemos criar uma escala no eixo correspondente.
Proceder no eixo Yi da mesma maneira, pois o ms de janeiro apresentou o menor valor para o
faturamento, que 20, o ms de outubro apresentou o maior faturamento, que de 62. Pois bem,
devemos criar uma escala considerando este intervalo e representarmos no corresponde eixo.
121

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Em nosso exemplo:
O diagrama de disperso fica:
Figura 1: Evoluo dos investimentos em funo dos anos

Investimento (bilhes de dlares)

270
250
230
210
190
170
150
1967

1969

1971

1973

1975

1977

1979

1981

1983

Anos

Fonte: Elaborao do autor, com dados da FGU na tabela 1.

Ao observamos o diagrama de disperso verificamos que parece plausvel a existncia


de uma relao linear dos dados em relao ao tempo.

Seo 6.3
Coeficiente de Correlao
A correlao mede a intensidade, a direo e estabelece o grau de associao linear entre
duas variveis quantitativas. As relaes lineares tm importncia especial porque uma linha
reta um padro simples e bastante comum.

122

EaD

mtodos estatsticos e a administrao

0 R 1

Correlao linear positiva

1 R 0

Correlao linear negativa

Correlao no linear

No h correlao linear

Karl Person (1857 1936) foi quem desenvolveu a frmula de R, que dado por:

R=

( X )( Y ) ,
n X ( X ) n Y ( Y )
n (X iYi )
2
i

-1 R 1

O valor de R deve estar sempre entre 1 e +1, inclusive. Valores de R prximos de 1 e


+1 indicam correlao forte, e valores prximos de zero indicam correlao fraca. O sinal de R
indica se a correlao positiva ou negativa.
Por simulao numrica e pela proximidade ou no dos pontos em torno da reta de regresso, temos:
R
R
R
R
R
R

0
0 |--- 0,3
0,3 |--- 0,6
0,6 |--- 0,8
0,8 |--- 1,0
1,0

Sem Correlao Linear


Correlao Linear Positiva Fraca
Correlao Linear Positiva Mdia
Correlao Linear Positiva Forte
Correlao Linear Positiva Muito Forte
C orre la o Line a r Pos itiva Pe rfe ita

No nosso exemplo devemos calcular e interpretar o Coeficiente de Correlao.


123

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

R=

15(26004) (120).(3050)
390060 366000
R=
15(1240) (120) 15(636520) (3050)
4200 245300
R=

24060
24060
64,80741* 495, 2777 R = 32097,66 R = 0,749587

Assim, o grau de correlao observado entre os investimentos reais em funo do tempo


linear positiva forte.
Observao Importante: Correlao no igual causa e efeito, pois duas variveis podem
estar relacionadas e, no entanto, no haver entre elas nenhuma relao de causa e efeito.
Como exemplo, em Triola (1999) e outros, ao relacionarmos o tamanho do p com a renda de
um grupo de indivduos, poderemos observar uma alta correlao, prximo de 1, no entanto
na prtica no existe nenhuma relao de causa e efeito entre ambas.
Se duas variveis estiverem relacionadas pela lei de causa e efeito, vivel o estabelecimento do grau que mantm as mesmas correlacionadas. No nosso exemplo, embora no possamos
afirmar que a varivel X i seja a nica causa das variaes sofridas em Yi , razovel admitir que
maiores gastos em comerciais oferecem uma maior probabilidade de retornos financeiros.
Assim, d para sabermos quanto da variao de Yi pode ser explicada pelas variaes de

X i , que dado pelo Coeficiente de Determinao.

Seo 6.4
Coeficiente de Determinao ( R )
2

um dos critrios mais empregados para caracterizar o ajuste, pois o Coeficiente de Determinao nos permite saber quanto da variao de Yi pode ser explicado pela variao de X i .

R 2 = (R ) .100
2

Assim, o Coeficiente de Determinao (poder explicativo do modelo) dado por:


Se R = 0,749587 , ento R 2 = (0,749587).100 R 2 = 56,19% , significando que
aproximadamente 56,19% das variaes dos investimentos reais so explicadas pelas
variaes dos anos. E o restante pode ser explicado por outras variveis que no esto
sendo consideradas no modelo.
124

EaD

mtodos estatsticos e a administrao

Seo 6.5
Anlise de Regresso
Com a regresso buscamos as leis que explicam como duas ou mais variveis esto relacionadas. Alm disso, proporciona obtermos um dado desconhecido a partir de seu par conhecido,
com uma boa aproximao.
O estudo da regresso usado para estabelecer uma equao matemtica que possa descrever com certa preciso a relao entre duas ou mais variveis.
Ao traarmos o diagrama de disperso e obtermos uma nuvem de pontos de configurao
lembrando uma reta, possvel equacionarmos a esses pontos uma reta com o objetivo de produzirmos uma informao simplificada que possa expressar a lei que as mantm unidas.
Devemos lembrar que por dois pontos passa uma e somente uma reta, mas que quando
temos uma nuvem de pontos podemos traar inmeras retas.
De todas as retas possveis devemos escolher a que melhor se ajuste a todos os pontos
simultaneamente. A escolha dessa reta (equao) segue um critrio chamado Mtodo dos Mnimos Quadrados.
O Mtodo dos Mnimos Quadrados deve-se ao matemtico e astrnomo francs Pierre
Simon Laplace, que segue estes critrios:

Yi = + X i + ei Sejam (a, b) estimadores de (a , b) S = ei2 = (Yi a bX i ),2


i =1

o que torna necessrio:

S
=0
a
S
=0
b
Diferenciando S parcialmente em relao aos estimadores a e b, e simplificando as expresses, obtemos as equaes normais do ajuste pelo mtodo dos mnimos quadrados. Essas
equaes normais so equaes lineares e podem ser resolvidas, simultaneamente, em relao
aos coeficientes a e b, ou algebricamente temos:
125

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

a=

b=

n X iYi X i Yi
n X i2

( X )

No caso da regresso linear simples, a varivel Yi considerada a varivel dependente


(resposta) e a varivel X i considerada a varivel independente (explicativa).
Significado dos parmetros:
: Coeficiente Linear ou intercepto. onde a reta corta o eixo Yi . Interpretado como a variao
mdia da varivel dependente Yi , que no depende da varivel independente X i . dado na
mesma unidade de medida de Yi . Diz o nvel de Yi quando X i igual a zero.
: Coeficiente Angular, inclinao. Fornece uma estimativa da variao esperada de Yi , a partir
da variao de uma unidade de X i . A variao pode ser positiva ou negativa.

ei : So os erros aleatrios, inerentes s variveis em estudo.


Assim, a equao de regresso estimada :

Yi = a + bX i
Observao importante:
O sinal ^ sobre o Yi para indicar que se trata de um valor terico, prximo da realidade,
mas no necessariamente presente nos dados observados.
Agora devemos calcular a equao da reta de regresso e comentar sobre o significado
das estimativas.
Clculo dos coeficientes a e b.

15(26004) (120).(3050) 24060


b = 5,7286 agora podemos determinar
=
15(1240) (120)
4200
3050
120
a = 203,3333 45,8288 a = 203,3333 45,8288 a = 157,5045
a=
5,7286.
15
15

b=

Em nosso exemplo:

Yi = 157,5045 + 5,7286 X i

Significado dos coeficientes:

a = 157,5045 Investimento mdio real que no depende do passar dos anos. No exemplo
este coeficiente no tem sentido prtico, no entanto no podemos esquecer que ele faz parte do
modelo ajustado e que para fazermos projees ele essencial.
126

EaD

mtodos estatsticos e a administrao

b = 5,7286 Acrscimo mdio nos investimentos reais a cada ano. A cada ano os investimentos reais tiveram um acrscimo mdio de 5,7286 dlares.
Pergunta: Qual o volume esperado de investimentos reais a serem gastos no ano de
1983?

Yi = 157,5045 + 5,7286 X i substituindo em X i o cdigo respectivo ao ano seguinte temos:


Yi = 157,5045 + 5,7286.(16) Yi = U $ 249,16 volume esperado para o ano de 1983.

Seo 6.6
Banco de Dados
Tabela 2: Valores dos investimentos reais e do Produto Interno Bruto, em bilhes de dlares,
as taxas mdias de juros e as taxas de inflao no perodo entre 1968 e 1982 nos Estados Unidos
ANO
1968

INVESTIMENTO
161

PIB
1058

JUROS
5,16

INFLAO
4,40

1969

172

1088

5,87

5,15

1970

158

1086

5,95

5,37

1971

173

1122

4,88

4,99

1972

195

1186

4,50

4,16

1973

217

1254

6,44

5,75

1974

199

1246

7,83

8,82

1975

163

1232

6,25

9,31

1976

195

1298

5,50

5,21

1977

231

1370

5,46

5,83

1978

257

1439

7,46

7,40

1979

259

1479

10,28

8,64

1980

225

1474

11,77

9,31

1981

241

1503

13,42

9,44

1982

204

1475

11,02

5,99

Fonte: Disponvel em: www.ibre.fgv.br/.

Com este banco de dados pretendemos que voc aplique a teoria estudada na Unidade 6.
127

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

RESUMO DA UNIDADE 6
Nesta Unidade aprendemos a desvendar as relaes que existem
entre as variveis quantitativas estabelecendo o tipo e o grau de
correlao que existe entre elas. Alm disso, buscamos compreender
o resultado estatstico dessas relaes no contexto das variveis que
envolvem o estudo.

128

EaD

Unidade 7

mtodos estatsticos e a administrao

FERRAMENTAS DE ANLISE ESTATSTICA NO EXCEL


Iara Denise Endruweit Battisti

OBJETIVO DESTA SEO


Habilitar o aluno a agilizar a produo de estatsticas por meio do manuseio correto das ferramentas do Excel.

AS SEES DESTA UNIDADE:


Seo 7.1 Elaborando um banco de dados no Excel
Seo 7.2 Utilizando as tcnicas estatsticas para analisar os dados no Excel
Seo 7.3 Medidas descritivas para as variveis quantitativas
Seo 7.4 Tabelas simples para as variveis qualitativas e para as variveis quantitativas com
pouca variabilidade
Seo 7.5 Tabelas cruzadas
Seo 7.6 Grficos de setores, colunas e barras
Seo 7.7 Histograma e polgono de frequncias
Seo 7.8 Grfico de linha
Agora que j conhecemos os conceitos tericos, vamos aplicar estes conhecimentos na
prtica, utilizando para isso uma planilha eletrnica. Neste livro vamos usar como referncia o
software Microsoft Excel nas verses 2003 e 2007.
O MS Excel um aplicativo do tipo Planilha Eletrnica, ou seja, um software apropriado para
a edio de documentos com caractersticas numricas. Empregando uma planilha eletrnica podemos
manipular com facilidade a edio de tabelas, efetuar clculos, operaes estatsticas e a gerao de
grficos. De forma geral permite armazenar dados e produzir informaes a partir destes.
129

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Os arquivos que normalmente produzimos com o Excel so do tipo Pasta de Trabalho, e possuem a extenso .xls ou .xlsx., respectivamente para MS Excel verso 2003 e verso 2007. A tela
inicial do Excel apresentada na Figura 1a para a verso 2003 e Figura 1b para a verso 2007.
Figura 1a: Tela inicial do Excel 2003

Figura 1b: Tela inicial do Excel 2007

Uma planilha um conjunto de linhas e colunas, como uma grade. No Excel, as colunas
so identificadas por letras em ordem alfabtica, e as linhas por nmeros em ordem crescente.
Uma clula a menor unidade de trabalho do Excel, identificada pelo cruzamento de uma linha
e uma coluna.
130

EaD

mtodos estatsticos e a administrao

Cada clula tem um endereo prprio, formado pela combinao da letra da coluna com o
nmero da linha. Por exemplo, a clula D8 localiza-se no cruzamento da coluna D com a linha
8. Para selecionar uma clula, colocando-a em foco, utiliza-se o cursor, que na planilha aparece
como um ponteiro semelhante a uma cruz. Basta clicar na clula desejada.
Um intervalo de clulas a representao de uma faixa ou conjunto de clulas. Pode ser
selecionado clicando com o cursor sobre um dos cantos do intervalo e arrastando at o canto
oposto, formando um retngulo. Pode tambm ser apenas uma coluna ou linha. Para selecionar
uma coluna inteira deve-se clicar na respectiva letra, no cabealho da coluna.
Para selecionar uma linha inteira deve-se clicar no nmero identificador da linha. O intervalo identificado por suas coordenadas, sendo que o primeiro elemento das coordenadas
o endereo da clula superior esquerda, e o segundo elemento das coordenadas o endereo
da clula inferior direita do intervalo. Os dois elementos so separados por dois pontos ( : ). Por
exemplo, o intervalo C4:E5 compreende as clulas C4,C5,D4,D5,E4 e E5.

Seo 7.1
Elaborando um Banco de Dados no Excel
Para criar um banco de dados no Excel destinamos as linhas aos dados de cada elemento
da amostra e as colunas a cada uma das variveis. A Figura 2 mostra o exemplo do banco de
dados dos clientes da empresa Costa, apresentado a seguir. Tomemos esse banco de dados como
exemplo para desenvolver toda a Unidade 7.
Exemplo:
Pesquisa de satisfao realizada, por amostragem, com clientes da empresa Costa
(empresa fictcia), em maio de 2009.

131

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Banco (planilha) de dados da pesquisa de satisfao na empresa Costa


Cliente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

Sexo
F
F
F
M
F
F
F
F
M
F
M
F
F
F
F
M
F
F
F
M
F
M
M

Satisfao com atendimento


MS
S
++S
S
++S
I
S
S
MI
S
S
MS
S
S
S
I
+S
MS

Satisfao com preo


MS
++S
S
MS
+S
I
I
S
+++I
S
+S
S
+S
S
S

Nota geral
10
7
6
7
8
9
7
7
5
5
8
8
9
9
7
10
8
8
9
7
7
8
9

F = feminino, M = masculino, MS = Muito satisfeito, S = satisfeito,


+ = mais ou menos satisfeito, I = insatisfeito, MI = muito insatisfeito.

Figura 2: Exemplo de um banco de dados

132

Idade
22
26
32
35
23
27
22
37
41
40
35
35
37
22
21
19
40
51
55
45
46
33
34

EaD

mtodos estatsticos e a administrao

Seo 7.2
Utilizando as Tcnicas Estatsticas para Analisar os Dados no Excel
Primeiramente voc deve ativar as ferramentas de anlise estatstica no Excel. O procedimento diferente no Excel verso 2003 e no Excel verso 2007. Siga os passos conforme a
verso que voc possui.
No Excel 2003:
Clique no menu Ferramentas, depois em Suplementos e ento marque a opo Ferramentas de Anlise e clique no boto ok conforme a Figura 3 (esquerda). De agora em diante,
sempre que voc desejar utilizar o comando anlise de dados, este estar disponvel no menu
Ferramentas.
No Excel 2007:
Clique no boto do Office

, depois no boto opes do Excel e no menu escolha a

opo Suplementos e ento na lista de suplementos de aplicativos inativos a opo Ferramentas


de anlise. Aps clique no boto ir
.
Ento aparecer a janela da Figura 3 (direita). Nesta marque Ferramentas de anlise e
clique no boto ok. De agora em diante, sempre que voc desejar utilizar o comando anlise de
dados, este estar disponvel no menu Dados.
Figura 3: Instalao das Ferramentas de Anlise no Excel 2003 (esquerda) e no Excel 2007 (direita)

133

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Seo 7.3
Medidas Descritivas para as Variveis Quantitativas

Para obter as medidas descritivas, voc clica na opo Anlise de dados no menu Ferramentas no Excel 2003 ou clica no boto Anlise de dados no menu Dados no Excel 2007. Ento
aparecer a janela da Figura 4.
Figura 4: Ferramentas de Anlise

Nesta janela voc clica na opo Estatstica descritiva. Aps, aparecer a janela da Figura
5. Nesta, observar os seguintes passos:
selecione os dados da coluna que voc deseja analisar, por exemplo, coluna E, que se refere
varivel idade;
marque a opo rtulos na primeira linha, pois foi selecionado junto com os valores o nome
(rtulo) da varivel;
marque nova planilha, assim o resultado do comando vai aparecer numa nova planilha da pasta
de trabalho;
marque resumo estatstico;
clique no boto ok.

134

EaD

mtodos estatsticos e a administrao

Figura 5: Estatstica descritiva

Uma nova planilha criada com os resultados do comando, conforme Figura 6.


Figura 6: Resultado do comando estatstica descritiva

Para calcular o coeficiente de variao deve-se incluir uma frmula da seguinte maneira:
clique numa clula vazia do Excel; sugesto: na clula B16;
digite =;
clique no valor do desvio padro;
digite /;
clique no valor da mdia;
135

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

digite*;
digite 100;
tecle enter.
A frmula deste exemplo :
Neste exemplo o valor do coeficiente de variao 29,59%.
Interpretao dos resultados: A idade mdia dos indivduos pesquisados de 33,83 anos,
com desvio padro de 10 anos. Dos 23 indivduos avaliados, 50% deles tm idade at 35 anos
e os outros 50% tm idade igual ou maior a 35 anos. A menor idade desta amostra 19 anos e
a maior 55. Tem-se um conjunto de dados homogneos, posto que o coeficiente de variao
assume valor menor que 30%.

Seo 7.4
Tabelas Simples para as Variveis Qualitativas
e para as Variveis Quantitativas com Pouca Variabilidade
Para elaborar uma tabela simples a partir de um banco de dados utilize o comando relatrio de
tabela dinmica. Ateno: este disponibilizado diferentemente no Excel 2003 e no Excel 2007.
No Excel 2003:
Escolha a opo Relatrio de tabela e grfico dinmico no menu Dados, sendo apresentada
a tela da Figura 7.
Figura 7: Tabela e grficos dinmicos no Excel 2003

136

EaD

mtodos estatsticos e a administrao

A opo de tabela dinmica j est marcada; caso deseje um grfico voc deve selecionar
a segunda opo, conforme Figura 7.
Aps, clique no boto avanar e ento a janela da Figura 8 ser apresentada.
Figura 8: Seleo do banco de dados no Excel 2003

Caso o banco de dados (informaes j digitadas na planilha) no esteja selecionado,


selecione com o mouse. Novamente clique no boto avanar, na janela da Figura 9, clique no
boto layout.
Figura 9: Seleo do local de sada dos resultados e layout no Excel 2003

Neste momento voc escolhe o modo de apresentao da tabela (layout), mostrada na figura
10. Para escolher o local de apresentao das categorias da varivel voc deve arrastar o boto
apresentado direita da tela, referente varivel de interesse, at o corpo da tabela sobre Linha.
Depois, arraste novamente o boto da varivel para o centro do corpo da tabela para calcular
frequncia absoluta (n), ou seja, contar as categorias. Deve aparecer no boto: Contar de nome_
da_varivel. Caso isso no ocorra, clique duplo sobre o boto e escolha a opo ContNm.

137

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Figura 10: Layout da tabela no Excel 2003

Para calcular a frequncia relativa percentual, voc deve novamente arrastar o boto da
varivel at o centro do corpo da tabela e clicar duplo sobre o boto, sendo apresentada a tela
da Figura 11, clique em Opes e no campo Mostrar dados como, selecione a opo % do total
e clique no boto ok.
Figura 11: Opes de apresentao da frequncia no Excel 2003

Clique no boto OK e no boto Concluir e ento aparecer a tabela simples dinmica da


Figura 12.
138

EaD

mtodos estatsticos e a administrao

Figura 12: Exemplo de tabela simples dinmica

Para formatar a tabela clique no boto Formatar Relatrio na barra de ferramentas do relatrio e escolher o Relatrio 7. A tabela ficar assim:

No Excel 2007:
Clique no menu Inserir e na opo Tabela dinmica e aparecer a janela da Figura 13.
Se o banco de dados (rea com as informaes da pesquisa) no estiver selecionado voc deve
selecion-lo com o mouse e aps clique no boto ok.
Figura 13: Seleo de banco de dado no Excel 2007

Aps o OK, aparecer a janela da Figura 14.

139

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Figura 14: Elaborao de tabela dinmica no Excel 2007

Marque a varivel de interesse no menu direita, neste exemplo marque a varivel


sexo

e ento arraste (clique com o mouse e arraste com

o boto clicado) para rtulos de linha

. Arraste-a tambm para valores

, duas vezes. Deve aparecer ContNm em cada boto de valores, caso no estiver

aparecendo ento clique com o mouse sobre o primeiro boto e escolha a opo configuraes
do campo valor. Aparecer a janela da Figura 15.

140

EaD

mtodos estatsticos e a administrao

Figura 15: Marcando a opo ContNm

Na janela da Figura 15: marque a opo ContNm e no boto ok, assim aparecer o valor
absoluto na tabela simples (segunda coluna). Clique sobre o segundo boto e escolhe a opo
configuraes do campo valor.
Aparecer a janela da Figura 16:
Figura 16: Marcando a opo mostrar valores como % do total

Marque a opo ContNm e clique na ficha mostrar valores como e escolher a opo % do
total, conforme Figura 16; assim aparecer o valor relativo percentual na tabela simples (terceira
coluna). A tabela para este exemplo est apresentada na Figura 17.
141

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Figura 17: Exemplo de tabela simples

No cabealho da tabela substitui-se contar de sexo por n e contar de sexo 2 por %, assim
obtm-se a tabela 1 (Figura 18).
Figura 18: Exemplo de tabela simples formatada

Interpretao: 69,57% dos indivduos entrevistados so do sexo feminino e 30,43% dos


indivduos entrevistados so do sexo masculino.

Seo 7.5
Tabelas Cruzadas
O processo para a construo de tabelas cruzadas dinmicas semelhante construo de
tabelas simples. A seguir apresentamos procedimento para o Excel 2003 e Excel 2007.
No Excel 2003:
Selecione mais uma varivel para o corpo da tabela conforme a Figura 19, colocando-a
sobre a Coluna. Finalizando todo o processo aparecer a tabela cruzada conforme Figura 20.

142

EaD

mtodos estatsticos e a administrao

Figura 19: Elaborao da tabela cruzada

Figura 20: Exemplo de tabela cruzada dinmica

No Excel 2007:
Selecione mais uma varivel conforme a Figura 21 para rtulos da coluna

143

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Figura 21: Elaborao da tabela cruzada

Finalizando todo o processo aparecer a tabela cruzada conforme Figura 22.


Figura 22: Exemplo de tabela cruzada dinmica

Na Figura 23 est apresentada uma tabela cruzada formatada.

144

EaD

mtodos estatsticos e a administrao

Figura 23: Exemplo de tabela cruzada formatada

Seo 7.6
Grficos de Setores, Colunas e Barras
Voc elabora um grfico a partir de dados sistematizados (a partir de uma tabela j elaborada)
de forma diferente no Excel 2003 e no Excel 2007. Existem diferentes tipos de grficos, adequados
para cada tipo de varivel. A seguir so apresentados os tipos de grficos mais usados.
Grfico de setores (pizza)
usado para representar uma varivel aleatria. Suas categorias devem totalizar 100%
e mais indicado quando o nmero de categorias chega no mximo a 5. Primeiramente voc
seleciona as categorias e os valores absolutos ou relativos que sero apresentados no grfico, a
partir da tabela j elaborada, conforme Figura 24.
Figura 24: Selecionando os dados para elaborar um grfico

No Excel 2003:
Para construir um grfico de setores no Excel 2003 clique no cone

na barra de ferra-

mentas ou no menu Inserir e escolha a opo Figura e ento Grfico. Neste momento aparecer
a tela referente ao Assistente Grfico, como apresentada na Figura 25. Escolha o Tipo de grfico
Pizza e aparecer subtipos de grficos. Voc pode escolher um dos seis tipos e ento clicar no
boto Avanar.
145

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Figura 25: Grfico de setores etapa 1

A Figura 26 mostra a segunda etapa, quando apresentada uma prvia do grfico, permitindo selecionar novamente os dados, se necessrio.
Figura 26: Grfico de setores etapa 2

Na etapa 3 (Figura 27), clique no campo Ttulo do grfico e digite o ttulo do grfico.
146

EaD

mtodos estatsticos e a administrao

Figura 27: Grfico de setores etapa 3, ttulo do grfico

Aps, clique na ficha Legenda para alterar o local de posio da legenda ou para exclu-la
(Figura 28).
Figura 28: Grfico de setores etapa 3, legenda do grfico

Na ficha Rtulos de dados (Figura 29) possvel mostrar o nome das categorias e a porcentagem no grfico. Aps, clique no boto Concluir.

147

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Figura 29: Grfico de setores etapa 3, rtulos de dados

Pode-se personalizar o grfico, alterando a cor dos setores, trocando a cor do fundo, modificando o tamanho, tipo e cor da fonte.

Para alterar a cor dos setores voc clica uma vez no grfico, aps clica mais uma vez no
setor (fatia) cuja cor deseja alterar e aps clica duplo para aparecer o menu de cores. Ento,
seleciona-se uma cor ou no boto Efeitos de Preenchimento para utilizar as opes gradiente ou
textura. Na Figura 30 apresenta-se um exemplo de grfico formatado.
Figura 30: Grfico de setores exemplo
Grfico 1 - Sexo dos funcionrios da empresa
COSTA, maio de 2008

Masculino
30%

Feminino
70%

Grfico de Colunas
Utilizamos um grfico de colunas simples ou barras simples para representar uma varivel
aleatria. O procedimento o mesmo adotado no grfico de setores, mas na etapa 3 (Figura 31)
digitamos alm do ttulo do grfico, o ttulo do eixo x (horizontal) e o ttulo do eixo y (vertical).

148

EaD

mtodos estatsticos e a administrao

Figura 31: Grfico de colunas etapa 3

O grfico de colunas finalizado apresentado na Figura 32.


Figura 32: Grfico de colunas exemplo
Grfico 1 - Sexo dos funcionrios da empresa
COSTA, maio de 2008
% 80,00
70,00
60,00
50,00
40,00
30,00
20,00
10,00
0,00
Feminino

Masculino
sexo

Grfico de Barras
De forma similar podemos construir um grfico de barras, como o apresentado na Figura
33.

149

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Figura 33: Grfico de barras exemplo


Grfico 1 - Sexo dos funcionrios da empresa
COSTA, maio de 2008

sexo

Masculino

Feminino

0,00

20,00

40,00

60,00

80,00
%

No Excel 2007:
Para construir um grfico de setores (pizza) no Excel 2007, utilize o menu Inserir e escolha
grfico de pizza, conforme a Figura 34.
Figura 34: Elaborao de grfico

No menu do grfico de pizza escolha um tipo e o grfico ser apresentado como a


Figura 35.

150

EaD

mtodos estatsticos e a administrao

Figura 35: Exemplo de grfico de setores

Clique com o mouse na rea do grfico (parte branca dentro do retngulo) e clique na
opo Layout 1 no menu Design, conforme Figura 36.
Figura 36: Formatando o grfico de setores

O grfico final ficar conforme a Figura 37.


151

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Figura 37: Exemplo de grfico de setores

Voc pode clicar com o mouse sobre o Ttulo do Grfico para edit-lo e ento digitar o ttulo
para o seu grfico. Ainda, pode mudar o estilo do grfico clicando no menu Design e ento em
Estilo (Figura 38).
Figura 38: Utilizando a opo design do grfico para grfico de setores

Para elaborar um grfico de colunas o procedimento semelhante: primeiro selecione os


dados na tabela (categorias e valores absolutos ou percentuais) e depois clique no menu Inserir
e escolha Colunas, aparecer o grfico da Figura 39.
152

EaD

mtodos estatsticos e a administrao

Figura 39: Exemplo de grfico de colunas

Voc pode clicar na rea do grfico (parte branca dentro do retngulo) e usar a opo do
menu Design para alterar definies do grfico: em Layout do grfico voc pode incluir o ttulo
do grfico e os valores. Clicando com o mouse no ttulo possvel editar e colocar o ttulo para
o seu grfico, conforme Figura 40.
Figura 40: Utilizando a opo design do grfico para grfico de colunas

Para o desenvolvimento de um grfico de barras, o procedimento a ser seguido o mesmo


descrito para o grfico de colunas, mudando apenas a escolha do tipo de grfico no incio do
procedimento.
153

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Quando desejamos representar os resultados de uma tabela cruzada num grfico podemos
optar pelo grfico de colunas agrupadas ou barras agrupadas. Primeiramente devemos digitar a
tabela cruzada no Excel conforme a Figura 41 e selecion-la. Tomemos como exemplo a tabela
cruzada da satisfao com atendimento em relao ao sexo dos clientes da empresa Costa. O
procedimento para a elaborao do grfico de colunas agrupadas ou grfico de barras agrupadas
semelhante elaborao do grfico de colunas simples e barras simples, porm agora a legenda
dever aparecer, conforme Figura 42.
Figura 41: Tabela cruzada para construir um grfico de colunas agrupadas

Figura 42: Exemplo de um grfico de colunas agrupadas


Grfico 2 - Satisfao com o atendimento em
relao ao sexo do clientes da empresa COSTA,
maio de 2008
n 10
8
6

2
0
I

MI

MM

MS

Satisfaao

Seo 7.7
Histograma e Polgono de Frequncias
O histograma e o polgono de frequncias so os grficos adequados para representar
uma distribuio de frequncia. Agora veremos como construir esses dois grficos no Excel. Primeiramente precisamos digitar a tabela de distribuio de frequncia e selecion-la, conforme
Figura 43. Tomemos como exemplo o rendimento mdio nominal da Tabela 1.

154

EaD

mtodos estatsticos e a administrao

Tabela 1: Rendimento mdio nominal do trabalho principal, habitualmente recebido por ms, pelas pessoas de 10 anos
ou mais de idade, ocupadas na semana de referncia, em Porto Alegre, Janeiro/2005 a Dezembro/2007
R$
903 |- 939
939 |- 975
975 |- 1011
1011 |- 1047
1047 |- 1083
1083 |- 1119
Total

Fi
5
11
5
5
6
4
36

frac %
13,89
44,45
58,34
72,23
88,89
100,00
-

xi
921
957
993
1029
1065
1101
-

Fonte: IBGE, 2008.

Nota: No includos trabalhadores no remunerados e trabalhadores que receberam somente em benefcios.


Figura 43: Tabela de distribuio de frequncia para construir um histograma

No Excel 2003:
Aps, no menu inserir, escolhemos a opo grfico e aps o tipo de grfico de colunas e
executamos o procedimento conforme descrito anteriormente. Quando o grfico tiver sido concludo (Figura 44) clicamos com o boto direito do mouse sobre uma das colunas do grfico e
ento aparecer o menu da Figura 45; neste escolhemos a opo formatar srie de dados. Assim,
aparecer a tela da Figura 46, clicar na ficha opes e em largura do espaamento digitar 0. O
histograma apresentado na Figura 47.
Figura 44: Construindo um histograma

155

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Figura 45: Formatar srie de dados no histograma

Figura 46: Unir colunas do histograma

Figura 47: Exemplo de um histograma


Histograma
fi 12
10
8
6
4
2
0
903 |-- 939

939 |-- 975

975 |-- 1011

1011 |-- 1047

1047 |-- 1083

1083 |-- 1119

R$

O procedimento semelhante para construir o polgono de frequncia. Primeiramente temos de digitar a tabela de distribuio de frequncia conforme a Figura 48. Esta dever ter um
intervalo inferior ao primeiro, com fi = 0, e um intervalo superior ao ltimo, com fi = 0. Depois,
selecionamos a tabela e no menu inserir grfico escolhemos o tipo de grfico de linha e seguimos
os passos at a finalizao, conforme a Figura 49.
156

EaD

mtodos estatsticos e a administrao

Figura 48: Tabela de distribuio de frequncia para construir um polgono de frequncia

Figura 49: Exemplo de um polgono de frequncia


Polgono de freqncia
n 12
10
8
6
4
2
0
7|
86

-- 9

03

3|
90

-- 9

39

9|
93

-- 9

75

-5|
97

11
10
1
10

04
-- 1
1|

7
4
10

08
-- 1
7|

3
8
10

11
-- 1
3|

9
1
11

15
-- 1
9|

R$

No Excel 2007:
Aps, no menu inserir, escolhemos a opo grfico e aps o tipo de grfico de colunas 2 D
e o grfico da Figura 50 ser apresentado. Em layout do grfico escolhemos o layout 8 (Figura
51) e o grfico da Figura 52 ser apresentado. Clicamos com o boto direito do mouse sobre uma
das colunas do grfico e no menu escolhemos formatar srie de dados e, ento escolhemos a
opo cor da borda conforme Figura 53. Nesta escolhemos linha slida e cor preta. O histograma
apresentado na Figura 54.

157

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Figura 50: Construindo o histograma

Figura 51: Layout do grfico nmero 8 (figura central)

Figura 52: Histograma

158

EaD

mtodos estatsticos e a administrao

Figura 53: Formatando bordas nas colunas do histograma

Figura 54: Histograma formatado

Seo 7.8
Grfico de Linha
Digitamos os dados, observando que na primeira coluna consta o tempo e na segunda
os valores que queremos representar em um grfico de linha conforme exemplo da Figura 55.
Selecionamos os dados das duas colunas.

159

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

Figura 55: Dados do exemplo

No Excel 2003:
Aps, no menu inserir, escolhemos a opo grfico e a seguir o tipo de grfico de linha e
executamos o procedimento conforme descrito anteriormente. Digitamos o ttulo do grfico e o
ttulo dos eixos. Podemos alterar a cor da linha clicando com o boto direito do mouse sobre a
linha. Tambm podemos alterar a cor do fundo clicando com o boto direito do mouse. O grfico
de linha apresentado na Figura 56.
Figura 56: Exemplo de um grfico de linha

No Excel 2007:
Aps, no menu inserir, escolhemos a opo grfico e a seguir o tipo de grfico de linha 2 D
e executamos o procedimento conforme descrito anteriormente. Em layout do grfico escolhemos
o layout 1 (Figura 57). Digitamos o ttulo do grfico e o ttulo dos eixos. Deletamos a legenda.
Podemos alterar a cor da linha clicando com o boto direito do mouse sobre a linha e escolhemos
a opo formatar srie de dados. O grfico de linha apresentado na Figura 58.
160

EaD

mtodos estatsticos e a administrao

Figura 57: Layout 1 do grfico de linha (primeira figura)

Figura 58: Exemplo de um grfico de linha

RESUMO DA UNIDADE 7
Nesta unidade utilizamos os recursos estatsticos do Excel para tratar
as informaes.
A aplicao dos mtodos estatsticos favorecida pela informtica, no
que diz respeito a hardware e software, uma vez que geralmente necessitamos trabalhar com grande quantidade de dados (n grande).
Assim, o conhecimento a respeito da utilizao de um software estatstico
ou um software que fornece tcnicas estatsticas essencial para alunos ou profissionais que esto iniciando seu aprendizado em Mtodos
Estatsticos.
A planilha eletrnica Excel uma boa alternativa para alunos que esto
se iniciando nos mtodos estatsticos, por ser de fcil acesso, posto que
grande parte dos usurios domsticos e organizaes possuem o pacote
Microsoft Office.

161

EaD

Referncias

mtodos estatsticos e a administrao

ANDRADE MARTINS, Gilberto. Estatstica geral e aplicada. So Paulo: Ed. Atlas, 2002.
BATTISTI, I. E.; KIRCHNER, R. M.; FRICKE R. M. Rotinas da planilha eletrnica Excel para
uso em estatstica descritiva. Iju: Ed. Uniju, 2003. (Cadernos Uniju).
BEARZOTI, E.; OLIVEIRA M. Estatstica bsica. Lavras, MG: Ufla, 1997.
CORRAR, L. J.; PAULO, E.; DIAS FILHO, J. M. Anlise multivariada para os cursos de Administrao, Cincias Contbeis e Economia. So Paulo, Ed. Atlas, 2007.
COSTA NETO, P. L. Estatstica. So Paulo: Ed. Edgard Blcher, 1977.
COSTA NETO, P. L. Probabilidades. Ed. So Paulo: Edgard Blcher, 1974.
COSTA, Srgio Francisco. Introduo ilustrada estatstica. So Paulo: Ed. Harbra, 1988.
DOWNING, D.; CLARK, J. Estatstica aplicada. So Paulo: Ed. Saraiva, 2000.
FRICKE, R. M. Padres estatsticos para descrio de dados: medidas de tendncia central e de
variabilidade. Iju: Ed. Uniju, 2002. (Cadernos Uniju Srie Estatstica).
FRICKE, R. M. Teoria e aplicaes de amostragem, inferncia, relaes entre variveis. Iju:
Uniju, 2008a. Apostila.
FRICKE, R. M. Estatstica aplicada aos fenmenos sociais. Iju: Uniju, 2008b. Apostila.
IBGE. Diretoria de Pesquisas, Coordenao de Trabalho e Rendimento. Pesquisa mensal de
emprego, mar.2002-abr. 2008.
KAZMIER, L. J. Estatstica aplicada Economia e Administrao. So Paulo: Ed.McGraw Hill,
1982.
KMENTA, J. Elementos de econometria. Teoria economtrica bsica. 2. Ed. So Paulo: Ed. Atlas,
1988. V. 1.
MAGALHES, M. N.; LIMA, A. C. P. Noes de probabilidade e estatstica. So Paulo: Edusp.
2002.
MEDEIROS, V. Z.; CALDEIRA, A. M.; PACHECO, G. L.; MACHADO, M. A. S. Mtodos quantitativos com Excel. So Paulo: Ed. Cengage Learning, 2008.
MONTGOMERY, Douglas C. Probabilidad y Estadstica. Universidade do Estado do Arizona;
Editora: McGraw-Hill, 2004.
163

EaD

Ruth Marilda Fricke Iara Denise Endruweit Battisti Antonio dson Corrente

MORETTIN, P. A.; TOLOI, C. M. Srie temporais. Srie Mtodos Quantitativos. 2. ed. So Paulo:
Ed. Atual, 1987.
MUNIZ, J. A.; ABREU, A. R. Tcnicas de amostragem. Lavras, MG: Faepe, 1999.
OLIVEIRA, S. T. Ferramentas para o aprimoramento da qualidade. 2. ed. So Paulo: Ed.Pioneira,
1996.
SILVA, N. N. Amostragem probabilstica. So Paulo, SP: Edusp, 1998.
SILVER, M. Estatstica para Administrao. So Paulo: Ed. Atlas, 2000.
STEVENSON, W. Estatstica aplicada Administrao. So Paulo: Ed. Harbra, 1981.
TRIOLA, M. Introduo estatstica. 7. ed. Rio de Janeiro: Ed. LTC, 1999.
VIEIRA, Sonia. Princpios de estatstica. So Paulo: Ed. Pioneira, 1999.

164

S-ar putea să vă placă și