Documente Academic
Documente Profesional
Documente Cultură
Revisada e Ampliada
O Autor:
William Costa Rodrigues é Agrônomo, Doutor em Fitotecnia e Pós-
Doutor em Entomologia, pela Univ. Federal Rural do Rio de Janeiro.
Prof. da Universidade Severino Sombra e no Instituto Superior de
Tecnologia de Paracambi/ FAETEC-RJ, ministra aulas de Ecologia1,
Toxicologia1, Climatologia1, Estudos de Impacto Ambiental1, Estatís-
tica Aplicada2 e Auditoria Certificação Ambiental2, Metodologia da
Pesquisa Científica2 na graduação e de Estatística Ambiental1 e Bion-
dicadores Ambientais1 na especialização de Planejamento e Gestão
Ambiental1, onde também é Supervisor Pedagógico. Atua como de-
senvolvedor de softwares agrícolas e Científicos. Coordenador Geral
do projeto Entomologistas do Brasil (www.ebras.bio.br). Coordena-
dor e autor de capítulos no livro Citricultura Fluminense: Principais
pragas e seus inimigos naturais. Trabalha ativamente com análise es-
tatística em projetos na área agrícola e ambiental. O autor poderá ser
contatado através do e-mail: wcostarodrigues@yahoo.com.br.
Esta Obra:
A apostila Estatística Ambiental foi inicialmente utilizada no progra-
ma de Pós-Graduação Lato Sensu, Planejamento e Gestão Ambiental e
no Curso de graduação em Gestão Ambiental, na disciplina Estatística
Aplicada, tendo como objetivo informar o discente sobre os princípios
básicos da estatística, relacionando-a com a metodologia científica,
possibilitando um entendimento básico sobre o assunto. Hoje a aposti-
la é também utilizada em cursos de graduação. Capa: Fotos do Autor
na Ilha da Marambaia. Foto superior Casulo de Plecoptera e foto infe-
rior, córrego onde ao casulo foi coletado.
Copyright©2004-
Copyright©2004-2008
2008, W.C. Rodri
Rodrigues
1
Disciplina Ministrada na Universidade Severino Sombra
2
Disciplina Ministrada no Instituto Superior de Tecnologia em Paracambi, RJ- Curso de Gestão Ambiental
Sumário
1 Introdução................................................................................................................. 1
1.1 Crescimento e Desenvolvimento da Estatística Moderna ................................ 1
1.2 Variação ao Acaso ............................................................................................ 1
2 Ensaio x Experimentação ......................................................................................... 2
3 Conceitos Estatísticos ............................................................................................... 2
3.1 Estatística Descritiva ........................................................................................ 2
3.2 Inferência Estatística......................................................................................... 2
3.3 Tipos de Dados ................................................................................................. 3
3.3.1 Variáveis Aleatórias Categorizadas.......................................................... 3
3.3.2 Variáveis Aleatórias Numéricas ............................................................... 3
4 Por que Utilizar a Estatística .................................................................................... 4
5 Planejamento Experimental...................................................................................... 4
5.1 Fases do Planejamento ..................................................................................... 4
5.1.1 Problema................................................................................................... 5
5.1.2 Informações Existentes............................................................................. 5
5.1.3 Noções Gerais Sobre Hipótese ................................................................. 5
5.1.4 Formulação das Hipóteses ........................................................................ 6
5.1.4.1 Elaborando as hipóteses........................................................................ 6
5.1.4.2 Hipótese Estatística x Hipótese Científica ........................................... 6
5.1.5 Testando as Hipóteses .............................................................................. 6
5.1.6 Riscos na Tomada de Decisão Através Teste de Hipóteses ..................... 6
5.1.7 Aleatorização ............................................................................................ 7
5.2 Erros de Observações ....................................................................................... 7
5.2.1 Erros do Observador................................................................................. 7
5.2.2 Erro do Método de Observação ................................................................ 8
5.2.3 Por Falta de Resposta ............................................................................... 8
5.3 Controle dos Erros nas Observações ................................................................ 8
5.4 Métodos de Coleta de Dados ............................................................................ 8
5.4.1 Fontes Primárias ....................................................................................... 8
5.4.2 Fontes Secundárias ................................................................................... 8
5.5 Pesquisa Observacional .................................................................................... 9
5.6 Pesquisa Experimental...................................................................................... 9
5.6.1 Princípios da Experimentação ................................................................ 10
5.7 Tipos de Amostras .......................................................................................... 10
5.7.1 Amostras Simples ao Acaso ................................................................... 10
5.7.2 Amostra Estratificada ............................................................................. 11
5.7.3 Amostra Sistemática ............................................................................... 11
5.7.4 Amostra por Área ................................................................................... 11
5.7.5 Amostra por Conglomeradas .................................................................. 11
5.7.6 Amostra Selecionada .............................................................................. 11
5.8 Determinação do Tamanho da Amostra ......................................................... 12
5.8.1 Tamanho da Amostra para Dados Discretos .......................................... 12
5.8.2 Tamanho da Amostra para Dados Contínuos ......................................... 13
6 Técnicas Estatísticas Para Análise de dados .......................................................... 14
6.1 Medidas de Tendência Central ....................................................................... 14
6.1.1 Média Aritmética Simples ( X ) .............................................................. 14
6.1.2 Média Aritmética Ponderada .................................................................. 14
6.1.3 Média Aritmética de Dados Agrupados em Intervalos .......................... 15
6.1.4 Mediana (Me) ......................................................................................... 16
6.2 Medidas de Variação ...................................................................................... 17
6.2.1 Desvio-Médio (DM) ............................................................................... 17
6.2.2 Desvio Padrão......................................................................................... 17
6.3 Variância ou Quadrado Médio ....................................................................... 18
6.4 Erro-Padrão da Média - s(x) ........................................................................... 19
6.5 Coeficiente de Variação.................................................................................. 19
6.6 Curva de Distribuição Normal........................................................................ 19
6.6.1 Limites de Confiança.............................................................................. 21
6.6.2 Erro Padrão ............................................................................................. 22
6.7 Teste de Normalidade dos Dados ................................................................... 22
6.8 Teste de Klomogorov-Smirnov (K-S) ............................................................ 22
6.9 Teste de Shapiro-Wilks (S-W) ....................................................................... 22
7 Testes Paramétricos e Não Paramétricos................................................................ 23
7.1 Teste t - Student.............................................................................................. 23
7.1.1 Dados Pareados (Amostras Dependentes).............................................. 24
7.1.2 Dados Pareados (Amostras Independentes) ........................................... 25
7.1.3 Dados Não-Pareados - Variâncias Desiguais (Heterocedásticas)........... 26
7.1.4 Dados Não-Pareados - Variâncias Iguais (Homocedásticas) ................. 27
7.2 Teste Qui-Quadrado (χ²) ................................................................................ 28
7.3 Tabela de Contingência .................................................................................. 28
7.4 Teste de Kruskal-Wallis ................................................................................. 29
7.5 Teste de Friedman (Análise da Variância) ..................................................... 31
8 Correlação Linear ................................................................................................... 32
8.1 Coeficiente de Correlação (r) ......................................................................... 32
8.1.1 Correlação de Pearson ............................................................................ 32
8.1.2 Correlação de Spearman......................................................................... 32
8.1.3 Aspectos Gerais da Correlação Linear ................................................... 33
8.2 Coeficiente de Determinação (r²) ................................................................... 34
8.3 Coeficiente de Alienação (K) ......................................................................... 34
8.4 Significância do Teste de Correlação ............................................................. 34
8.4.1 Significância Baseada nos Intervalos ..................................................... 34
8.4.2 Significância Baseada no Teste t para r (Pearson) ................................. 35
9 Análise de Regressão.............................................................................................. 35
9.1 Regressão Linear Simples .............................................................................. 36
9.2 Regressão Linear Múltipla.............................................................................. 36
9.3 Regressão Múltipla ......................................................................................... 37
10 Transformação de Dados .................................................................................... 37
10.1 Raiz Quadrada ................................................................................................ 38
10.2 Transformação Logarítimica .......................................................................... 38
10.3 Transformação Angular (Arcoseno)............................................................... 38
10.4 Considerações Gerais ..................................................................................... 38
11 Testes Específicos Para Análise de Populações e Comunidades ....................... 38
11.1 Índice de Diversidade e Dominância Populacional........................................ 38
11.1.1 Índice de Margalef (α)............................................................................ 39
11.1.2 Índice de Glason (Dg) ............................................................................. 39
11.1.3 Índice de Menhinick (Dm) ...................................................................... 39
11.1.4 Índice de Shanon-Wiener (H') ................................................................ 39
11.1.5 Índice de Dominância Berger-Parker (d)................................................ 39
11.2 Exemplo.......................................................................................................... 39
11.3 Índice de Similaridade entre Populações........................................................ 40
11.3.1 Quociente de Similaridade...................................................................... 40
11.3.2 Porcentagem de Similaridade ................................................................. 40
11.3.3 Índice de Afinidade ................................................................................ 41
11.3.4 Constância .............................................................................................. 41
11.3.5 Índice de Associação (IA) ...................................................................... 41
12 Bibliografia......................................................................................................... 42
13 Anexos ................................................................................................................ 43
Índice de Tabelas
Tabela 1. Resultados da interpretação de 500 fotos aéreas de diversas áreas com
presença de mata. (dados fictícios)........................................................................... 7
Tabela 2. Dados do peso de 10 crianças antes e depois da administração a base de folhas
de mandioca (dados fictícios). ................................................................................ 24
Tabela 3. Dados de um experimento com a taxa de crescimento de mudas de duas
leguminosas em sistema agro-silvo-pastoril, numa área de re-vegetação (dados
fictícios). ................................................................................................................. 25
Tabela 4. Resultados das amostras de cinco diferentes áreas delimitadas pelas
características edáficas do solo, em quatro diferentes profundidades. Os dados
apresentados referem-se a o poluente α-β β -16-Imaginol-Poluentis, em mg.mm³ de
solo ......................................................................................................................... 31
Tabela 5. Correlação de Spearman entre as notas brutas de matemática e biologia (Zar,
1999)....................................................................................................................... 33
Tabela 6. Classificação do valor r através de intervalos de 0 a 1................................... 34
Tabela 7. Classificação do valor r através de intervalos de acordo com e Teste de Rugg.
................................................................................................................................ 34
Tabela 8. Série de dados da correlação da flutuação populacional do pulgão Toxoptera
aurantii (Homoptera, Aphididae) em função da brotação foliar de tangerina cv
Poncã, sob cultivo orgânico na Fazendinha Agroecológica, no período de outubro
de 2002 e outubro de 2003 (Extraído de Rodrigues, 2004). Exemplo para o
Microsoft Excel. ..................................................................................................... 35
Tabela 9. Índices de diversidade de cochonilhas em agroecossiema cítrico. ................. 40
Tabela 10. Duas comunidades com sua composição de espécies em percentagem ....... 40
Tabela 11. Valores de t -student em níveis de 5% e 1% (α α=0,05 a 0,01) de
probabilidade. ......................................................................................................... 44
Tabela 12. Valores de χ² (Qui-quadrado) em níveis de 5% e 1% (α α=0,05 a 0,01) de
probabilidade .......................................................................................................... 45
Tabela 13. Valores críticos para o Coeficiente de Correlação de Spearman (rs)............ 46
Tabela 14. Valores para transformação arcsen % ....................................................... 47
Tabela 15. Valores mínimos de j, significativos a 0,5% (Southwood, 1971). ............... 48
Índice de Figuras
Figura 1. Diagrama de uma estatística descritiva, com seus diversos níveis de
categorias. ................................................................................................................. 3
Figura 2. Diagrama de tipos de dados .............................................................................. 4
Figura 3. Interpretação dos dados experimentais. O gráfico à esquerda, baseado em
apenas dois pares de valores anotados para X e Y (que definem os pontos A e B),
parece sugerir que Y cresce à medida que X cresce, entretanto no gráfico à direita,
em que foram registrados outros valores intermediários (definidos pelos pontos B e
C), mostra que a relação entre X e Y obedece a uma lei mais completa................ 10
Figura 4. Curva de distribuição normal simétrica, onde µ é a média e s o desvio padrão.
................................................................................................................................ 20
Figura 5. Curvas de distribuição normal das freqüências de X, tendo a mesma média (µ µ)
e diferentes graus de dispersão dos valores de X, isto é, desvios padrões (s)
diferentes. ............................................................................................................... 20
Figura 6. Curva normal padrão, tendo por parâmetros µ=0 e s= 1. As áreas sob a curva
assinaladas entre os traços verticais, indicam as percentagens de valores de X aí
contidas................................................................................................................... 21
Figura 7. Os valores de Z (compreendidos entre -Z e +Z) correspondem aos
afastamentos de X em relação à média µ, medidos em unidades de desvio-padrão.
A probabilidade (P) com que X possa ter valor menor que uma coordenada
escolhida (C) é indicada pela área, sob a curva, situada à esquerda de C. ............. 22
Figura 8. Correlação linear simples positiva (A); e inversa ou negativa (B),
apresentando a linha de tendência de regressão linear simples de dados fictícios. 33
Figura 9. Janela de configuração da linha de tendência (linha de regressão) e
configuração da equação de regressão no Microsoft Excel.................................... 36
Figura 10. Regressão linear simples entre a flutuação populacional de T. aurantii e a
brotação foliar de tangerina cv. Poncã, em cultivo orgânico de tangerina cv. Poncã,
na Fazendinha Agroecológica, no período de outubro de 2002 a outubro de 2003
(Adaptado de Rodrigues, 2004).............................................................................. 36
Figura 11. Correlação múltipla da amplitude térmica (variável x), brotação (variável y) e
a flutuação populacional de Toxoptera citricida (variável z), em cultivo orgânico
de tangerina cv. Poncã, na Fazendinha Agroecológica, no período de outubro de
2002 a outubro de 2003 (Adaptado de Rodrigues, 2004)....................................... 37
Figura 12. Regressão múltipla entre a flutuação populacional de T. aurantii e a brotação
foliar de tangerina cv. Poncã, em cultivo orgânico de tangerina cv. Poncã, na
Fazendinha Agroecológica, no período de outubro de 2002 a outubro de 2003
(Adaptado de Rodrigues, 2004).............................................................................. 37
Figura 13. Fluxograma Para Auxiliar na Escolha de Testes Estatísticos ....................... 43
Apostila de Estatística Aplicada 1
1 Introdução
Diariamente estamos envolvidos em análises estatísticas, por exemplo, quando
você é abordado na rua para responder qual o candidato irá votar na próxima eleição,
quando o IBGE faz uma visita a sua casa para o censo. Desta forma, você está fazendo
parte da estatística, mas não é só desta forma que você faz parte do infinito mundo da
estatística. Quando você está desempregado ou empregado, está fazendo parte da esta-
tística, quando seu salário aumenta, faz parte também. Bom, podemos ver que em quase
tudo, eu disse quase tudo, podemos empregar a estatística, obviamente que não pode-
mos deixar a estatística dominar nossas vidas, pois o principal objetivo desta ferramenta
é auxiliar na tomada de decisão ou de avaliar uma determinada situação e poder melhor
indicar o caminho para uma tomada de decisão.
A estatística, como parte da matemática aplicada, trata da coleta, da análise e da
interpretação de dados observados. Estudando os mais variados fenômenos das diversas
áreas do conhecimento, ela representa um valioso instrumento de trabalho nos dias de
hoje.
Na área ambiental, o estudo da estatística justifica-se pela necessidade de desen-
volver pesquisas, realizar experimentos, e mesmo pela utilização dos resultados e pes-
quisas feitas, realizar experimentos, e mesmo pela utilização dos resultados e pesquisas
feitas por aqueles que a isso se dediquem, seja visando o aprimoramento de métodos e
técnicas de investigação, seja por exigências do próprio desenvolvimento do país.
2 Ensaio x Experimentação
Existem diferenças básicas entre os dois métodos de avaliar um dado científico.
As diferenças vão desde a simples forma de avaliar e encarar a coleta dos dados até a
forma de apresentação dos dados. Abaixo no Quadro 1 são listadas as diferenças entre
os dois métodos.
3 Conceitos Estatísticos
Para melhor elucidar estes conceitos, digamos que há uma necessidade de saber
a opinião da qualidade de vida no campus de sua faculdade. A população, ou universo,
será todos os alunos da faculdade, enquanto a amostra consistirá os estudantes selecio-
nados para participar da pesquisa. O objetivo da pesquisa é descrever várias atitudes ou
características de toda a população (os parâmetros). Isto seria alcançado utilizando-se
as estatísticas obtidas da amostra de estudantes para estimar atitudes ou características
de interesse da população. Desse modo, um aspecto principal da inferência é o processo
que utiliza a estatística amostral para tomar decisões sobre os parâmetros da população.
População/Universo
Amostra
Parâmetro
Estatística
Figura 1. Diagrama de uma estatística descritiva, com seus diversos níveis de categori-
as.
A amostra pode ser definida também como o conjunto de observações extraídas
de uma fonte (população), segundo determinadas regras e critérios, sendo a po-
pulação a fonte de observações.
A população pode ser constituída de elementos simples, como é o caso dos seres
humanos ou das plantas superiores ou das bactérias, ou por elementos coletivos,
como é o caso das irmandades com mais de um indivíduo, das famílias, ou das
pessoas que habitam uma casa.
Dados discretos são respostas numéricas que surgem a partir de processo de con-
tagem e dados contínuos são repostas numéricas que surgem a partir de um processo de
medição.
Na Figura 2, segue exemplos de variáveis tanto para aleatórias categorizadas,
quanto para aleatórias numéricas (discretas e contínuas).
Tipos de Dados
Categorizadas Numéricas
Discretas Contínuas
Você possui
carro?
Quantas revistas você Qual sua altura?
assina?
Sim Não
5 1,75m
5 Planejamento Experimental
5.1.1 Problema
Ao planejar o problema que se vai pesquisar, deverá ser dada especial atenção
aos seguintes pontos:
Definição da importância do problema que se estuda;
Determinação do(s) objetivo(s) e finalidade da investigação.
5.1.7 Aleatorização
Na oportunidade em que organizamos os ensaios devemos proporcionar condi-
ções idênticas para cada tratamento, possibilitando que se houver algum erro este seja
atribuído ao acaso, ou seja, não tendencioso. Com este processo o erro experimental
poderá ser mensurado através do modelo matemático utilizado para analisar os dados.
Tabela 1. Resultados da interpretação de 500 fotos aéreas de diversas áreas com pre-
sença de mata. (dados fictícios)
Fotos onde a degradação foi considerada positiva (nº)
Observador
1ª leitura 2ª leitura
A 118 139
B 69 78
C 83 88
D 96 89
E 106 92
Observa-se pela tabela acima que em nenhuma das duas ocasiões os diferentes
observadores coincidiram quanto ao número de fotos consideradas positivas para o refe-
rido diagnóstico. O mesmo foi verificado em relação a cada um dos observadores que
apresentaram resultados diferentes entre as duas leituras.
Devemos concluir que, tais discordâncias não refletem uma variação real, e sim
cometida por quem procedeu à leitura do material fotográfico.
William Costa Rodrigues 8
30 35
25 B 30 C
25 B
20
20 D
Y
Y
15 A 15 A
10 10
5 5
A B A B C D
X X
Exemplo: numa pesquisa para determinar a taxa média de hemoglobina dos in-
divíduos de uma comunidade, deparamos com o problema de definir o tamanho da a-
mostra. Apenas sabemos que a população desta comunidade é de aproximadamente de
25.000 indivíduos, o que torna impraticável utilizar todos os elementos. Face a isto,
resolvemos determinar o número de elementos que comporão a amostra. Selecionamos
ao acaso 30 elementos, determinamos o valor do teor de hemoglobina de cada um e cal-
culamos a variância (medida de dispersão), cujo valor foi igual a 9mg2.
Para tal estudo, a fórmula a empregar para determinação do tamanho da amostra
será a fórmula 1 deste item.
William Costa Rodrigues 14
A precisão considerada para esta pesquisa foi de 0,5mg e o valor z= 1,96. Substi-
tuindo na fórmula teremos:
1,96 2 × 9 3,84 × 9 34,56
n0 = 2
∴n 0 = ∴n 0 = ∴ n 0 = 138,24 ≅ 138
0,5 0,25 0,25
138,24 138,24
n= ∴n = ∴ n = 137,48 ≅ 137
138,24 1,0055
1+
25.000
Para o estudo a será realizado recomenda-se que o número mínimo de indivíduos
será igual a 138 para populações infinitas e 137 para populações finitas.
X=
∑x
n
Onde X : representa a média; ∑ x : a soma das variáveis; e o n o números de
indivíduos ou elementos.
Exemplo: deseja-se saber o valor médio do seguinte conjunto de dados: 32, 25,
32, 30, 26, 30, 29, 26, 29 e 33.
∑ x : 32 + 25 + 32 + 30 + 26 + 30 + 29 + 26 + 29 + 33.
n = 10
292
X= ⇒ 29,2
10
Variável Freqüência
X1 f1
X2 f2
. .
. .
. .
Xn fn
X=
∑ xf = x 1f1 + x 2 f 2 + ... + x n f n
n f 1 + f 2 + ... + f n
Exemplo: Calcular a média de idade de crianças até 9 anos de uma determinada locali-
dade.
Idade (anos) Freqüência
2 10
3 8
4 6
5 5
6 5
7 5
8 7
9 4
2 × 10 + 3 × 8 + ... + 9 × 4 250
X= = = 5 anos
10 + 8 + ... + 4 50
X=
∑ xf ∴ 80 = 8 anos
n 10
Desta forma a média da população avaliada é oito anos.
Quando os dados apresentam homogeneidade, é possível o uso da média aritmé-
tica, que tem como:
Vantagens:
o Ser fácil de calcular e entender;
o Unir em um valor todas as observações do conjunto.
Desvantagens:
o Não servir para séries variáveis assimétricas;
o Não expressar variações dentro da distribuição de dados.
Exemplo:
a) Em determinada localidade foram selecionadas oito escolas, com a finalidade de
estimar a mediana referente ao número de alunos. Tendo verificado o seguinte
quadro:
Escola Nº de alunos
A 150
B 180
C 230
D 2.500
E 200
F 160
G 250
H 170
Inicialmente ordenam-se os dados: 150, 160, 170, 180, 200, 250 e 2.500.
n n
Como o número de observações é par utilizam-se as duas fórmulas e + 1 ,
2 2
para obter os dois valores centrais. Assim os valores centrais para este conjunto de da-
dos são 180 (4º) e 200 (5º), portanto o valor médio destes dois valores é igual a 190, que
corresponde à mediana.
Me= 190 alunos.
Apostila de Estatística Aplicada 17
2 - 11 + 5 - 11 + 9 - 11 + 11 - 11 + 14 - 11 + 25 - 11
D.M. =
6
9 + 6 + 2 + 0 + 3 + 14 34
D.M. = ∴ D.M. = ∴ D.M. = 5,6
6 6
∑x 2
−
n
s=
n −1
Onde: x: valores do conjunto de dados; Σ: somatório; e n: número de observa-
ções.
66 2 4.356
1.052 − 1.052 −
s= 6 ∴s = 6 ∴s = 1.052 − 726 ∴ s = 326 ∴s = 65,20
6 −1 5 6 −1 5
∴s = 8,07
Observamos agora uma série de dados agrupados, isto é, uma série de valores
que se repetem e, por conseguinte, são representados pela sua freqüência.
x f fx
2 2 4
3 2 6
4 4 16
5 4 20
6 2 12
Total 14 58
Temos um total de 14 valores agrupados em cinco categorias. Desta forma lan-
ça-se mão de um novo quadro de dados para facilitar os cálculos
x f fx fx²
2 2 4 8
3 2 6 36
4 4 16 256
5 4 20 400
6 2 12 144
Total 14 58 852
∑ fx ∑ fx
2 2
s= − , ou seja,
n n
2
852 58
s= − ∴ s = 60,8571 − 4,1429 2 ∴s = 60,8571 − 17,1636 ∴ s = 43,6935 ∴ s = 6,6101
14 14
É importante ressaltar que valores acima de 30% não significam um C.V. insa-
tisfatório, pois alguns experimentos em campo podem ter o valor C.V. de até
65% e serem considerados bons.
Figura 6. Curva normal padrão, tendo por parâmetros µ=0 e s= 1. As áreas sob a curva
assinaladas entre os traços verticais, indicam as percentagens de valores de X aí conti-
das.
A área compreendida entre -2s e +2s abrange cerca de 95,5% dos valores de X,
restando, portanto duas áreas extremas, apenas 4,5% das observações ou eventos medi-
dos.
As propriedades da curva normal permitem seu uso para o cálculo de probabili-
dade com que determinados valores obtidos durante as observações, ou as medições,
possam ocorrer em função das variações.
Procedimento:
a) Obtêm-se as diferenças entre os valores antes e depois (quadro acima);
b) Verifica-se a média aritmética das diferenças;
c) Verifica-se a variância das diferenças e;
d) Aplica-se o teste t - student.
37
b) X d = = 3,7
10
c) Σd²=173; Σd=37; n= 10
1369
173 −
s2 = 10 = 173 − 136,9 = 39,1 = 4,01
9 9 9
O próximo passo e recorrer à tabela do teste t - student (Tabela 11, p. 44) e com-
para-se o valor do t calculado com o valor crítico da tabela em função de α com n-1
graus de liberdade.
Apostila de Estatística Aplicada 25
Consulta-se então a tabela do teste t-student (Tabela 11, p. 44), para verificar os
valores críticos nos níveos de 5% e 1% de probabilidade para 25 graus de liberdade.
Na tabela iremos obter o valor de 2,06 (5%) e 2,79 (1%). Desta forma, conclui-
se que o valor obtido pata t = 5,82 é significativo no nível de 1% (1% ou α=0,01), acei-
tando-se a hipótese alternativa, devido à diferença significativa entre as médias das duas
amostras.
s =
2 (n A − 1) × s 2A + (n B − 1) × s 2B
nA + nB − 2
Para nosso exemplo teríamos:
s2 =
(10 − 1)× 0,04 + (7 − 1)× 0,11 = 9 × 0,04 + 6 × 0,11 = 0,36 + 0,66 = 1,01 = 0,0673
10 + 7 − 2 15 15 15
Em seguida aplica-se a fórmula para o teste t.
XA − XB
t=
1 1
s 2 +
n
A n B
Assim temos:
William Costa Rodrigues 28
fe
Onde: fo= freqüência observada e; fe= freqüência esperada.
Portanto o valor do desvio é elevado ao quadrado e dividido pela freqüência es-
perada.
Em muitos casos utiliza-se este teste em experimentos probabilísticos, por e-
xemplo, lançamentos de moedas ou proporção de doentes após uma epidemia. No pri-
meiro caso a probabilidade de lançarmos 10 vezes uma moeda e cair cara é de 50%
(freqüência esperada) e o valor real após os lançamentos será a freqüência observada.
No segundo caso a freqüência esperada deverá ser corrigida (calculada) através da Ta-
bela de Contingência.
Neste caso temos uma tabela de contingência de 2 x 3, pois temos duas situações
as serem testadas (com ou sem diabete) em três grupos (faixas etárias).
O Grau de liberdades para tabelas de contingências será calculado pela seguinte
fórmula: GL = (n s − 1) × (n g − 1) . No nosso exemplo teremos:
GL = (2 − 1) × (3 − 1) ∴ GL = 1 × 2 ∴ GL = 2
Para calcular as freqüências realiza-se uma regra de três simples como segue:
34 –––––––––––––––– 223
fe –––––––––––––––– 77
34 × 77
Ou seja, fe A = a fe da terceira coluna (sem diabete) é calculada pela diferença
223
entre os valores da fe da 2ª coluna (com diabete) e o valor da coluna total (Σ). Os de-
mais valores da linha subseqüentes são obtidos com a realização da regra de três para
cada valor da 2ª coluna.
Para calcular o χ² do conjunto de dados utilizaremos a fórmula vista anterior-
mente. Assim teremos:
χ2 =
(2 − 11,74)2 + (75 − 65,26 )2 + (12 − 11,28)2 + (62 − 62,72)2 + (20 − 10,98)2 +
11,74 65,26 11,28 62,71 10,98
(52 − 61,02)2 ∴ χ 2 = 94,87 + 94,87 + 0,5184 + 0,5184 + 81,36 + 81,36 ∴
61,02 11,74 65,26 11,28 62,72 10,98 61,02
χ 2 = 8,09 + 1,45 + 0,05 + 0,01 + 7,41 + 1,33∴ χ 2 = 18,34
Como já foi dito este teste segue a distribuição do teste χ². Desta forma, sendo k
= 3 (métodos), os graus de liberdade correspondem a 2, pois GL= k-1. Portanto, os valo-
res da tabela χ², correspondem a 5 e 1%, são 5,99 e 9,21, respectivamente.
Apostila de Estatística Aplicada 31
χ 2r =
12
5 × 4(4 + 1)
( )
× 112 + 14 2 + 20 2 + 5 2 − 3 × 5 × 5∴
Como valor de graus de liberdade é igual a k-1 graus de liberdade e sendo k=4
(tratamentos), têm-se 3 graus de liberdade. A partir da tabela χ² (Tabela 12, p. 45). Os
valores para 5 e 1% de probabilidade são 7,82 e 11,32, respectivamente.
Sendo o valor de χ²r calculado maior que os valores da tabela de χ², rejeita-se a
hipótese nula (H0) e aceita a hipótese alternativa (H1). Ou seja, a profundidade de 21-30
cm tem uma maior concentração do poluente que as demais profundidades avaliadas,
nas áreas onde foram coletadas amostras.
8 Correlação Linear
A correlação linear é utilizada para verificar, num determinado conjunto, a de-
pendência entre duas séries de variáveis.
Trata-se de um valor abstrato que dá uma idéia sobre a dependência entre os
dados apresentados.
A correlação pode ser denominada positiva ou negativa. Quando positiva há a
variação positiva da variável dependente (Y), quando há variação positiva da variável
independente (X) vice-versa. Quando negativa há a variação negativa de Y, quando há
variação positiva de X e vice-versa.
Exemplo:
Tabela 5. Correlação de Spearman entre as notas brutas de matemática e biologia (Zar,
1999).
Notas de Rank de Notas de Rank de
Estudante di di 2
Matemática Xi Biologia Yi
1 57 3 83 7 –4 16
2 45 1 37 1 0 0
3 72 7 41 2 5 25
4 78 8 84 8 0 0
5 53 2 56 3 –1 1
6 63 5 85 9 –4 16
7 86 9 77 6 3 9
8 98 10 87 10 0 0
9 59 4 70 5 –1 1
10 71 6 59 4 2 4
Total 72
n= 10; Σdi2=72
6 (72 ) 432 432
rs = 1 − ∴1 − ∴1 − ∴1 − 0,4364 ∴ 0,5636
10 − 10
3
1000 − 10 990
Para verificar se há significância na correlação
Figura 8. Correlação linear simples positiva (A); e inversa ou negativa (B), apresentan-
do a linha de tendência de regressão linear simples de dados fictícios.
A utilização de um ou outro coeficiente dependerá da normalidade dos dados
(veja o tópico Teste de Normalidade dos Dados, p.22).
William Costa Rodrigues 34
A significância das tabelas acima poderá ser utilizada tanto na correlação de Pe-
arson, quanto na de Spearmann.
Apostila de Estatística Aplicada 35
Figura 9. Janela
de configuração
da linha de ten-
dência (linha de
regressão) e
configuração da
equação de re-
gressão no Mi-
crosoft Excel.
70
Figura 11. Correlação múltipla da amplitude térmica (variável x), brotação (variável y)
e a flutuação populacional de Toxoptera citricida (variável z), em cultivo orgânico de
tangerina cv. Poncã, na Fazendinha Agroecológica, no período de outubro de 2002 a
outubro de 2003 (Adaptado de Rodrigues, 2004).
10 Transformação de Dados
Para uma aplicação válida dos testes de significância, baseados nas propriedades
das curva normal, é necessário que o dados tenham uma distribuição normal (Figura 4,
Figura 5 e Figura 6). As porcentagens, as contagens e as notas dadas a certas caracterís-
ticas qualitativas, exigem quase sempre essa transformação.
Vamos apresentar nesta apostila algumas das principais transformações de dados
empregadas na normalização dos dados e as situações que cada uma se aplica.
William Costa Rodrigues 38
11.2 Exemplo
O exemplo hipotético abaixo da diversidade de cochonilhas em agroecossistema
cítrico ilustra os índices de diversidade das cochonilhas de um pomar de citros.
William Costa Rodrigues 40
% S = ∑ (% a + % b + % c + ... + % n )
Onde: % a = menor porcentagem da espécie a observada no confronto das comunida-
des; % b = idem, para espécies b; % c = idem, para espécies c e % n = idem, para espé-
cies n.
Tabela 10. Duas comunidades com sua composição de espécies em percentagem
Espécies
Comunidade
a b c d
A 15 35 27 23
B 33 14 36 17
11.3.4 Constância
Este parâmetro indica a percentagem de uma determinada espécie em relação a
todos os levantamentos realizados.
É dado pela fórmula:
n × 100
C=
N
Onde: n = Número de coletas contendo a espécies em estudo e N = Número total de
coletas realizadas.
A Constância de uma espécie poderá ser classificada da seguinte forma:
a) Espécies constantes – presentes em mais de 50% dos levantamentos;
b) Espécies acessórias – presentes entre 25–50% dos levantamentos;
c) Espécies Acidentais – Presentes em menos de 25% dos levantamentos.
12 Bibliografia
13 Anexos
Figura 13. Fluxograma Para Auxiliar na Escolha de Testes Estatísticos
2 Tratamentos
2 Tratamentos > 2 Tratamentos
Dados Numéricos
divididos em
Categorias Não dividido em
blocos
ANOVA Dividido em Bloco
(Amostras
Teste T Teste F compostas)
Teste 2
(Qui-Quadrado)
Teste de Kruskal-
Teste de Friedman
Wallis
S2Maior S2Maior
S2Menor < 4 S2Menor 4
Compara com
valor 2 Tabelado
( = 5%)
Calcula Variância
Ponderada
Rejeita H0 Aceita H0
Coloca * Coloca ns
Calcula Valor T
Compara com T
tabelado ( =1%)
Se Tcalc < Ttab
Aceita H0 Se 2calc 2tab
Se 2calc < 2tab
Conclui
textualmente
William Costa Rodrigues 44
3
A tabela completa poderá ser encontrada em Gomes (1990) e Levine et al. (1998).
Apostila de Estatística Aplicada 45
4
A tabela completa poderá ser encontrada em Gomes (1990) e Levine et al. (1998).
William Costa Rodrigues 46
5
A tabela completa poderá ser consultada em Zar (1999).
Apostila de Estatística Aplicada 47
6
A tabela completa poderá ser consultada em Zar (1999).
William Costa Rodrigues 48
*************
O minuto que você está vivendo agora é o mais importante de sua vida, onde quer que
você esteja.
Preste atenção ao que está fazendo.
O ontem já lhe fugiu das mãos.
O amanhã ainda não chegou.
Viva o momento presente, porque dele depende todo o seu futuro.
Procure aproveitar ao máximo o momento que está vivendo, tirando todas as vantagens
que puder, para seu aperfeiçoamento.
C. Torres Pastorinho
Minutos da Sabedoria, p. 154
*************