Sunteți pe pagina 1din 18

13/02/2018

Estatística Experimental
Análise de Variância - ANAVA

Prof. Nagib Yassin

ANÁLISE DE VARIÂNCIA

A análise de variância introduzida por R.A.Fisher é essencialmente um


processo aritmético para decompor a variação total entre as unidades
experimentais (variância total ou soma de quadrados de desvios totais ou
soma dos quadrados total), em componentes associados a fontes ou causas
previstas ou identificáveis de variação. Mais especificamente a variação
total é decomposta em 3 grupos de causas ou fontes de variação:
(a) Variação relacionada com os tratamentos.
(b) Variação relacionada com causas controladas pelo delineamento
experimental.
(c) Variação relacionada com o erro experimental.

ANÁLISE DE VARIÂNCIA

 A análise de variância constitui-se na técnica


estatística geralmente empregada na análise de
dados experimentais quantitativos, nas diversas
áreas de pesquisa, aplicando-se inclusive, nos casos
em que se comparam dois ou mais tratamentos

1
13/02/2018

ANÁLISE DE VARIÂNCIA

Suposições para o teste:


-As amostras devem ser independentes entre si.
-As populações devem ter a mesma variância.
-As populações devem ter distribuição normal.

Hipóteses:
H0: Todas as médias populacionais são iguais.
H1: Pelo menos uma das médias é diferente.

ANÁLISE DE VARIÂNCIA
A estatística usada para teste é

𝑽𝒂𝒓𝒊â𝒏𝒄𝒊𝒂 entre amostras


𝑭=
𝑽𝒂𝒓𝒊â𝒏𝒄𝒊𝒂 dentro de amostras

Conclusão do teste:
a)Se o valor de F (observado) for menor que o valor crítico
(FCRÍT), não podemos rejeitar a hipótese H0.

b) Caso contrário, se F for maior que o valor crítico (FCRÍT),


rejeitamos H0.

ANÁLISE DE VARIÂNCIA
Análise de Variância para Classificações Simples (Classificações
com um Único Fator) ou Análise de Variância para o Delineamento
Inteiramente Casualizado - DIC

Quando as unidades experimentais são homogêneas, não existe


um fundamento lógico para formação de blocos. No delineamento
completamente casualizado cada unidade experimental recebe por
sorteio um dos tratamentos que deverão ser comparados. Nesse
caso nenhuma restrição é imposta quanto a casualização, ou seja
a atribuição dos tratamentos às unidades experimentais é feita
considerando o conjunto completo das unidades experimentais.

2
13/02/2018

Decomposição da soma de quadrados total

Soma de quadrados total: Graus de liberdade:


gl = N - 1
k
y2
n
SQTot   yij2  .. onde: N = i.j
i 1 j 1 N
Soma de quadrados dos
tratamentos: Graus de liberdade:

k
yi2. y2
SQTRAT    .. gl = j - 1
i 1 ni N
Soma de quadrados do erro: Graus de liberdade:

SQERRO = SQTotal - SQTRAT gl = i(j-1)

Graus de Liberdade, Quadrados Médios e Cálculo de F

SQTOTAL = SQTrat + SQERRO


Graus de liberdade: Quadrados médios:

SQTotal tem ij -1 graus de liberdade; QMTRAT 


SQ TRAT
j 1
SQTratamentos tem j-1 g.l.
SQERRO
QMERRO 
SQerro tem j(n-1) g.l. j(n  1)

Estatística de Teste:

QM TRAT
F
QM ERRO

Tabela de Análise de Variância – (ANAVA)

Soma de
Fonte de Variação G.L Quadrados Médios F
Quadrados

k
yi2. y..2 QM TRAT
SQTRAT   F
SQTRAT
Tratamentos  i-1 QM TRAT 
ni N k 1 QM ERRO
i 1

SQERRO
Erro SQERRO = SQTotal - SQTRAT i(j-1) QM ERRO 
k (n  1)

k n
y..2
Total SQTotal   yij2  ij -1
i 1 j 1 N

3
13/02/2018

Tabela de Análise de Variância – (ANAVA)

FV – Fontes de Variação - Nesta coluna são descritas as causas de variabilidade dos


dados do experimento. O interesse do pesquisador está em conhecer a variabilidade
entre os TRATAMENTOS. As outras fontes de variabilidade são agrupadas em
RESÍDUO (correspondente à variabilidade existente Dentro dos Tratamentos).

GL – Graus de Liberdade - A cada fonte de variação está associado um número de


graus de liberdade.
SQ – Somas de Quadrados - São as somas dos quadrados de desvios calculadas para
cada fonte de variação.
QM – Quadrados Médios - São obtidos pela razão entre as Somas de Quadrados e os
seus respectivos graus de liberdade. Pode-se demonstrar que são estimativas de
variâncias.

FC – valor da estatística F - É o valor obtido para a estatística do teste de F,


dado pela razão entre os QM de Tratamentos e o QM do Resíduo.

Exemplo
Uma amostra aleatória de alunos foi obtida em cada
fileira
As notas daqueles alunos em um segundo exame foram
registradas
Frente: 82, 83, 97, 93, 55, 67, 53
Meio: 83, 78, 68, 61, 77, 54, 69, 51, 63
Fundo: 38, 59, 55, 66, 45, 52, 52, 61

OBS: Dados desbalanceados – quando existem quantidades diferentes de


parcelas por tratamentos,
Dados balanceados – quando cada tratamento apresenta o mesmo
número de parcelas

Exemplo

As estatísticas resumo para as notas de cada fileira são


mostradas na tabela abaixo

Frente Meio Fundo


n 7 9 8
média 75,71 67,11 53,50
desvio
17,63 10,95 8,96
padrão
Variância 310,90 119,86 80,29

4
13/02/2018

Exemplo
• Aqui está a tabela básica da ANAVA 1 fator

Fonte SQ GL QM F p

Entre

Dentro

Total

Exemplo
• Após preencher as somas de quadrados, temos …

Fonte de
GL SQ QM F p
Variação

Entre 2

Dentro 21

Total 23

Exemplo
• Completando os QM (variâncias) temos …

Fonte de
GL SQ QM F p
Variação

Entre 2 1902 951,0

Dentro 21 3386 161,2

Total 23 5288 229,9

5
13/02/2018

Exemplo

Estatistica do teste F
Um teste de estatística F é a razão de duas variâncias amostrais

a QM(E) e QM(D) são duas variâncias amostrais e nós dividimos


para obter F.

F = QM(E) / QM(D)

Para nossos dados, F = 951,0 / 161,2 = 5.9

Exemplo

• Adicionando F para a Tabela …

Efeito GL SQ QM F p

Entre 2 1902 951,0 5,9

Dentro 21 3386 161,2

Total 23 5288 229,9

Exercícios
Para os exercícios a seguir, admitindo-se o modelo tipo I (fixo)
realize a análise de variância e apresente as conclusões mais
relevantes.

1. Suponhamos que um pesquisador conduziu um experimento


inteiramente ao acaso em um conjunto de dados que se pressupõe
que sejam normalmente distribuídos e que possuem
homocedasticidade. O interesse do pesquisador é avaliar se
existe uma diferença significativa entre os tratamentos T1, T2 e
T3. Como você ajudaria este pesquisador por meio da ANOVA
utilizando um nível de significância de 5%?

6
13/02/2018

Exercícios

T1 T2 T3 T4
1 8,4 11,1 9,2 10,6
2 7,8 9,6 8,1 10,6
3 8,5 8,1 9,2 8,9
4 8,8 9,6 9,2 6,1
5 11,3 8,5 9,5 6,7
6 8,9 8 10,4 7,7
7 10 8,5 10,2 8,4
8 8,2 8,1 7,1 9,7
9 9,2 9,9 6,8 7,6
10 7,5 10,1 9,6 7,4
Total 88,6 91,5 89,3 83,7 353,1

Exercícios
2. Em um experimento em que se mediu o peso corporal (kg), 20 porcos foram distribuídos
aleatoriamente a 5 grupos. Cada grupo foi alimentado com dietas diferentes. Deseja-se
testar se os pesos dos porcos são os mesmos para as 4 dietas

Desejamos testar a hipótese nula


H 0 : μ1 = μ2 = μ3 = μ4
H1 : μi ≠ μj para pelo menos um par i ≠ j
As observações obtidas foram:
Tratamentos Repetições Total
1 2 3 4 5
Dieta 1 60,8 57,7 65,0 58,6 61,7 303,8
Dieta 2 102,6 67,7 74,0 66,3 69,8 380,4
Dieta 3 68,7 120,1 100,2 96,5 70,9 456,4
Dieta 4 84,2 87,9 83,1 85,7 90,3 431,2
1571,8

Exercícios

3. Três grupos de ratos foram treinados para realizar exercício físico


anaeróbio através de uma prancha inclinada com um trilho, sobre o qual
corria um carrinho com pesos diferentes que o animal empurrava. Após
vários meses de treinamento, um dos grupos foi submetido à exaustão de
motores a gasolina pelo mesmo tempo, e um terceiro grupo foi mantido como
controle,
sem as atmosferas poluídas. A tabela abaixo mostra o resultado do
desempenho físico dos três grupos.
Sabendo-se que esta variável (desempenho físico) distribui-se normalmente,
determine se há diferença entre os grupos.

7
13/02/2018

Exercícios
Rato Controle Álcool Gasolina
1 2,4 2,3 2,5
2 3,1 2,5 3,1
3 1,9 1,8 1,9
4 3,0 2,4 3,0
5 3,0 2,6 3,0
6 2,2 2,9 2,2
7 2,2 2,0 2,2
8 2,3 2,7 2,2
9 2,5 2,8 2,5
10 2,5 2,2 2,5
11 1,9 2,1 2,2
12 2,8 2,5 2,9

DELINEMENTO INTEIRAMENTE
CASUALIZADO - DIC

Prof. Nagib Yassin

DELINEMENTO INTEIRAMENTE CASUALIZADO - DIC

Introdução
O delineamento inteiramente casualizado - DIC
é o mais simples de todos os delineamentos
experimentais, e os experimentos instalados de
acordo com este delineamento são chamados de
experimentos inteiramente casualizados ou
experimentos inteiramente ao acaso.

8
13/02/2018

Principais características

a) Utiliza apenas os princípios da repetição e da


casualização (não utiliza o controle local);

b) Os tratamentos são distribuídos nas parcelas de


forma inteiramente casual, com números iguais ou
diferentes de repetições para os tratamentos.

c) Para a instalação desses experimentos no campo, devemos


ter certeza da homogeneidade das condições ambientais e do
material experimental.

DELINEMENTO INTEIRAMENTE CASUALIZADO - DIC

Este delineamento é bastante utilizado em ensaios de


laboratório, ensaios em viveiros de plantas e em ensaios com
vasos, realizados em casas de vegetação (estufas), em que as
condições experimentais podem ser perfeitamente
controladas. Nos ensaios com vasos, estes devem ser
constantemente mudados de posição, de forma casual, para
evitar influências externas sempre sobre os mesmos vasos.

Vantagens do DIC

a) É um delineamento bastante flexível, pois o número de tratamentos e de


repetições depende apenas do número de parcelas disponíveis;

b) O número de repetições pode variar de um tratamento para outro, embora o


ideal seja utilizar o mesmo número de repetições para todos os tratamentos;

c) A análise estatística é simples, mesmo quando o número de repetições por


tratamento é variável;

d) O número de graus de liberdade para estimar o erro experimental (que é dado


pelo desvio padrão residual) é o maior possível.

9
13/02/2018

Desvantagens do DIC

a) Exige a homogeneidade de todas as parcelas experimentais;

b) Pode nos conduzir a uma estimativa bastante alta para a


variância residual, pois, não utilizando o controle local, todas as
variações entre as unidades experimentais (exceto as devidas aos
tratamentos) são consideradas como variação do acaso.

casualização dos tratamento


A casualização dos tratamentos nas parcelas experimentais é a principal
característica deste delineamento. Por exemplo, num experimento
inteiramente casualizado, com 5 tratamentos (A, B, C, D e E) e 4
repetições por tratamento, a casualização dos tratamentos é feita
sorteando-se para cada uma das 20 parcelas do experimento, uma
combinação de tratamento com sua respectiva repetição, ou seja:
A1 B1 C1 D1 E1
A2 B2 C2 D2 E2
A3 B3 C3 D3 E3
A4 B4 C4 D4 E4

Assim, a distribuição dos tratamentos nas 20 parcelas do experimento, numeradas


de 1 a 20, poderia ser a seguinte:

casualização dos tratamento


1 2 3 4 5

B4 D1 E2 B3 D4
6 7 8 9 10

C1 A2 C4 D3 A1
11 12 13 14 15

E1 E3 B2 A4 C2
16 17 18 19 20

A3 D2 E4 C3 B1

10
13/02/2018

Quadro de tabulação dos dados

A título de exemplo, considere um experimento instalado no DIC com I


tratamentos e J repetições. A coleta de dados da pesquisa pode ser
resumida, num quadro do tipo a seguir:

Repetições Tratamentos
1 2 ... I
1 Y11 Y12 ... Y1I
2 Y21 Y22 ... Y2I
... ... ... ... ...
J YJ1 YJ2 ... YJI
Total T1 T2 ... TI
Deste quadro pode-se retirar algumas informações de
interesse:

no de unidades experimentais: n = i x j

I.J I

Total geral: G= 
I=1.J=1
YIJ = TI =Y..
I=1

Total para o tratamento i: TI  YI J  YI.


J 1

Média para o tratamento i: TI


ˆI 
m
J
G
Média geral do experimento: m
ˆ
IJ

no de unidades experimentais: N = i x j

Total geral:
I.J I
G= 
I=1.J=1
YIJ = TI =Y..
I=1

Total para o tratamento i: j


Ti  Yij  Yi .
j 1

Média para o tratamento i: TI


ˆI 
m
j
Média geral do experimento:
G
ˆ
m
ij

11
13/02/2018

Modelo matemático
Existe um modelo matemático específico para cada tipo de delineamento. O
modelo estatístico identifica quais são as fontes de variação dos valores de
uma variável resposta em estudo.
Para os dados oriundos de um experimento instalado segundo o DIC, o
seguinte modelo estatístico deve ser utilizado nas análises estatísticas:

Yij = m + ti +eij
em que,
Yij: é o valor observado para a variável resposta obtido para o i-ésimo tratamento
em sua j-ésima repetição;
m: média de todos os valores possíveis da variável resposta;
tI: é o efeito do tratamento i no valor observado Y ;
eIJ: é o erro experimental associado ao valor observado Y ;

Erro experimental

 O erro experimental ocorre em todos os


experimentos, porque não é possível controlar o efeito
de fontes de variações que ocorrem de forma
aleatória e desconhecida. Este erro é o responsável
pela variação observada entre as observações obtidas
nas repetições para cada tratamento.

Análise de Variância
 É uma técnica de análise estatística que permite decompor a
variação total, ou seja, a variação existente entre todas as
observações, na variação devido à diferença entre os efeitos
dos tratamentos e na variação devido ao acaso, que também é
denominada de erro experimental ou resíduo

No entanto, para que esta técnica seja empregada é


necessário que sejam satisfeitas as seguintes
pressuposições:

12
13/02/2018

Análise de Variância

 1a) os efeitos do modelo estatístico devem ser aditivos;


 2a) os erros experimentais devem ser normalmente
distribuídos, independentes, com média zero e com variância
comum.

Partindo do modelo estatístico, pode-se decompor a


variação entre os valores observados nas diferentes causas
de variabilidade, como demonstrado a seguir:

Tabela da Análise de Variância


FV – Fontes de Variação - Nesta coluna são descritas as causas de variabilidade dos
dados do experimento. O interesse do pesquisador está em conhecer a variabilidade
entre os TRATAMENTOS. As outras fontes de variabilidade são agrupadas em
RESÍDUO (correspondente à variabilidade existente Dentro dos Tratamentos).
GL – Graus de Liberdade - A cada fonte de variação está associado um número de
graus de liberdade.
SQ – Somas de Quadrados - São as somas dos quadrados de desvios calculadas para
cada fonte de variação.
QM – Quadrados Médios - São obtidos pela razão entre as Somas de Quadrados e os
seus respectivos graus de liberdade. Pode-se demonstrar que são estimativas de
variâncias.
FC – valor da estatística F - É o valor obtido para a estatística do teste de F, dado pela
razão entre os QM de Tratamentos e o QM do Resíduo.

 Y 
2

Variação Total  SQTOTAL  YIJ2 


IJ

I .J

 Y 
2

Variação Entre  SQTRATAMENTOS 


1
J
 T   I .J
I
2 IJ

Variação Dentro  SQERRO  SQRESÍDUO  SQTOTAL  SQTRATAMENTOS

13
13/02/2018

É o número de determinações independentes (dimensão


da amostra) menos o número de parâmetros estatísticos a
serem avaliados na população
É um estimador do número de categorias independentes num
teste particular ou experiência estatística. Encontram-se
mediante a fórmula n-1, onde n é o número de elementos na
amostra (também podem ser representados por k-1 onde k é o
número de grupos, quando se realizam operações com grupos e
não com sujeitos individuais).

SQTRATAMENTOS
QMTRATAMENTOS 
GLTRATAMENTOS
SQRESÍDUO
QMRESÍDUO 
GLRESÍDUO

QMTRATAMENTOS
FTRATAMENTOS 
QMRESÍDUO

14
13/02/2018

Causas de variação G. L. S. Q. Q. M. Fc

Entre tratamentos i - 1 SQT QMT QMT


QME
Dentre tratamentos i (j - 1) SQE QME
Total ijr - 1 SQTO -

FV GL SQ QM F
TRATAMENTOS (I-1) SQTRAT QMTRAT QMTRAT/QMRES.
RESÍDUO I(J-1) SQRES. QMRES
TOTAL IJ-1 SQTOTAL

coeficiente de variação
Coeficiente de Variação
O coeficiente de variação é calculado da seguinte maneira:

QMRESÍDUO
CV  .100
m

15
13/02/2018

Coeficiente de Variação

O CV é utilizado para avaliação da precisão de


experimentos. Quanto menor o CV mais preciso
tende a ser o experimento. A título de classificação
geral pode-se utilizar a seguinte tabela

C.V. Avaliação Precisão


< 10% Baixo Alta
10 a 20% Médio Média
20 a 30% Alto Baixa
> 30% Muito alto Muito baixa

Exemplo

Os seguintes dados referem-se a ganhos de peso, em kg, de animais durante um


período experimental

Repetição Total
Ração 1 2 3 4 10,0
A 7,1 8,9 6,0 7,0 29,0
B 6,2 8,8 4,9 6,1 26,0
C 6,0 5,0 9,1 3,9 24,0
D 11,1 10,8 10,2 11,9 44,0
E 7,0 11,3 10,0 11,7 40,0

Tais dados são descritos segundo o modelo estatístico: Yij = m + ti + eij.


Baseando nas informações fornecidas, pede-se:

Exemplo

1. Quais foram os Princípios Básicos da Experimentação utilizados pelo


pesquisador neste experimento?
2. Qual foi a unidade experimental nesta pesquisa?
3. Proceda a análise de variância dos dados (use  = 1%)
4. De acordo com o resultado do teste F, pode-se concluir que existe
efeito significativo de rações com relação ao ganho de peso médio
proporcionado pelas mesmas?
5. Calcule o coeficiente de variação e interprete-o

16
13/02/2018

Análise de Variância

Causas de Variação GL SQ QM F
Rações
4 78,8 19,7 6,942**
(entre variedades)
Erro Experimental
15 42,57 2,838
(dentro de variedades)
Total 19 121,37

CV   
QME y.. x100   
42,57 8,7 x100  20,67%

5%  2,90 **SIGNIFICATIVO A 1%


F 4 X 19  
1%  4,50

Análise de Variância

CONCLUSÃO

Rejeitamos H0, e concluímos que pelo menos duas


das rações diferiram estatisticamente entre si

Exercícios
1. Um experimento para avaliar o efeito da ração (Ração 1 a 5)
no ganho de peso animal, utilizou-se um DIC com 5
tratamentos e 4 repetições. Os resultados foram:
Repetições
Ração 1 2 3 4
1 3,31 6,1 8,53 3,84
2 23,62 26,94 20,16 22,18
3 14,75 25,2 17,56 24,8
4 30,58 30,69 18,54 27,56
5 50,25 45,12 37,25 52,15

Fazer a análise de variância e concluir

17
13/02/2018

Exercícios
2. Considere um conjunto homogêneo de 20 animais e quatro dietas para a comparação
das alterações de pesos, cujos 5 animais de cada dieta foram escolhidos por processo
randômico (sorteio). As dietas estudadas foram:
A: dieta padrão;
B: dieta padrão suplementada com amendoim;
C: dieta padrão suplementada com girassol;
D: dieta padrão suplementada com abóbora.
Repetições
Repetições Dieta A Dieta B Dieta C Dieta D
1 25 31 22 33
Ganhos de peso segundo dieta 2 26 26 26 29
3 20 28 28 31
4 23 27 25 34
5 21 24 29 28
Totais 115 (2,55) (*) 136 (2,74) 130 (2,74) 155 (2,55)

(*) média (desvio padrão)

18

S-ar putea să vă placă și