Documente Academic
Documente Profesional
Documente Cultură
Experimentação Agronômica
ESALQ/USP – Piracicaba, SP
Maio/2002
PREFÁCIO
Estas notas são baseadas em vários livros textos citados, duas versões anteriores e têm
como objetivo apresentar noções introdutórias de Modelos Lineares Generalizados e algumas
aplicações na área de Estatística Aplicada à Experimentação Agronômica.
Enumerar as pessoas a quem devemos agradecimentos é uma tarefa difícil, pois são
muitos aqueles que contribuíram de forma direta ou indireta para a elaboração deste material.
Agradecemos a todos e, em especial aos professores: Silvano Cesar da Costa (UEL) e Suely Ruiz
Giolo (UFPr) que foram incansáveis e amigos, ajudando-nos através de leitura cuidadosa,
sugestões, correção e formatação do texto, elaboração dos programas em SAS e discussões muito
proveitosas. Sem o auxílio deles não teríamos terminado de escrever estas notas em tempo hábil.
Finalmente, assumimos total responsabilidade pelas imperfeições e solicitamos aos
leitores que nos apresentem críticas e sugestões para uma futura edição revisada.
1.1 Introdução
Muitas das distribuições conhecidas podem ser reunidas na chamada família
exponencial univariada. Assim, por exemplo, pertencem a essa família as distribuições
normal, binomial, binomial negativa, gama, Poisson e normal inversa. Essa classe de famílias
de distribuições foi proposta independentemente por Koopman, Pitman e Darmois através do
estudo de propriedades de suficiência estatística. Posteriormente, muitos outros aspectos dessa
família foram descobertos e tornaram-se importantes na teoria moderna de Estatística. O
conceito de família exponencial foi introduzido na Estatística por Fisher (Jφrgensen &
Labouriau, 1992).
1.2 Definição
Seja X uma variável aleatória (v.a.) cuja f.d.p. (função de probabilidade se X é discreta
ou função densidade de probabilidade se X é contínua) depende de um único parâmetro τ .
Seja a família ℑ = { f ( x;τ ), τ ∈ Ω ⊆ ℜ} de f.d.p.'s. Diz-se que ela é a família
exponencial de distribuições com parâmetro τ se
f ( x;τ ) = h( x) t (τ ) e q ( x ) s (τ ) I A ( x) , (1.1)
sendo h(.), t(.), q(.) e s(.) funções conhecidas e I A (.) o indicador do conjunto A que não pode
depender de τ . Outra forma com que se apresenta essa família é
e, tomando-se d (τ ) = ln t (τ ) e g ( x ) = ln h( x ) , tem-se:
θ
s (τ ) = e q( X ) = Y ,
a(φ )
1
f ( y;θ ) = exp [ yθ + d1 (θ )] + g1 ( y; φ )
a (φ )
1
f ( y;θ , φ ) = exp [ yθ − b(θ )] + c( y; φ ) I A ( y ) (1.3)
a(φ )
Exemplo 1: Seja Y uma variável aleatória com distribuição normal de média µ desconhecida
e variância conhecida σ 2 > 0 , isto é, com f.d.p.,
1 ( y − µ)2
f ( y; µ , σ 2 ) = exp − , µ ∈ ℜ .
2πσ 2 2σ 2
( y - µ)2 1
f ( y; µ , σ 2 ) = exp - (
- ln 2πσ 2 )
2σ
2
2
1 - y 2 + 2 yµ - µ 2 1
= exp 2 - ln 2πσ
2
( )
σ 2 2
1 µ2 1 y2
= exp 2 yµ - - l n 2πσ 2
(- )
σ 2 2 2σ 2
θ =µ a (φ ) = σ 2
µ2 θ 2 1 y2
b(θ ) = = c( y; φ ) = - 2 + ln(2πσ 2 )
2 2 2 σ
Exemplo 2: Seja Y uma v.a. com distribuição binomial com f.d.p. dada por:
m
f ( y; π) = π y (1 - π ) ( m- y ) I A ( y ), π ∈ [0,1], A = {0,1, ..., m} .
y
Tem-se, então,
m
f ( y; π) = expln + y lnπ + (m-y ) ln (1 - π ) I A ( y )
y
π m
= exp y ln + m ln(1 - π ) + ln I A ( y ) ,
1- π y
obtendo-se
π eθ
a(φ ) = 1 θ = ln → π =
1- π 1 + eθ
m
b(θ) = -m ln(1 - π ) = m ln(1 + eθ ) c( y; φ ) = ln
y
1
M Y (t ;θ , φ ) = E[e tY ] = exp {b[a(φ )t + θ ] − b(θ )} . (1.5)
a(φ )
Prova: A prova será feita apenas para o caso de v.a. contínuas. Lembrando-se que:
∫ A
f ( y ) dy = 1
então,
1
∫ exp [θy - b(θ )] + c( y; φ) dy = 1
a (φ)
A
ou ainda,
1 1
b(θ ) ∫A
exp
a(φ )
θy + c(y;φ ) dy = 1 ,
exp
a(φ )
obtendo-se
1 b(θ )
∫A
exp
a(φ )
θy + c(y;φ ) dy = exp
a(φ )
.
(1.6)
Logo,
M Y (t; θ , φ ) = E[ e tY ] = ∫A
e ty f ( y ) dy
1
= ∫ A exp [(a(φ)t + θ ) y - b(θ )] + c( y; φ)dy
a (φ)
1 1
= ∫ exp [a (φ)t + θ ] y + c( y; φ)dy
b(θ ) a(φ)
A
exp
a (φ)
1 b[a (φ)t + θ ]
M Y (t ; θ, φ) = exp
b(θ ) a ( φ)
exp
a ( φ)
ou ainda,
Modelos Lineares Generalizados na Experimentação Agronômica 5
1
M Y (t ; θ, φ) = exp [b(a (φ)t + θ ) - b(θ )] .
a (φ)
1
ϕ (t ;θ , φ ) = ln M(t ;θ , φ ) = {b[a(φ )t + θ ] - b(θ )}. (1.7)
a(φ )
1
ϕ′(t ; θ , φ) = b′[a (φ)t + θ ] a (φ) = b ′[a (φ)t + θ ]
a ( φ)
...
ϕ ( r ) (t ; θ , φ) = b ( r ) [a (φ)t + θ ] [a (φ)]
r-1
κ 1 = b′(θ )
κ 2 = a (φ ) b ′′(θ )
...
κ r = [a(φ )]r-1 b ( r ) (θ ) .
κ 1 = µ1′ = µ
κ 2 = µ 2′ − ( µ1′ ) 2
κ 3 = µ 3′ − 3µ 2′ µ1′ + 2( µ1′ ) 3
κ 4 = µ 4′ + 4µ 3′ µ1′ − 3( µ 2′ ) 2 + 12 µ 2′ ( µ1′ ) 2 − 6( µ1′ ) 4 ,
sendo µ r′ = E(Y r ) .
6 Clarice G. B. Demétrio
κ 2 = µ2 = σ 2
κ 3 = µ3
κ 4 = µ 4 − 3( µ 2 ) 2 ,
{
sendo µ r = E [Y - E(Y )] .
r
}
Portanto, a média e a variância de uma v.a. Y cuja distribuição pertence à família
exponencial, na forma canônica usada por McCullagh & Nelder (1989), são dadas por
µ = E(Y ) = b′(θ )
IMPORTANTE! (1.8)
σ 2 = Var(Y ) = a (φ ) b ′′(θ )
em que a(φ ) , em geral, pode ser escrita na forma a (φ ) = φ / w , sendo φ chamado parâmetro
de dispersão e w, peso a priori. Além disso, b ′′(θ ) = dµ /dθ é uma função de µ e é
representada por V (µ ) . Logo, a variância de Y pode ser escrita como
dl
E(U ) = E = 0
dθ
e
d 2l
Var(U ) = E(U 2 ) = E(-U ′) = E − 2 ,
dθ
1
l= [ yθ − b(θ )] + c( y;φ )
a (φ )
tem-se
dl 1
U= = [ y - b ′(θ )]
dθ a (φ )
e
Modelos Lineares Generalizados na Experimentação Agronômica 7
d 2l -1
U′ = = b ′′(θ ) .
dθ 2
a(φ )
Logo,
1
E(U ) = [E(Y ) - b ′(θ )] = 0 → E(Y ) = b ′(θ )
a (φ )
e
1
Var(U ) = -E(U ′) = b ′′(θ )
a (φ )
→ Var(Y ) = a (φ ) b′′(θ ).
1
Var(U ) = E(U ) =
2
Var(Y )
[a(φ )]2
1 (σ 2 t + θ ) 2 θ 2 1
ϕ (t ) = 2
− = (σ 4 t 2 + 2σ 2 tθ + θ 2 − θ 2 )
σ 2 2 2σ 2
1 σ 2t 2
= (σ 2 t 2 + 2tθ ) = tµ + ,
2 2
σ 2t 2
M(t ) = exp tµ + ,
2
E(Y ) = b′(θ ) = θ = µ e
π eθ
a (φ ) = 1 , θ = ln →π = e b(θ ) = -mln(1 - π ) = mln(1 + eθ ) .
1- π 1+e θ
[
ϕ (t ) = b(t + θ ) − b(θ ) = m ln(1 + e t+θ ) - ln(1 + eθ ) ]
m
1 + e t+θ
= ln θ
(
= ln 1 - π + πe t )
m
[
= ln 1 - π + πe t ],
m
1+ e
[
M(t ) = e ϕ ( t ) = 1 − π + πe t ]m
,
eθ
E(Y ) = µ = b ′(θ ) = m = mπ ,
1 + eθ
( 1+e θ )e θ - e θ e θ eθ 1
Var(Y ) = a (φ) b′′(θ) = m =m = mπ (1 − π ) = µ( m - µ )
(1+e )
θ 2
(1 + e )θ 2
m
e
1
V ( µ ) = mπ (1 − π ) = µ (m − µ ).
m
Seja Y1 , Y2 , ..., Yn uma amostra aleatória (a.a.) de uma distribuição que pertence à
família exponencial. A f.d.p. conjunta de Y1 , Y2 , ..., Yn é dada por:
1
[ y i θ - b(θ )] + c( yi ; φ)
n n
f Y ( y; θ , φ) = ∏ f ( y i ; θ , φ) = ∏ exp
i=1 i=1 a (φ)
1
[ yi θ − b(θ )] exp{c( yi ; φ)}
n
= ∏ exp
i=1 a (φ)
1 n exp n c( y ;φ) .
= exp θ ∑ y − nb (θ ) ∑
a (φ) i=1
i i
i =1
Pelo teorema da fatoração de Neyman-Fisher (Silvey, 1975, pág. 27) tem-se que
∑ Yi é uma estatística suficiente para θ , pois
n
T= i =1
f Y ( y; θ , φ) = g (t , θ )h( y1 , y 2 , ... , y n ) ,
σ 2t 2
Normal: N(µ, σ2) MY(t; θ, φ) = exptµ +
2
MY(t; θ, φ) = (1 − π + πe t )
m
Binomial: B(m,π)
−k
µ t µ
Bin. Negativa: BinNeg(µ, k) MY(t; θ, φ) = 1 + (1 − e ) , t < −ln
k µ+k
−ν
tµ ν
Gama: G(µ, ν) MY(t; θ, φ) = 1 − , t <
ν µ
1
1
1 − 1 − 2tσ 2
2
1
Normal Inversa: IG(µ,σ ) 2 MY(t; θ, φ) = exp 2 , t <
σ µ µ 2
2σ 2 µ 2
1.5 Exercícios
1.5.1 Verifique se as distribuições que se seguem pertencem à família exponencial na forma
canônica dada em (1.3). Obtenha ϕ Y (t ) , M(t), E(Y), Var(Y) e V (µ ) .
a) Poisson: Y ~ P( µ )
µ y e -µ
f ( y; µ ) = I A ( y ), µ > 0; A = {0, 1, 2, ...}.
y!
Γ(k + y ) µ y k k
f ( y; µ , k ) = I A ( y ); A = {0, 1, ...}.
Γ(k ) y! ( µ + k ) k + y
ν
ν
µ ν −1 yν
I A ( y ), µ > 0; A = ℜ + .
f ( y ; µ ,ν ) = y exp −
Γ(ν ) µ
10 Clarice G. B. Demétrio
12
1 ( y - µ)2
f ( y; µ , σ ) =
2
2 3
exp− 2 2 A
I ( y ); A = ℜ + , µ > 0.
2πσ y 2µ σ y
x ν −1e − x
f ( x;ν ) = I (0,∞ ) ( x ) , ν > 0 .
Γ (ν )
X
Dado que E( X ) = ν , mostre que usando-se a transformação Y = µ , obtém-se a f.d.p. usada
ν
no item (c) do Exercício 1.5.1.
1.5.3 Seja Y uma v.a. com distribuição de Poisson truncada com parâmetro λ , isto é, com
f.d.p. dada por:
e -λ λy λy
f ( y; λ ) = = I {1, 2,K} ( y ), λ > 0 .
y!(1 - e -λ ) y!(e λ - 1)
Pede-se:
b) mostre que
λ λe λ
b.1) E(Y ) = µ = = ;
1-e -λ e λ -1
λ λ e -λ
b.2) Var(Y ) = 1 - -λ
= µ(1 + λ - µ) ;
1 - e -λ 1- e
exp{λe t } - 1
M Y (t ) = .
eλ- 1
1.5.4 De acordo com Smyth (1989), uma distribuição pertence à família exponencial se sua
f.d.p. puder ser colocada na forma
w
f ( y;θ , φ ) = exp [ yθ - b(θ )] + c( y; φ ) , (1.9)
φ
Modelos Lineares Generalizados na Experimentação Agronômica 11
sendo b(.) e c(.) funções conhecidas, e φ > 0 , constante, chamado parâmetro de dispersão,
conhecido e w, um peso a priori. Se a constante φ é desconhecida, então, a expressão (1.9)
define uma família exponencial com dois parâmetros apenas se
w 1 w
c( y, φ ) = - g ( y ) - s - + t ( y )
φ 2 φ
para g (.) , s (.) e t (.) conhecidas e nesse caso g ' (.) deve ser a inversa de b' (.) , tal que
θ = g ' ( µ ) . Mostre que isso ocorre para as distribuições normal, normal inversa e gama.
Γ(α )Γ( β )
sendo B (α , β ) = . Pede-se:
Γ(α + β )
a) mostre que, incondicionalmente, Y tem distribuição beta-binomial com f.d.p. dada por:
m B(α + y, m + β − y )
f ( y ) = ;
y B(α , β )
α 1
b) mostre que E(Y ) = m = mπ e Var(Y ) = mπ (1 − π )[1 + ρ (m − 1)] , sendo ρ = ;
α+β α + β +1
c) mostre que a distribuição beta-binomial não pertence à família exponencial canônica.
λr r-1 −λz
f ( z; r , λ ) = z e I(0,∞)(z)
Γ(r )
12 Clarice G. B. Demétrio
mostre que, incondicionalmente, Y tem distribuição binomial negativa, que não pertence à
r µ 1
família exponencial, com E(Y ) = = µ e Var(Y ) = µ + = φµ , sendo φ = 1 + .
λ λ λ
1.5.7 Uma forma geral para representar a f.d.p. da distribuição binomial negativa, segundo
Saha & Dong (1997) é dada por:
µc
Γ y +
υ
−y
µ c −1 −µ c
Pr(Y = y ) =
1 +
υ
(
1 + υµ 1−c ) υ y = 0, 1, 2, ... (1.10)
µ
c
Γ y!
υ
Pede-se:
a) mostre que E(Y ) = µ e Var (Y ) = µ + υµ 2−c . Obtenha E(Y ) e Var (Y ) , para os casos
mais comuns da distribuição binomial negativa, isto é, para c = 0 e c = 1 ;
ω + (1 − ω ) exp{−λ} y=0
Pr(Y = y ) =
(1 − ω ) exp{−λ}λ / y! y = 1, 2,K.
y
ω 2
Mostre que E(Y ) = (1 − ω )λ = µ e Var (Y ) = µ + µ .
1− ω
1.5.9 Uma distribuição alternativa para explicar o excesso de zeros em dados de contagem é a
distribuição binomial negativa inflacionada de zeros, com f.d.p. dada por:
1− c
λ
−
ω + (1 − ω )(1 + αλ ) α c
y=0
λ1−c
Pr(Y = y ) = Γ y +
α λ1− c −y
−
α
λ1−c
(1 − ω ) (1 + αλ c
) 1 + α y = 1,2,3, L
λ1− c
y! Γ
α
(
Mostre que E(Y ) = (1 − ω)λ e var(Y ) = (1 − ω )λ 1 + ωλ + αλc . )
Modelos Lineares Generalizados na Experimentação Agronômica 13
Normal θ2 1 y2 2
σ 2
µ − 2 + ln (2πσ ) θ 1
N(µ, σ2) 2 2 σ
Poisson
1 ln µ eθ − ln y! eθ µ
P(µ)
Binomial π m eθ 1
1 ln m ln (1 + e θ ) ln m µ( m − µ)
B(m,π) 1 − π y 1 + eθ m
Bin. Negativa µ Γ( k + y ) eθ µ
1 ln − k ln (1 − e θ ) ln k µ +1
BinNeg(µ, k) µ + k Γ(k ) y! 1 − eθ k
Gama 1 1
ν-1 − −ln (−θ ) ν ln ( ν y ) − ln y − ln Γ ( ν ) − µ2
G(µ, ν) µ θ
Normal Inversa 1 1 1
σ2 − − (−2θ )
1
2 − ln (2πσ y ) + 2
2 3
(−2θ )
−1
2 µ3
IG(µ,σ2) 2µ 2
2 σ y
Capítulo 2
2.1 Introdução
A seleção de modelos é uma parte importante de toda pesquisa, envolve a procura de
um modelo o mais simples possível, razoável, que descreva bem os dados observados. Na
maior parte das situações pode-se pensar na variável resposta consistindo de duas partes
distintas:
a
1 ) um componente sistemático, que é estabelecido durante o planejamento (fundamental
para a obtenção de conclusões confiáveis) do experimento, resultando em modelos de
regressão (linear simples, múltipla, não linear etc), de análise de variância (delineamentos
inteiramente casualizados, blocos casualizados, quadrados latinos com estrutura de
tratamentos fatorial, parcelas subdivididas etc) e de análise de covariância;
a
2 ) um componente aleatório, que é estabelecido assim que são definidas as medidas a
serem feitas, que podem ser contínuas ou discretas, exigindo o ajuste de distribuições
diferentes. Um mesmo experimento pode envolver medidas de diferentes tipos, como por
exemplo, dados de altura, número de lesões e proporção de plantas doentes.
Y =µ+ε,
Nelder & Wedderburn (1972) mostraram, então, que a maioria dos problemas
estatísticos, que surgem nas áreas de agricultura, demografia, ecologia, economia, geografia,
geologia, história, medicina, ciência política, psicologia, sociologia, zootecnia etc, podem ser
formulados, de uma maneira unificada, como modelos de regressão. Esses modelos envolvem
uma variável resposta univariada, variáveis explicativas e uma amostra aleatória de n
observações, sendo que:
Dose (di) mi yi pi
10,2 50 44 0,88
7,7 49 42 0,86
5,1 46 24 0,52
3,8 48 16 0,33
2,6 50 6 0,12
0,0 49 0 0,00
O interesse do pesquisador estava na determinação das doses letais que matam 50%
(DL50) e 90% (DL90) dos insetos, para recomendação de aplicação do inseticida no campo.
Modelos Lineares Generalizados na Experimentação Agronômica 17
Pode-se ver que o gráfico das proporções ( pi = y i / mi ) de insetos mortos versus as doses (di)
tem um aspecto sigmoidal (Figura 1) o que orienta a escolha do modelo para π i .
π i = P[U ≤ d i ] = F (d i ) =
di
∫ -∞
f (u )du . (2.1)
0,8 0,8
0,6 0,6
F(d)
F(d)
0,4 0,4
0,2 0,2
0,0 0,0
0 2 4 6 8 10 12 0 2 4 6 8 10 12
Doses Doses
Nesse caso assume-se que U tem distribuição normal de média µ e variância σ 2 , isto
é,
1 (u - µ )2
f U (u; µ , σ ) =
2
exp - 2
, µ ∈ ℜ e σ 2 > 0,
2πσ 2 2σ
Modelos Lineares Generalizados na Experimentação Agronômica 19
e, portanto,
U - µ di − µ µ 1
π i = P(U ≤ d i ) = P ≤ = P Z ≤ − + d i = P(Z ≤ β1 + β 2 d i )
σ σ σ σ
µ 1
para β 1 = - e β 2 = . Portanto, como Z ~ N(0,1) , tem-se que:
σ σ
π i = Φ ( β1 + β 2 d i ) ,
em que Φ(⋅) representa a função de distribuição normal padrão, é uma função não-linear em
um conjunto linear de parâmetros. É linearizada por:
probit (π i ) = Φ -1 (π i ) = β1 + β 2 d i .
Nesse caso, assume-se que U tem distribuição logística com parâmetros µ e τ , que é
similar à distribuição normal na forma, com caudas um pouco mais longas e tem f.d.p. dada
por:
u −µ
exp
1 τ
f U (u; µ , τ ) = , µ ∈ ℜ, τ > 0,
τ u − µ
2
1 + exp τ
π 2τ 2
com média E(U ) = µ e variância σ 2 = Var (U ) = (Mood et al., 1974). Fazendo-se,
3
µ 1
β1 = - e β 2 = , tem-se:
τ τ
β 2 e β1 + β 2u
fU (u; β1 β 2 ) = .
(1 + e )
β1 + β 2 u 2
Logo,
e β1 + β2 d i
π i = P (U ≤ d i ) = F (d i ) =
1 + e β1 + β2 d i
Nesse caso, assume-se que U tem distribuição Gumbel de valor extremo com
parâmetros α e τ , que é uma distribuição assimétrica ao contrário das duas anteriores que
são simétricas, e tem f.d.p. dada por:
20 Clarice G.B. Demétrio
1 u −α u − α
fU (u; α, τ) = exp exp− exp , α ∈ ℜ, τ > 0,
τ τ τ
π 2τ 2
com média E(U ) = α + γτ e variância σ 2 = Var (U ) = , sendo γ ≈ 0,577216 (Mood et
6
α 1
al., 1974). Fazendo-se, β 1 = - e β 2 = , tem-se:
τ τ
( )
f U (u; β 1 , β 2 ) = β 2 exp β 1 + β 2 u − e β1 + β 2u .
Logo,
µ
η i = g i = g (π i )
mi
que nos casos vistos foram:
π
modelo logístico: ηi = g (π i ) = ln i ;
1 − πi
modelo complemento log-log: η i = g(π i ) = ln[- ln (1 - π i )] .
Modelos Lineares Generalizados na Experimentação Agronômica 21
Portanto, tem-se que esses modelos são baseados na família exponencial com um
parâmetro desconhecido, cujas médias são não-lineares num conjunto de parâmetros lineares,
isto é,
modelo probit: µ i = mi Φ (η i ) = mi Φ (β 1 + β 2 d i ) ;
e ηi e β1 + β2 d i
modelo logístico: µ i = mi = mi ;
1 + e ηi 1 + e β1 + β2 d i
modelo complemento log-log: µ i = mi {1 − exp{− exp(ηi )}} = mi {1 − exp{− exp(β1 + β 2 d i )}} .
b) Ensaios de diluição
É prática comum, o uso dos ensaios de diluição para se estimar a concentração de um
organismo (número por unidade de volume, de área, de peso etc) em uma amostra quando
contagem direta não é possível, mas a presença ou ausência do organismo em sub-amostras
pode ser detectada (Ridout, 1998). Não são necessárias, portanto, as contagens dos
organismos e, em geral, registrar a presença, ou ausência, fica mais econômico. Por exemplo,
pode-se detectar se uma determinada bactéria está presente, ou não, em um líquido por um
teste de cor, ou se um fungo está presente, ou não, em uma amostra de solo, plantando-se uma
planta susceptível nesse solo e verificando se a planta apresenta sintomas da doença. Esse
método está baseado na suposição que o número de indivíduos presentes segue uma
distribuição de Poisson, o que é uma suposição forte e é importante verificar se é verdadeira.
Por exemplo, a distribuição espacial de um fungo no solo está longe de ser aleatória e pode
ser que o número de indivíduos em diferentes amostras desse solo não siga a distribuição de
Poisson.
Nos ensaios de diluição, a solução original é diluída progressivamente e na i-ésima
diluição são feitas as contagens (Exemplo 6) ou, então, são testadas mi sub-amostras das
quais Yi apresentam resultado positivo para a presença do organismo (Exemplo 7). Seja vi o
volume da amostra original que está presente em cada uma das sub-amostras na i-ésima
diluição. Em geral, mas nem sempre, são usadas diluições iguais, tal que os vi's ficam em
progressão geométrica.
Diluição Contagens
0,3162 13 14 17 22
0,1778 9 14 6 14
0,1000 4 4 3 5
0,0562 3 2 1 3
0,0316 2 1 3 2 2
Fonte: Ridout (1990)
22 Clarice G.B. Demétrio
Tabela 5: Números de amostras (Y) que contêm esporos em 5 amostras, para diferentes
quantias (g) de farinha de batata em cada diluição.
µ i = λvi .
Assim, se forem feitas contagens dos indivíduos após a diluição, tem-se que essa
expressão, pode ser linearizada, usando-se a função logarítmica, ou seja,
µ
η i = g ( µ i ) ou η i = g i = g (π i )
mi
que nos casos vistos foram:
Portanto, tem-se que esses modelos são baseados na família exponencial com um
parâmetro desconhecido, cujas médias são não-lineares num conjunto de parâmetros lineares,
isto é,
c) Tabelas de contigência
Dados de contagens são oriundos da simples contagem de eventos (por exemplo,
número de brotos por explante), ou então, da freqüência de ocorrências em várias categorias e
que dão origem às tabelas de contingência. Sejam os exemplos:
Vê-se que o número de insetos que chegam às armadilhas, seja do sexo feminino ou do
sexo masculino é um número aleatório, caracterizando uma observação de uma variável com
distribuição de Poisson. A hipótese de interesse é a hipótese da independência, isto é, o sexo
do inseto não afeta a escolha pela cor da armadilha.
Inseticidas Frutos
Totais
Sadios Com broca
Diazinon 1690 115 1805
Phosdrin 1578 73 1651
Sevin 2061 53 2114
Testemunha 1691 224 1915
Totais 7020 465 7485
Fonte: Silveira Neto et al. (1976)
Tem-se aqui, também, um caso em que o número total de frutos com broca é uma
variável aleatória e, portanto, podendo ser estudada pela distribuição de Poisson. A hipótese a
ser testada é a da homogeneidade, isto é, a proporção de frutos sadios é a mesma para todos os
inseticidas.
A distribuição de Poisson desempenha na análise de dados categorizados o mesmo
papel que o modelo normal ocupa na análise de dados contínuos. A diferença fundamental
está em que a estrutura multiplicativa para as médias do modelo de Poisson é mais apropriada
do que a estrutura aditiva do modelo com erro Normal. Ele é especialmente útil na análise de
tabelas de contingência em que as observações consistem de contagens ou freqüências nas
caselas pelo cruzamento das variáveis resposta e explanatórias.
Os valores da variável dependente podem ser considerados como variáveis de Poisson
com média µ i , e, portanto,
E(Yi ) = µ i .
µ i = m π j π k'
n
sendo que m = ∑ y i e π j e π k' são as probabilidades marginais de uma observação pertencer
i =1
às classes j e k, respectivamente.
De forma semelhante pode ser verificado que, em geral, para dados colocados em
tabelas de contingência, as hipóteses mais comuns podem ser expressas como modelos
multiplicativos para as freqüências esperadas das caselas (McCullagh & Nelder, 1989;
Agresti, 1990). Verifica-se, então, que na análise de dados categorizados, de uma forma geral,
a média µ i é obtida como um produto de outras médias marginais. Isto sugere que uma
transformação logarítmica do valor esperado lineariza essa parte do modelo (daí vem o nome
de modelo log-linear). Considerando-se o exemplo dado tem-se:
η i = ln ( µ i ) = ln m + ln π j + ln π k' = µ + α j + β k .
Novamente, tem-se:
η i = g ( µ i ) = ln ( µ i ) .
Portanto, tem-se que esses modelos são baseados na família exponencial com um
parâmetro desconhecido, cujas médias são não-lineares num conjunto de parâmetros lineares,
ou seja,
µ i = exp{η i } = exp{x Ti β} .
2.3 Definição
Os modelos lineares generalizados podem ser usados quando se tem uma única
variável aleatória Y e associado a ela um conjunto de variáveis explicativas X 1 , X 2 , ..., X p .
Para uma amostra de n observações ( y i , x i ) em que x i = ( x1i , x 2i , ..., x pi ) T é o vetor coluna
de variáveis explicativas, o modelo linear generalizado envolve os três componentes:
E(Yi ) = µ i , i = 1, 2, ..., n ,
1
f ( y i ;θ i , φ ) = exp [ yiθ i - b(θ i )] + c( yi ;φ ) ,
ai (φ )
φ
sendo b(.) e c(.) funções conhecidas. Em geral, ai (φ ) = , sendo wi pesos a priori. Além
wi
disso, de (1.8)
E(Yi ) = µ i = b ′(θ i )
e
Var (Yi ) = ai (φ )b ′′(θ i ) = ai (φ )V (µ i ) = ai (φ )Vi
dµ i
em que Vi = é chamada função de variância, e como depende unicamente da média tem-
dθ i
se que o parâmetro natural pode ser expresso como
θ i = ∫ Vi -1 dµ i = q (µ i )
iii) Função de ligação: uma função que liga o componente aleatório ao componente
sistemático, ou seja, relaciona a média ao preditor linear, isto é,
η i = g (µ i ) ,
Deve ser lembrado, porém, que embora as funções de ligação canônicas levem a
propriedades estatísticas desejáveis para o modelo, principalmente no caso de amostras
pequenas, não há nenhuma razão a priori para que os efeitos sistemáticos do modelo devam
ser aditivos na escala dada por tais funções (McCullagh & Nelder, 1989).
Para o modelo linear clássico a função de ligação é chamada identidade, pois o
preditor linear é igual à média. Essa função de ligação é adequada no sentido em que ambos,
η e µ , podem assumir valores na linha real.
Entretanto, certas restrições surgem quando se trabalha, por exemplo, com a
distribuição de Poisson em que µ > 0 e, portanto, a função de ligação identidade não deve ser
usada, pois ηˆ poderá assumir valores negativos dependendo dos valores obtidos para βˆ .
Além disso, dados de contagem dispostos em tabelas de contingência, sob a suposição de
independência, levam naturalmente a efeitos multiplicativos cuja linearização pode ser obtida
através da ligação logarítmica, isto é, η = ln µ de onde se tem µ = eη (conforme visto em
2.2).
28 Clarice G.B. Demétrio
Para a distribuição binomial a restrição é que 0 < π < 1 e, portanto, uma função de
ligação deve satisfazer à condição de transformar o intervalo (0,1) na linha dos reais. (ver
Exercício 2.12.4). Nesse caso as funções de ligação mais comumente encontradas, além da
canônica, são a Probit e a complemento log-log:
µ
η = Φ −1 (π ) = Φ −1
m
e
π
η = ln[− ln (1 − π )] = ln − ln1 − .
m
(1 − π ) − λ − 1
η = ln
λ
sendo λ uma constante desconhecida e que tem como casos particulares o modelo logístico
para λ = 1 e o complemento log-log para λ → 0 .
Uma família importante de funções de ligação, principalmente para dados com média
positiva, é a família potência (ver Exercício 2.12.6), especificada por:
µ λ − 1
λ≠0
η= λ
ln µ λ=0
ou então,
µλ λ≠0
η=
ln µ λ=0
n n
1
l = l(θ; y ) = ∑ l(θ i ; y i ) = ∑ [ y i θ i − b(θ i )] + c( y i ; φ) ,
i =1 i =1 a i (φ )
Mas,
l = f (θ 1 ,θ 2 ,K,θ i ,K,θ n )
↓
θ i = ∫ Vi −1dµ i = q (µ i )
↓
µ i = g -1 (ηi ) = h(ηi )
↓
p
ηi = ∑ xij β j
j =1
E(Yi ) = µ i = b′(θ i )
e
dµ i dµ i
Var (Yi ) = ai (φ ) = ai (φ )V (µ i ) ⇒ = V (µ i ) .
dθ i dθ i
Logo,
∂l 1
( yi − µ i ) 1 dµ i x ij .
n
Uj = =∑ (2.4)
∂β j i =1 ai (φ ) V ( µ i ) dη i
x (m+1) = x (m ) −
( )
f x (m )
( )
f ' x (m )
,
( )(
β (m +1) = β (m ) + I o-1
m)
U (m ) ,
( )(
β (m +1) = β (m ) + ℑ-1
m)
U (m ) (2.5)
− ∂ 2l ∂ l ∂ l
sendo que ℑ tem elementos dados por ℑ jk = E = E , que é a matriz de
∂β j ∂β k ∂β j ∂β k
'
covariâncias dos U j s .
ℑ( m ) β (m +1) = ℑ( m ) β (m ) + U (m ) . (2.6)
Modelos Lineares Generalizados na Experimentação Agronômica 31
2
φ wi dµ i
e fazendo-se ai (φ ) = , com φ > 0 , constante, wi peso a priori e Wi = , tem-
wi V (µ i ) dηi
se:
1
ℑ = XT W X
φ
1n
com elementos ℑ jk = ∑ xij Wi xik , X , a matriz do modelo e W = diag (W1 , W2 , ..., Wn ) .
i =1 φ
dθ i dη i
No caso das funções de ligação canônicas Wi = wi V (µ i ) , pois = = V −1 ( µ i ) .
dµ i dµ i
Além disso, rearranjando-se os termos de U j tem-se
n wi ( y i − µ i ) dµ i n 1 dη i
Uj =∑ xij = ∑ xij Wi ( yi − µ i )
i =1 φ V (µ i ) dη i i =1 φ dµ i
dη dη dη
com ∆ = diag 1 , 2 , L, n = diag{g ′(µ1 ), g ′(µ 2 ), K, g ′(µ n )} .
dµ1 dµ 2 dµ n
1 T (m ) 1 1
X W X β (m+1) = X T W (m ) X β (m ) + X T W (m ) ∆(m ) (y − µ )
(m)
φ φ φ
ou, ainda,
[
X T W (m ) X β (m+1) = X T W (m ) X β (m ) + ∆(m ) (y − µ )
(m)
]
e fazendo-se z (m ) = X β (m ) + ∆(m ) (y − µ ) = η (m ) + ∆(m ) (y − µ )
(m) (m)
, chamada variável
dependente ajustada, tem-se
32 Clarice G.B. Demétrio
X T W (m ) X β (m +1) = X T W (m ) z ( m ) (2.7)
ou ainda,
(
β (m +1) = X T W (m ) X ) −1
X T W (m ) z ( m ) (2.8)
que tem a forma da solução das equações normais, para o modelo linear obtida pelo método
dos quadrados mínimos ponderados, exceto que nesse caso a solução βˆ = β ( m +1) é obtida por
processo numérico iterativo. É importante observar que a expressão (2.8) independe de φ .
O método usual para iniciar o processo iterativo é especificar uma estimativa inicial
β e sucessivamente alterá-la até que a convergência seja obtida e, portanto, βˆ = β ( m +1) .
(0)
Note, contudo que cada observação pode ser considerada como uma estimativa do seu valor
médio, isto é, µ̂ i = y i e, portanto,
ηˆ i = g (µˆ i ) = g ( y i ) .
1) obter as estimativas
p
η i( m ) = ∑ xij β j( m )
j =1
e
(
µ i( m ) = g -1 η i( m ) ; )
2) obter a variável dependente ajustada
( ) (
z i( m ) = η i( m ) + y i − µ i( m ) g ′ µ i( m ) )
e os pesos
wi
Wi ( m ) = ;
V (µ i( m ) )[g ′(µ i( m ) ) ]
2
3) calcular
(
β (m +1) = X T W (m ) X ) −1
X T W (m ) z ( m ) ,
voltar ao passo (1) com β (m ) = β (m +1) e repetir o processo até convergência, obtendo-
se βˆ = β (m +1) .
2
p β (j m ) − β (j m +1)
∑ <ξ ,
j =1
β (j m )
η = g (µ ) = ln µ
e forem observados valores y i = 0 o processo não pode ser iniciado. Um método geral para
contornar esse problema é substituir y por y + c tal que E[ g (Y + c)] seja a mais próxima
1
possível de g (µ) . Para o modelo de Poisson com função de ligação logarítmica usa-se c = .
2
1 − 2π µ
Para o modelo logístico usa-se c = , para π = e m, o índice da distribuição
2 m
binomial. De uma forma geral, usando-se a expansão de Taylor até 2a ordem para g ( y + c)
em relação a g (µ) tem-se:
g" (µ )
g ( y + c) ≈ g ( µ ) + ( y + c − µ ) g ′( µ ) + ( y + c − µ ) 2
2
com valor esperado dado por:
g" ( µ )
E[ g (Y + c)] ≈ g ( µ ) + E (Y − µ ) g ′( µ ) + c g ′( µ ) + Var (Y )
2
em que se tem:
1 g ′′( µ )
c ≈ − Var (Y ) .
2 g ′( µ )
m y
f ( y i ; π i ) = i π i i (1 - π i ) ( mi - yi ) I A ( y i ), π i ∈ [0,1], A = {0,1, ..., mi } .
yi
Logo,
φ = 1, wi = 1 , ai (φ ) = 1 ,
34 Clarice G.B. Demétrio
1
Var(Yi ) = miπ i (1 − π i ) = µ i ( mi - µ i )
mi
e
1
V ( µ i ) = miπ i (1 − π i ) = µ i (mi − µ i ).
mi
Adotando-se a função de ligação logística (canônica) e o preditor linear dado por uma
regressão linear simples, isto é,
µ µi
η i = g i = ln = β1 + β 2 d i
mi mi − µ i
tem-se
e ηi
µ i = mi g (η i ) = mi
-1
,
1 + e ηi
dη i (mi − µ i ) + µ i mi - µ i mi
= = ,
dµ i (mi − µ i ) 2
µi µ i (mi − µ i )
1 d1
1 d 2
X= β = (β 1 , β 2 ) .
T
e
K K
1 dn
Portanto,
mi
z i = ηi + ( y i − µ i )
µ i (mi − µ i )
e
1
Wi = Vi = µ i (mi − µ i ) .
mi
Ainda,
W1 0 K 0
1 1 K 1 0 W2 K 0 W1 W2 K Wn
XT W = =
d 1 d 2 K d n K K K K W1 d 1 W2 d 2 K Wn d n
0 0 K Wi
Modelos Lineares Generalizados na Experimentação Agronômica 35
∑n W ∑ Wi d i
n
∑n W d 2 − ∑ Wi d i
n
( ) 1 i =1 i i
i −1
X T WX = ni =1 i =1
X T WX =
, i =1
,
2 det − ∑ W d
n n n
i∑
=1
Wi d i ∑ Wi d i
i =1 i =1 i i ∑ Wi
i =1
∑ n
Wz
i =1 i i
X Wz = n
T
i∑
=1
Wi d i z i
2
− ∑ Wi d i .
n n n
2
sendo det = ∑ Wi ∑ Wi d i
i =1 i =1 i =1
Portanto,
n W ( m) d 2 ∑ n
Wi ( m ) z i( m ) − ∑ Wi ( m ) d i ∑ Wi ( m ) d i z i( m )
n n
β 1m +1 1 i∑ i i
β (m +1) = m +1 = ( m)
=1
n n
i =1 i =1
n
i =1
n .
β
21 det Wi ∑ Wi d i z i − ∑ Wi d i ∑ Wi z i
( m ) ( m ) ( m ) ( m ) ( m ) ( m )
i∑
=1 i =1 i =1 i =1
Data novo;
set saida;
pobs=y/m;
Yest=m*predito;
run;
No caso particular dos modelos lineares em que as variáveis respostas têm distribuição
Normal, as distribuições dos estimadores dos parâmetros e das estatísticas usadas para
verificação do ajuste do modelo aos dados podem ser determinadas exatamente. Em geral,
porém, a obtenção de distribuições exatas é muito complicada e resultados assintóticos são
usados. Esses resultados, porém, são dependentes de várias condições de regularidade e dos
tamanhos amostrais. No caso de observações independentes provenientes de distribuições
amostrais pertencentes à família exponencial e, em particular, para os modelos lineares
generalizados essas condições são satisfeitas (Dobson, 1990; Fahrmeir & Kaufman, 1985;
Cox & Hinkley, 1986).
A idéia básica é que se θˆ é um estimador consistente para um parâmetro θ e Var (θˆ)
é a variância desse estimador, então, para amostras grandes, tem-se:
i) θˆ é assintoticamente imparcial;
ii) a estatística
θˆ − θ →∞
Zn = n
→ Z, sendo que Z ~ N (0,1)
Var (θˆ)
ou, de forma eqüivalente,
(θˆ − θ ) 2
Z n2 = n
→ Z 2 , sendo que Z 2 ~ χ12 .
→∞
Var (θˆ)
βˆ − β = ℑ −1 U(β)
desde que ℑ seja não-singular. Tem-se, então, que
que é a base para a construção de testes e intervalos de confiança para os modelos lineares
generalizados. Para modelos lineares com variáveis respostas com distribuição normal, (2.9) e
(2.10) são exatas.
Para amostras pequenas βˆ é tendencioso. Além disso, para n não muito grande a
estrutura de covariâncias das estimativas dos parâmetros lineares difere de ℑ− 1 . A matriz ℑ é
consistentemente estimada por
ˆ = 1 XT W
ℑ ˆ X,
φ
2
wi dµ i
sendo X a matriz do modelo, W = diag{W1 , W2 , ..., Wn } , Wi = e φ > 0 ,
V (µ i ) dη i
constante e conhecido. Para as distribuições binomial e de Poisson φ = 1 . Se φ for constante
para todas as observações e desconhecido afetará a estrutura assintótica de ℑ ˆ −1 (com
elementos representados por v jk , k = j = 1, 2, ..., p ) mas não o valor de βˆ . Na prática se φ é
desconhecido (distribuições normal e normal inversa φ = σ 2 e gama φ = ν −1 ), deve ser
substituído por alguma estimativa consistente (ver seção 2.8).
Os erros padrões dos estimadores βˆ1 , βˆ 2 ,..., βˆ p são iguais às raízes quadradas dos
elementos da diagonal de ℑ ˆ −1 , isto é, s (βˆ ) = v . Então, intervalos de confiança assintóticos,
j jj
Modelos Lineares Generalizados na Experimentação Agronômica 41
ρˆ jk = Côrr (βˆ j ; βˆ k ) =
(
Côv βˆ j ; βˆ k ) =
v jk
Vâr (βˆ j ) Vâr (βˆ k ) v jj v kk
Exemplo 10: Seja Y1 , Y2 , ..., Yn uma amostra aleatória de uma distribuição N (µ i , σ 2 ) , sendo
que µ i = x Ti β e σ 2 > 0 , conhecida. Considerando como função de ligação a identidade, isto
é, η i = µ i , tem-se que
dη i
g ′(µ i ) = = 1.
dµ i
1 T 1
ℑ= X W X = 2 XT X
φ σ
e a variável dependente ajustada
z i = ηˆ i + g ′(µˆ i )( y i − µˆ i ) = µˆ i + y i − µˆ i = y i .
(
βˆ = X T X )−1
XT y
que é a solução usual de mínimos quadrados para Modelos Lineares Clássicos. Tem-se, então,
que
E (βˆ ) = ( X T X) −1 X T E (Y) = ( X T X) −1 X T Xβ = β
e
= σ 2 ( X T X) −1 = ℑ −1 ,
42 Clarice G.B. Demétrio
1 T
pois, E[(Y − Xβ) (Y − Xβ) T ] = Iσ 2 e ℑ = X X.
σ2
Logo,
(βˆ − β) T ℑ(βˆ − β) ~ χ 2p . (EXATA!)
O modelo saturado inclui, nesse caso, todas as interações com blocos que não são de
interesse prático.
Em geral, trabalha-se com modelos encaixados e o conjunto de matrizes dos modelos
pode, então, ser formado pela adição sucessiva de termos ao modelo minimal até se chegar ao
modelo maximal. Qualquer modelo com p parâmetros linearmente independentes, situado
entre os modelos minimal e maximal, é chamado modelo corrente ou modelo sob pesquisa.
O problema é determinar a utilidade de um parâmetro extra no modelo corrente (sob pesquisa)
ou, então, verificar a falta de ajuste induzida pela omissão dele. A fim de discriminar entre
modelos, medidas de discrepância devem ser introduzidas para medir o ajuste de um modelo.
Nelder & Wedderburn (1972) propuseram como medida de discrepância a deviance
(traduzida como desvio por Cordeiro (1986)), com expressão dada por:
S p = 2(ˆl n − ˆl p ) ,
n
ˆl = 1 {w [ y θ~ − b(θ~ )] + c( y ; φ )}
n ∑ i i i
φ i =1
i i
e
n
ˆl = 1 {w [ y θˆ − b(θˆ )] + c( y ; φ )} ,
p ∑ i i i
φ i =1
i i
~ ~
sendo θ i = θ ( y i ) e θˆi = θˆ( µˆ i ) , as estimativas do parâmetro canônico sob os modelos
saturado e corrente, respectivamente. Tem-se, então,
1 n ~ ~ 1
Sp = ∑
φ i =1
2 wi { y i [θ i − θˆi ] − b(θ i ) + b(θˆi )} = D p
φ
(2.11)
1 n 2
Sp = ∑ di ,
φ i =1
44 Clarice G.B. Demétrio
sendo que d i2 mede a diferença dos logaritmos das funções de verossimilhanças observada e
ajustada, para a observação correspondente e é chamado componente da deviance. A soma
deles mede a discrepância total entre as duas funções de verossimilhanças. É portanto, uma
medida da distância dos valores ajustados µ̂ ' s em relação aos dados observados y’s, ou de
forma equivalente, do modelo corrente em relação ao modelo saturado. Verifica-se que a
deviance eqüivale a uma constante menos duas vezes o máximo da função de verossimilhança
para o modelo corrente, isto é,
1 n y i2 µˆ i2 1
∑ (2 y − 2 µˆ i y i − y i2 + µˆ i2 )
n
Sp = 2 y [ y − ˆ
µ ]
∑ i i i 2 + 2 = σ2
− 2
σ 2 i =1
i
i =1
1 n
SQRes
= 2 ∑ ( y i − µˆ i ) =
2
σ i =1 σ2
que coincide com a estatística clássica SQRes com (n-p) graus de liberdade dividida por σ 2 .
π µi
φ = 1 ; wi = 1 ; θ i = ln i = ln
1 - πi mi - µ i
e
m − µi
b(θ i ) = mi ln (1 + e θi ) = − mi ln (1 − π i ) = − mi ln i .
mi
Logo,
n y i µˆ i m − yi m − µˆ i
S p = ∑ 2 y i ln − ln + mi ln i − mi ln i
i =1 mi − y i mi − µˆ i mi mi
ou ainda,
n y m − y i
S p = 2∑ y i ln i + (mi − y i ) ln i .
i =1
µˆ i m
i − ˆ
µ i
Modelos Lineares Generalizados na Experimentação Agronômica 45
n
y
S p = 2C (y ) + 2ν ∑ wi lnµˆ i + i ,
i =1 µˆ i
sendo C (y ) uma função arbitrária, porém limitada. Pode ser usada, por exemplo, a expressão
n
yi
C (y ) = ∑ wi .
i =1 1 + yi
Sp = 2
σ
∑w i
i
y i µˆ i2
Normal Inversa i =1
A deviance é sempre maior do que ou igual a zero, e à medida que entram variáveis
explanatórias (ou covariáveis) no componente sistemático, decresce até se tornar zero para o
modelo saturado. Quanto melhor for o ajuste do modelo aos dados tanto menor será o valor de
S p . Assim, um modelo bem ajustado aos dados com uma verossimilhança grande tem uma
46 Clarice G.B. Demétrio
S p = D p ~ χ n2− p .
S p ~ χ n2− p , quando φ → 0 ,
variação (Paula, 2000). Em geral, porém, não se conhece φ e ele precisa ser substituído por
uma estimativa consistente.
Na prática, contenta-se em testar um modelo linear generalizado, sem muito rigor,
comparando-se o valor S p com os percentis da distribuição χ n−2
p (McCullagh & Nelder,
S p ≤ χ 2n − p;α
n
( yi − µˆ i )2
X 2
= ∑ wi ,
i =1 V (µˆ i )
sendo V (µ̂ i ) a função de variância estimada sob o modelo que está sendo ajustado aos dados.
Para respostas com distribuição normal, X 2 = SQRes e
X2
~ χ n2− p (exata).
σ 2
pode ser pobre. Além disso, X 2 tem como desvantagem o fato de tratar os y i ' s
simetricamente. Em muitos casos, é preferida em relação à deviance, por facilidade de
interpretação.
µi
η i = ln = β1 + β 2 d i
mi − µ i
Exemplo 14: Seja Y1 , Y2 , ..., Yn uma amostra aleatória de uma distribuição N ( µ i , σ 2 ) . Então,
o logaritmo da função de verossimilhança fica
1 n ( yi − µ i )
2
n
l=− ∑
2 i =1 φ
− ln (2πφ )
2
∂l 1 n ( y i − µ i )
2
n
= ∑ −
∂φ 2 i =1 φ 2
2φ
∂l
e fazendo-se = 0 tem-se
∂φ
1 n 1
φ = ∑ ( y i − µˆ i ) = D p .
ˆ 2
n i =1 n
1 n 2D p
= 1 + 1 +
φˆ 2 D p 3n
∂ 2 l(β, φ )
E =0
∂β ∂φ
j
e, portanto, os parâmetros β e φ são ortogonais (Exercício 2.12.14).
O método dos momentos fornece uma outra estimativa, também não consistente, para
φ . Esse método baseia-se no fato (que nem sempre é verdadeiro) de que S p ~ χ n2− p . Logo,
E (S p ) = ~ E (D p ) ≅ n − p
1
φ
e, portanto,
~ Dp
φ = ,
n− p
é a estimativa usual de σ 2 e é não viesada, mas para os outros modelos isso não acontece, em
geral.
Uma outra maneira de se estimar φ é baseada na estatística de Pearson X 2
generalizada (Jφrgensen, 1987) e é dada por
X2
φ* =
n−m
que nem sempre é imparcial, porém, é consistente.
50 Clarice G.B. Demétrio
S p − Sq =
1
(D p − Dq ) ~ χ q2− p ,
φ
( D p − Dq ) /(q − p )
F= ~ Fq − p ,n − m .
φˆ
µi
ηi = ln = β1 + β 2 d i ,
mi − µ i
dois modelos encaixados podem ser propostos para a análise desses dados, a saber:
a) modelo nulo: η i = β 1 e
b) modelo de regressão linear: ηi = β1 + β 2 d i .
O exame da Tabela 11, confirmando o que já foi visto no Exemplo 13, mostra que
existem evidências, a um nível de significância entre 5% e 1% de probabilidade, que o
modelo logístico linear ajusta-se razoavelmente a esse conjunto de dados, mas rejeita-se o
modelo nulo. Pelo exame da Tabela 12 rejeita-se a hipótese H 0 : β 2 = 0 , confirmando a
adequação do modelo logístico linear. Necessita-se, porém, adicionalmente, de uma análise de
resíduos e de diagnósticos.
52 Clarice G.B. Demétrio
exp(−3,226 + 0,6051d i )
µˆ i = mi .
1 + exp(−3,226 + 0,6051d i )
sendo H 2 = W1 2 X 2 ( X T2 WX 2 ) −1 X T2 W1 2 .
Sejam as hipóteses
H 0 : β1 = β1, 0 versus H a : β1 ≠ β1, 0 ,
máxima verossimilhança para β 2 sob H 0 . A seguir são definidos os três testes mais usados
para testar a hipótese H 0 .
1
Λ = −2ln λ = 2[l(βˆ 1 , βˆ 2 ; y ) − l(β1, 0 , βˆ 2,0 ; y )] = [ D(y; µˆ 0 ) − D(y; µˆ )] .
φ
(
β̂ ~ N p β, ℑ −1 . )
Assim, a estatística para esse teste é
W = (βˆ 1 − β1,0 ) T [V̂ar(βˆ 1 )]-1 (βˆ 1 − β1, 0 ) ,
sendo V̂ar(βˆ 1 ) a Var (βˆ 1 ) avaliada em β̂ = [βˆ 1T βˆ T2 ]T . Para amostras grandes, rejeita-se H 0 , a
um nível de 100α % de probabilidade, se W > χ q2,1−α .
Obtido a partir da função escore, tem sido muito usado na Bioestatística. A estatística
de teste nesse caso é dada por:
E = U 1T (βˆ 0 ) V̂ar0 (βˆ 1 )U 1 (βˆ 0 ) ,
sendo V̂ar0 (βˆ 1 ) a Var (βˆ 1 ) avaliada em βˆ 0 = [β1T, 0 βˆ T2, 0 ]T . Para amostras grandes, rejeita-se
H 0 , a um nível de 100α % de probabilidade, se E > χ q2,1−α .
Modelos Lineares Generalizados na Experimentação Agronômica 55
Caso particular: No caso em que há interesse no teste de hipótese do vetor β como um todo,
isto é, no teste das hipóteses
H 0 : β = β 0 versus H a : β ≠ β 0
Exemplo 16: Conforme já foi visto, a função escore em relação a β j é dada por:
∂l
Uj = , j = 1, 2, ..., p,
∂β j
Exemplo 17: Seja Y1 , Y2 , ..., Yn uma amostra aleatória de uma distribuição N ( µ , σ 2 ) com µ
desconhecido e σ 2 conhecido. Visto como modelo linear generalizado tem-se:
i) somente um parâmetro de interesse, µ ;
ii) não há variáveis explanatórias e,
iii)a função de ligação é a identidade, isto é, η = µ .
O logaritmo da função de verossimilhança é
56 Clarice G.B. Demétrio
1 n
− µ ) − ln (2πσ 2 ) ,
n
l = l(µ; y1 , K , y n ) = − ∑ (y
2
2σ 2
i
i =1 2
a partir da qual se obtêm:
dl 1 n n
U= = 2 ∑ ( yi − µ ) = 2 ( y − µ ) ,
dµ σ i=1 σ
E (U ) =
n
[E (Y ) − µ ] = 0
σ2
e
n2 n2 σ2
Var (Y ) =
n
ℑ = Var (U ) = = 2.
(σ )
2 2
(σ )
2 2 n σ
Portanto,
n 2 (Y − µ ) σ 2 (Y − µ )
2 2
E =U ℑ U = T -1
= ~ χ 12 .
σ 2 2 n σ ( )
2
n
Esse resultado pode ser usado para a obtenção de intervalos de confiança para µ .
m
l(π ; y ) = ln + ylnπ + (m-y ) ln(1 - π )
y
e, portanto,
dl y (m − y ) y − mπ
U= = − = .
dπ π 1−π π (1 − π )
1
Mas, E (Y ) = µ = mπ e Var (Y ) = mπ (1 − π ) = µ (m − µ ) . Logo,
m
E (U ) = 0
e
1 m
ℑ = Var (U ) = Var (Y ) = .
π (1 − π )
2 2
π (1 − π )
Logo,
E =U ℑ T -1
U=
(Y − mπ ) 2
π (1 − π ) (Y − mπ )
= =
[Y − E (Y )]
2 2
π (1 − π )
2 2
m mπ (1 − π ) Var (Y )
m (Y − µ ) Y − E (Y ) D
= → N (0,1) .
µ (m − µ ) Var (Y )
sendo β̂ 2,1 a estimativa de máxima verossimilhança de β 2 para cada valor de β1 que é testado
ser pertencente, ou não, ao intervalo.
Usando-se a estatística de Wald, uma região de confiança para β1 , com um coeficiente
de confiança de 100(1 − α )% , inclui todos os valores de β1 tais que:
2.12 Exercícios
2.12.1 Obter o algoritmo de estimação dado em (2.7) para os β ' s para o caso particular das
funções de ligação canônicas para as distribuições estudadas no Capítulo 1, calculando W , ∆
e z.
2.12.4 Para dados com distribuição binomial as funções de ligação mais comuns são:
logística, Probit e complemento log-log. Comparar os valores do preditor linear para essas
funções de ligação no intervalo (0,1).
58 Clarice G.B. Demétrio
(1 − π ) − λ − 1
η = ln , 0 < π < 1 e λ constante desconhecida.
λ
Mostre que o modelo logístico é dado para λ = 1 e que para λ → 0 tem-se a função de
ligação complemento log-log.
2.12.9 Mostre que para os modelos log-lineares com matriz modelo tendo uma coluna de 1's,
a deviance reduz-se a:
n
y
S p = 2∑ y i ln i (Cordeiro, 1986, pág. 79).
i =1 µˆ i
2.12.10 Mostre que para o modelo gama com ligação potência η = µ λ ou η = ln µ , neste
último caso a matriz X tendo uma coluna de 1's, a deviance reduz-se a:
n
µˆ
S p = 2∑ ν i ln i (Cordeiro, 1986, pág. 80).
i =1 yi
2.12.11 Os últimos dois exercícios são casos particulares do resultado mais geral
n
1
2∑ (y i − µ̂ i ) µ̂ i V -1 (µ i ) = 0
i =1 a i (φ)
2.12.12 Comente o resultado obtido para a função deviance para dados binários com ligação
canônica. Use como referência bibliográfica Williams (1983).
Modelos Lineares Generalizados na Experimentação Agronômica 59
2.12.13 Mostre que para o modelo gama simples, em que todas as médias são iguais, a
deviance reduz-se à estatística clássica
y
S1 = 2n ν ln ~ ,
y
Dp
a) φˆ = (Normal e Normal Inversa)
n
1 n 2D p
b) = 1 + 1 + (Gama, apenas aproximada).
ˆ
φ 2D p 3n
2.12.17 Seja Y1 , Y2 , ..., Yn uma amostra aleatória de uma distribuição exponencial de média
µ . Sejam as hipóteses
60 Clarice G.B. Demétrio
H 0 : µ = µ0 vs H a : µ ≠ µ0 .
Mostre que:
y µo − y
a) LR = −2n ln + (teste da razão de verossimilhanças);
µo µo
n( y − µ o )
2
b) W = (teste de Wald);
y2
n( y − µ o )
2
c) E = (teste escore).
µ o2
2.12.18 Sejam Y1 , Y2 , ..., Yn variáveis independentes com distribuição de Poisson com média
µ i = µρ i −1 (i = 1, ..., n). Obter as estatísticas escore, de Wald e da razão de verossimilhanças
para o teste das hipóteses que se seguem:
a) H 0 : µ = µ 0 vs H a : µ ≠ µ 0 , quando ρ é conhecido;
3.1 Introdução
Na prática, porém, pode acontecer que após uma escolha cuidadosa de um modelo e
subseqüente ajuste a um conjunto de dados o resultado obtido seja insatisfatório. Isso pode
ocorrer em função de algum desvio sistemático entre valores observados e valores ajustados
ou, então, porque um ou mais valores são discrepantes em relação aos demais.
Desvios sistemáticos podem ser provocados pela escolha inadequada da função de
variância, da função de ligação e da matriz do modelo, ou ainda pela definição errada da
escala da variável dependente ou das covariáveis.
Discrepâncias isoladas podem ocorrer ou porque os pontos estão nos extremos da
amplitude de validade da covariável, ou porque eles estão realmente errados como resultado
de uma leitura errada ou uma transcrição mal feita, ou ainda por que algum fator não
controlado influenciou na sua obtenção.
Na prática, em geral, ocorre que há uma interação dos diferentes tipos de falhas.
Assim, por exemplo, a detecção de uma escolha errada da função de ligação pode ocorrer
porque ela está realmente errada ou porque uma ou mais covariáveis estão na escala errada ou
devido à presença de alguns pontos discrepantes. Isso faz com que a verificação da adequação
de um modelo para um determinado conjunto de dados seja um processo realmente difícil.
Maiores detalhes podem ser vistos em Atkinson (1985), Atkinson et al. (1989),
Cordeiro (1986), McCullagh & Nelder (1989), Francis, Green & Payne (1993), Paula (2000).
Clarice G.B. Demétrio 62
3.3.1 Introdução
hi = hii = xTi ( XT X) −1 xi ,
sendo x iT = [ x i1 x i 2 K x ik ] .
Uma idéia importante, também, é a da deleção (deletion), isto é, a comparação do
ajuste do modelo escolhido, considerando-se todos os pontos, com o ajuste do mesmo modelo
sem os pontos atípicos. As estatísticas obtidas pela omissão de um certo ponto i são denotadas
com um índice entre parênteses. Assim, por exemplo, s 2( i ) representa a variância residual
estimada para o modelo ajustado, excluído o ponto i.
Enquanto os erros ε i ' s são independentes e com a mesma variância, o mesmo não
ocorre com os resíduos do ajuste do modelo através de mínimos quadrados, isto é,
Assim, usar ri = ε̂i pode não ser adequado devido à heterogeneidade de variâncias.
Foram, então, propostas diferentes padronizações para sanar esse problema.
Clarice G.B. Demétrio 64
Esses resíduos são mais sensíveis que os anteriores por considerarem variâncias
distintas. Entretanto, um valor discrepante pode alterar profundamente a variância residual
dependendo do modo como se afasta do grupo maior das observações. Além disso, numerador
e denominador são variáveis dependentes, isto é, Cov ( εˆ , QMRes) ≠ 0 .
n − p −1
rsei = rsii ,
n − p − rsii2
A vantagem de usar rse i é que, sob normalidade, ele tem distribuição t de Student
com (n − p − 1) graus de liberdade. Embora não seja recomendada a prática de testes de
significância na análise de resíduos, sugere-se que a i-ésima observação seja merecedora de
α
atenção especial se |rse i | for maior do que o 1001 − -ésimo percentil da distribuição t
2n
com (n − p − 1) graus de liberdade, sendo que α , o nível de confiança, é dividido por n por
ser este o número de pontos sob análise.
Modelos Lineares Generalizados na Experimentação Agronômica 65
Discrepâncias isoladas (pontos atípicos) podem ser caracterizadas por ter h e/ou
resíduo grandes, ser inconsistente e/ou ser influente (ver pág 404, McCullagh & Nelder,
1989). Em geral, pode-se classificar uma observação como:
i) ponto de alavanca (bom ou ruim): h alto;
ii) inconsistente: o ponto não segue a tendência dos dados;
iii) outlier: h baixo e resíduo grande;
iv) influente: afeta, de forma significativa, o ajuste do modelo.
Assim, uma observação influente é aquela cuja omissão do conjunto de dados resulta
em mudanças substanciais em certos aspectos do modelo. Ela pode ser um outlier, ou não.
Uma observação pode ser influente de diversas maneiras, isto é,
- no ajuste geral do modelo;
- no conjunto de estimativas dos parâmetros;
- na estimativa de um determinado parâmetro;
- na escolha de uma transformação de uma variável explanatória.
n n
e, além disso, 0 ≤ hii ≤ 1 , ∑ hii ' = 1 e r (H) = tr (H) = ∑ hii = p .
i ' =1 i =1
Vê-se, portanto, que o valor ajustado µ$ i é a média ponderada dos valores observados
e que o peso de ponderação é o valor de hii ' . Assim, o elemento da diagonal de H é o peso
com que a observação Yi participa do processo de obtenção do valor ajustado µ̂ i . Valores
2p
com hii > , segundo Belsley et al. (1980, pág. 17) indicam observações que merecem uma
n
análise mais apurada.
1
DFBeta ( i ) = βˆ − βˆ ( i ) = ( X' X) −1 x i' εˆ i .
(1 − hi )
Não tem interpretação simples. Cook & Weisberg (1982) propuseram curvas
empíricas para o estudo dessa medida.
ou, ainda,
1 1
DFFitS(i) h 2 ri h 2
= i = i rsei
1 − hi s (1 − h ) 2 1 − hi
1
(i ) i
hi
sendo o quociente chamado potencial de influência e é uma medida da distância do
1 − hi
ponto x em relação às demais observações. Belsley et al. (1980, pág. 28) sugerem que valores
p
absolutos excedendo 2 podem identificar observações influentes.
n
i
ou, ainda,
hi 1 2
D (i ) = rsii .
(1 − hi ) p
caso de muitas covariáveis (a não ser que haja ortogonalidade entre todas). O padrão nulo
deste gráfico é uma distribuição dos resíduos em torno de zero com amplitude constante.
E (Y) = Xβ + γ u
sendo u a variável a ser adicionada (pode ser uma variável construída). O interesse está em se
saber se γ = 0 , isto é, se não há necessidade de se incluir a variável u no modelo. A partir do
sistema de equações normais
Clarice G.B. Demétrio 68
que é o coeficiente angular de uma reta que passa pela origem e em que
r = Y − Xβˆ = (I − H )Y são os resíduos de Y ajustado para X e u * = (I − H )u são os resíduos
de u ajustado para X.
O gráfico da variável adicionada (added variable plot) de r versus u * tem coeficiente
angular γˆ (diferente de r vs u). Ele pode mostrar, também, como a evidência para a inclusão
de u depende de observações individuais. Esse gráfico, portanto, é obtido a partir dos resíduos
ordinários da regressão de Y como função de todas as covariáveis exceto u = x j versus os
resíduos ordinários da regressão de u = x j como função das mesmas covariáveis usadas para
modelar Y. Assim, por exemplo, para um modelo com 3 covariáveis, o gráfico da variável
adicionada para x 3 é obtido a partir de
µˆ = βˆ 0 + βˆ1 x1 + βˆ 2 x 2 ⇒ r = Y − µˆ
e
xˆ 3 = βˆ 0 + βˆ 1 x1 + βˆ 2 x 2 ⇒ u * = x 3 − xˆ 3 .
Esse gráfico tem, também, o nome de Q-Q plot, por relacionar os valores de um
quantil amostral d (i ) versus os valores do quantil correspondente da distribuição normal.
A construção do gráfico semi-normal de probabilidades (half normal plot) é o
i + n − 0,125
resultado do conjunto de pontos obtidos por | d |( i ) versus z i , sendo z i = Φ −1 .
2n + 0,5
McCullagh & Nelder (1989) sugerem o uso do gráfico normal de probabilidades
(normal plot) para resíduos e o gráfico semi-normal de probabilidades (half normal plot) para
medidas positivas como é o caso de h (medida de leverage) e da distância de Cook
modificada.
No caso do gráfico normal de probabilidades para resíduos, espera-se que na ausência
de pontos discrepantes, o aspecto seja linear, mas não há razão para se esperar que o mesmo
aconteça quando são usados h ou a distância de Cook modificada. Os valores extremos
aparecerão nos extremos do gráfico, possivelmente com valores que desviam da tendência
indicada pelos demais.
Clarice G.B. Demétrio 70
Demétrio & Hinde (1997) apresentam um conjunto de macros que permitem fazer
esses gráficos para uma grande variedade de modelos, usando o GLIM, enquanto que Paula
(2000) faz o mesmo em SPlus.
j) Valores observados ou Resíduos versus tempo: Mesmo que o tempo não seja uma
variável incluída no modelo, gráficos de respostas (Y) ou de resíduos versus tempo devem ser
feitos sempre que possível. Esse tipo de gráfico pode levar à detecção de padrões não
suspeitados, devido ao tempo ou, então, a alguma variável altamente correlacionada com
tempo.
3.4.1 Introdução
o que é equivalente a substituir X por W 1 2 X . Note-se que, agora H depende das variáveis
explanatórias, da função de ligação e da função de variância, tornando mais difícil a
interpretação da medida de leverage. Pode ser mostrado que:
V −1 2 (µˆ − µ) ≅ HV −1 2 (Y − µ) ,
Modelos Lineares Generalizados na Experimentação Agronômica 71
a) resíduos ordinários
ri = y i − µ̂ i ;
y i − µˆ i
ri P = ,
φˆ
V (µˆ i )
wi
sendo φˆ uma estimativa consistente do parâmetro φ e wi um peso a priori (na maior parte dos casos
igual a 1);
y i − µˆ i
ri P ' = ,
φˆ
V (µˆ i ) (1 − hi )
wi
d) componentes da deviance
2 wi ~ ~
ri D = sinal(y i - µˆ i ) [ y i (θ i − θˆi ) + b(θ i ) − b(θˆi )] ;
φ
ri D
ri D ' = ;
φˆ(1 − hi )
b) Resíduos versus variáveis explanatórias não incluídas: Pode mostrar se existe uma
relação entre os resíduos do modelo ajustado e uma variável ainda não incluída no modelo.
Uma alternativa melhor para esse tipo de gráfico é o gráfico da variável adicionada (added
variable plot). O padrão nulo deste gráfico é uma distribuição dos resíduos em torno de zero
com amplitude constante.
f) Gráficos de índices: servem para localizar observações com resíduo, leverage (h),
distância de Cook modificada etc, grandes.
Modelos Lineares Generalizados na Experimentação Agronômica 73
h) Valores observados ou resíduos versus tempo: Mesmo que o tempo não seja uma
variável incluída no modelo, gráficos de respostas (Y) ou de resíduos versus tempo devem ser
feitos sempre que possível. Esse tipo de gráfico pode levar à detecção de padrões não
suspeitados, devido ao tempo ou, então, a alguma variável altamente correlacionada com
tempo.
Suponha que a função de ligação usada foi η = g(µ ) e que a verdadeira seja η = g *(µ ) .
Então,
g (µ ) = g {g * −1 (η )} = h (η ) .
u = z−η
ˆ + γˆ x ,
xλ −1
para λ ≠ 0
h (x ; λ ) = λ .
ln x para λ = 0
sendo y& a média geométrica das observações. A expansão de z (λ) em uma série de Taylor
em relação a λ 0 , conhecido, é dada por:
z ( λ ) ≅ z (λ 0 ) + ( λ − λ 0 ) u ( λ 0 ) ,
dz (λ)
sendo u(λ 0 ) = . Então,
dλ λ =λ 0
z (λ 0 ) = z (λ ) − (λ − λ 0 ) u(λ 0 ) + ε = Xβ + γu + ε .
yλ −1
Mas z (λ) = e, portanto,
λy& λ −1
y
u(1) = y ln − 1 , variável construída para testar se λ 0 = 1
y&
e
Modelos Lineares Generalizados na Experimentação Agronômica 77
ln y
u(0) = y& ln y − ln y& , variável construída para testar se λ 0 = 0 .
2
Como − γ = λ − λ 0 , tem-se que uma estimativa para λ pode ser obtida por
λˆ = λ 0 − γˆ . Usa-se, em geral, um valor para λ próximo de λˆ que tenha uma interpretação
prática.
E (Y) = ∑ β j x j + β j x λj ' = z (λ ) .
j≠ j'
z ( λ ) ≅ z (λ 0 ) + ( λ − λ 0 ) u ( λ 0 )
dz (λ)
sendo u(λ 0 ) = . Então,
dλ λ =λ 0
dz ( λ )
pois ≅ β j' x λj ' ln x j ' . Portanto, testar λ = λ 0 é equivalente a testar γ = 0 para a regressão
dλ
com a variável construída u(λ 0 ) = x λj '0 ln x j ' com x λj '0 já no modelo. Para λ 0 = 1 tem-se
p
y
u(1) = ∑ βˆ x lnxj j j
− y ln − 1 .
j =2 y&
Clarice G.B. Demétrio 78
! Entrada de dados....
$Yvar Y $
$Fit X1+X2 $
$Extract %rs $Ca R= %rs $
$Yvar X3 $
$Fit . $
$Extract %rs $Ca U = %rs $
$Graph R U $
$Yvar Y $
$Fit X<2> $
$Extract %pe %rs $Ca R* = %rs + %pe(2) $
$Graph R* X $
3.8 Exercícios
3.8.2 Os dados da Tabela 15 referem-se a medidas de diâmetro à altura do peito (X1) e altura
(X2) de árvores em pé e de volumes (Y) das árvores derrubadas. O objetivo desse tipo de
experimento é verificar de que forma essas variáveis estão relacionadas para, através de
medidas nas árvores em pé, poder se predizer o volume de madeira em uma área de floresta.
Pede-se:
Amostra X1 X2 Y
1 8,3 70 10,3
2 8,6 65 10,3
3 8,8 63 10,2
4 10,5 72 16,4
5 10,7 81 18,8
6 10,8 83 19,7
7 11,0 66 15,6
8 11,0 75 18,2
9 11,1 80 22,6
10 11,2 75 19,9
11 11,3 79 24,2
12 11,4 76 21,0
13 11,4 76 21,4
14 11,7 69 21,3
15 12,0 75 19,1
16 12,9 74 22,2
17 12,9 85 33,8
18 13,3 86 27,4
19 13,7 71 25,7
20 13,8 64 24,9
21 14,0 78 34,5
22 14,2 80 31,7
23 14,5 74 36,3
24 16,0 72 38,3
25 16,3 77 42,6
26 17,3 81 55,4
27 17,5 82 55,7
28 17,9 80 58,3
29 18,0 80 51,5
30 18,0 80 51,0
31 20,6 87 77,0
Fonte: Ryan et al. (1976).
Pede-se:
a) ajuste o modelo logístico linear e faça o teste para a função de ligação;
b) ajuste o modelo complemento log-log e faça o teste para a função de ligação;
c) faça o gráfico da variável adicionada para os itens (a) e (b);
d) usando a família de funções de ligação de Aranda-Ordaz, obtenha a variável construída e
estime λ ;
e) ajuste o modelo logístico com preditor linear quadrático e faça o teste para a função de
]
ligação.
3.8.4 Considere
µλ − 1
para λ ≠ 0
η = g (µ; λ ) = λ .
ln µ para λ = 0
Aplicações
Como já foi visto no capítulo 2, ensaios do tipo dose-resposta são muito usados na
área de toxicologia. Em geral os dados resultantes são proporções e os modelos mais usados
são: logístico, probit e complemento log-log. Tais modelos, ajustados a conjuntos de dados,
no caso em que o preditor linear é uma regressão linear simples, podem ser usados para
sumarizá-los através do par de estimativas (βˆ 1 , βˆ 2 ) dos parâmetros e formam a base para
comparação de diferentes conjuntos de dados (Morgan, 1992). Assim, por exemplo, podem
ser usados para a comparação de potência de diferentes produtos (inseticidas, fungicidas,
herbicidas etc).
Em muitos casos, porém, o interesse está na determinação de estimativas de doses
efetivas, θ p (DE100p), que são doses, as quais sob o modelo ajustado causam uma mudança
de estado em 100p% dos indivíduos. Um exemplo muito comum é a determinação da DL50
(também chamada dose mediana) que é a dose que causa 50% de mortalidade dos indivíduos.
Assim, para os modelos citados tem-se:
p ˆ 1 p ˆ
logit ( p ) = ln = β 1 + βˆ 2θˆ p ⇒ θˆ p = ln − β 1 , logístico;
1 − p βˆ 2 1 − p
1
ln[− ln (1 − p )] = βˆ 1 + βˆ 2θˆ p ⇒ θˆ p =
ˆ
{ }
ln[− ln (1 − p )] − βˆ 1 , complemento log-log.
β2
βˆ
Observação: Para qualquer modelo simétrico verifica-se que θˆ50 = − 1 .
βˆ 2
De uma forma geral, tem-se:
1
θˆ p = [ F −1 ( p ) − βˆ 1 ] ,
βˆ
2
( )
sendo p = F βˆ 1 + βˆ 2 θˆ p . Se θˆ p = ln (dˆ p ) , então, dˆ p = exp{θˆ p } .
Modelos Lineares Generalizados na Experimentação Agronômica 83
( )
−1 λ
F βˆ1 + βˆ 2θˆ p = 1 − 1 + λ e 1 2 p
βˆ + βˆ θˆ
= p.
Então,
−1 λ
1 − p = 1 + λ e 1 2 p
βˆ + βˆ θˆ βˆ1 + βˆ 2θˆ p
⇒ (1 − p )−λ = 1 + λe
ou, ainda,
1 1 1 1
− = F −1 ( p ) .
βˆ + βˆ θˆ
− =e 1 2 p ⇒ βˆ 1 + βˆ 2θˆ p = ln
λ (1 − p ) λ (1 − p )
λ λ
λ λ
Portanto,
1 1 1
θˆ p = ln − − βˆ 1
βˆ 2 λ (1 − p )λ
λ
e, para p = 0,50,
1 1 1 ˆ 1 2λ − 1 ˆ
θˆ50 = ln − − β1 ⇒ θˆ50 = ln − β1 .
βˆ 2 λ (1 2 )λ λ βˆ 2 λ
π
i) η = ln = α j + β j x - retas concorrentes;
1− π
π
ii) η = ln = α j + β x - retas paralelas;
1− π
84 Clarice G.B. Demétrio
π
iii) η = ln = α + β j x - retas com intercepto comum;
1− π
π
iv) η = ln = α + β x - retas coincidentes,
1− π
sendo que j =1, 2, ..., J. O ajuste desses modelos aos dados é testado através das diferenças
das deviances residuais. No caso em que existem evidências de que o modelo de retas
paralelas ajusta-se bem aos dados, tem-se, então, que a dose efetiva ( θˆ (j p ) ) para 100p% dos
indivíduos é obtida por:
p
constante = ln ˆ j + βˆ θˆ (j p ) , j = 1, 2, ..., J.
= α
1− p
Portanto, para j ≠ j' , tem-se
α
ˆ j −α ˆ j'
= θˆ (j'p ) − θˆ (j p ) .
ˆβ
Se x = ln(dose) = ln(d) , então,
α
ˆ j −α ˆ j' dˆ (p)
j' αˆ j −α ˆ j' DE50 j'
= ln (p) = ln ρˆ jj' ⇒ ρˆ jj' = exp =
DE50 ,
βˆ dˆ j βˆ j
Considerações:
- variável resposta: Yi = número de insetos mortos em amostras de tamanho mi = 20 ;
- distribuição: Binomial;
- parte sistemática: inteiramente casualizado no esquema fatorial, modelos de regressão;
- objetivo: determinação de doses letais para machos e fêmeas e verificação se são diferentes.
Vê-se que existem evidências de que o modelo com preditor linear com dois fatores,
sexo (com dois níveis, j = 1, 2) e dose (com 6 níveis, k = 1, .., 6, em princípio sem levar em
consideração o fato de serem quantitativos), ajusta-se bem aos dados, enquanto que os
modelos mais simples, não.
Pela Tabela 20, vê-se que existem evidências que os modelos com retas concorrentes,
paralelas e com intercepto comum ajustam-se bem aos dados. Tem-se, ainda, que as
diferenças de deviances entre os modelos com retas paralelas e retas concorrentes (6,76 – 4,99
= 1,77) e entre os modelos com intercepto comum e retas concorrentes (5,04 – 4,99 = 0,05),
ambas com 1 grau de liberdade, não são estatisticamente significativas. Utilizando de
parcimônia e facilidade de interpretação opta-se pelo modelo de retas paralelas. A Tabela 21
traz a Análise de deviance para o modelo escolhido.
πˆ
ηˆ = ln = −2,372 + 1,064 log 2 (dose) ⇒ DL 50 = 4 ,68 e DL 90 = 19 ,62
1 − πˆ
e
πˆ
ηˆ = ln = −3,473 + 1,064 log 2 (dose) ⇒ DL 50 = 9 ,60 e DL 90 = 40 ,18 .
1 − πˆ
Verifica-se que as fêmeas são mais resistentes, pois para matar 100p% das fêmeas há
necessidade de uma dose 2 vezes maior do que para matar 100p% dos machos.Vê-se, que a
dose letal para p = 0,9 para as fêmeas está fora do intervalo estudado o que é perigoso pois
acima da dose 32 não se sabe se o comportamento será o mesmo. Se o interesse estiver na
estimação dessa dose há necessidade de se aumentar a amplitude de doses para fêmeas em um
novo experimento. Necessária se faz ainda uma análise de residuos e diagnósticos.
A Figura 5 mostra o gráfico das curvas ajustadas e os valores observados.
Modelos Lineares Generalizados na Experimentação Agronômica 87
Considerações:
- variável resposta: Yi = número de insetos mortos em amostras de tamanho mi ;
- distribuição: binomial;
- parte sistemática: inteiramente casualizado, modelos de regressão;
- objetivo: determinação de doses letais.
Vê-se que, em uma primeira análise, existem evidências de que os modelos com
preditores lineares dados por uma regressão linear simples, por uma regressão linear
quadrática e aquele usando dose como fator qualitativo ajustam-se bem aos dados. Entretanto,
ao se considerar a diferença de deviances para o modelo com preditor dado por uma regressão
linear simples e por uma regressão linear quadrática (12,51-7,93 = 4,58) verifica-se que
existem evidências de um ajuste mais significativo da regressão linear quadrática. Essa
diferença pode ser explicada, pois como foi visto, a aproximação assintótica da distribuição
da deviance residual de uma distribuição χ 2 pode ser pobre. Já a distribuição da diferença de
deviances residuais tem propriedades melhores. Verifica-se, ainda que o teste para a função
de ligação após a regressão linear (coincide, neste caso, com o teste para a adição do termo
quadrático) indica a não adequação da função de ligação logística, enquanto que após a
regressão linear quadrática indica a adequação. Necessária se faz ainda uma análise de
residuos e diagnósticos.
Tabela 24: Análise de Deviance (Logístico)
Causa de variação g.l. Deviances Valor de p
Regressão linear 1 276,60 < 0,0001
(Função de ligação) (1) (4,58) 0,0323
Regressão quadrática 1 4,58 0,0323
(Função de ligação) (1) (0,04) 0,8415
(Desvios) (5) (2,99) 0,7015
(Doses) (7) (284,20) < 0,0001
Resíduo 13 7,93 0,8481
Total 15 289,14
Tem-se, então, a partir do modelo logístico com preditor linear dado por uma
regressão linear quadrática
πˆ
ηˆ = ln = 7,968 − 0,5166 dose + 0,006372 dose ⇒ LD 50 = 60 ,35 e LD 90 = 67 ,80 .
2
1 − πˆ
Note que para a obtenção das doses letais há a necessidade de se resolver uma equação
de segundo grau. Como solução de
0,5
ln = ln(1) = 0 = 7,968 − 0,5166 θ + 0,006372 θ 2
1 - 0,5
Modelos Lineares Generalizados na Experimentação Agronômica 89
Vê-se que, em uma primeira análise, existem evidências de que os modelos com
preditores lineares dados por uma regressão linear simples e aquele usando dose como fator
qualitativo ajustam-se bem aos dados. Além disso, ao se considerar a diferença de deviances
para o modelo com preditor dado por uma regressão linear simples e dose como fator
qualitativo (8,67 - 4,94 = 3,73) existem evidências de que ela não é significativa. Também, o
teste para a função de ligação após a regressão linear indica a adequação da função de ligação
complemento log-log. Necessária se faz ainda uma análise de resíduos e diagnósticos.
Tabela 26: Análise de Deviance (Complemento log-log)
Causa de variação g.l. Deviances Valor de p
Regressão linear 1 280,50 < 0,0001
(Função de ligação) (1) (0,37) 0,5430
(Desvios) (6) (3,73) 0,7131
(Doses) (7) (284,20) < 0,0001
Resíduo 14 8,67 0,8516
Total 15 289,14
Tem-se, então, a partir do modelo complemento log-log com preditor linear dado por
uma regressão linear simples
A Figura 6 mostra o gráfico das curvas ajustadas usando o modelo logístico com
preditor linear dado por uma regressão linear quadrática e o modelo complemento log-log
com preditor linear dado por uma regressão linear simples e os valores observados.
90 Clarice G.B. Demétrio
Considerações:
- variável resposta: Yi = número de gemas florais em totais de ni gemas;
- distribuição: binomial;
π
- ligação: função logística η = ln ;
1− π
- parte sistemática: delineamento inteiramente casualizado e modelos de análise de variância
com η = α j + β j x , isto é, supondo uma equação linear com coeficientes linear e angular
diferentes para as três variedades, sendo x, o número de frutos no ano anterior;
- objetivo: verificar se o número de frutos de um ano tem influência na produção do ano
seguinte e se isso depende da variedade.
Vê-se que existem evidências de que os modelos com retas paralelas e com retas
concorrentes ajustam-se bem aos dados, enquanto que os outros modelos, não. Além disso, ao
se considerar a diferença de deviances para o modelo com retas paralelas e com retas
concorrentes (8,80 – 7,87 = 0,93) existem evidências de que ela não é significativa. A Tabela
29 traz a Análise de deviance para o modelo de retas paralelas. Vê-se que existem evidências
para o efeito de variedades e para o efeito de regressão linear.
^ ^
α 2 − α 1 = −1,510 e s(α 2 − α 1 ) = 0 ,1566
^ ^
α 3 − α 1 = −1,258 e s(α 3 − α 1 ) = 0 ,1563
^
α 3 − α 2 = 0 ,252
^ ^ ^ ^ ^
V(α 3 − α 2 ) = Var (α 2 − α 1 ) + Var (α 3 − α 1 ) − 2Cov α 2 − α 1 , α 3 − α1
= 0,02452 + 0,02443 − 2 ⋅ 0,00725 = 0,03445.
e, portanto,
^
s(α 3 − α 2 ) = 0,1856 .
Logo,
^ − 1,510
t (α 2 − α 1 ) = = −9,64
0,1566
^ − 1,258
t (α 3 − α 1 ) = = −8,05
0,1563
^ 0,252
t (α 3 − α 2 ) = = 1,36,
0,1856
que comparados com o valor tabelado t 11; 0,05 = 2,20 da distribuição t de Student mostram
que as variedades Cox e Golden Delicious não diferem entre si (como os contrastes feitos não
são ortogonais, não se tem o nível conjunto de significância para as comparações feitas).
Devido a esse resultado um novo modelo foi usado considerando-se os dados das variedades
2 e 3 como se fosse uma única variedade. A diferença entre as deviances residuais, (10,64 -
8,80 = 1,84) indica que existem evidências de que as variedades 2 e 3 comportam-se de forma
semelhante. Os resultados obtidos para a análise de deviance estão na Tabela 30.
e 0 ,3605−0 ,3302 x
0 ,3605− 0 ,3302 x
para i = 1, K , 5
1 + e
π
ˆi =
−1 ,0285− 0 ,3302 x
e para i = 6, K,15 .
1 + e −1,0285−0 ,3302 x
Figura 7. Modelos logístico para três e dois interceptos diferentes e os valores observados
Considerações:
- variável resposta: Yi = número de insetos mortos em amostras de tamanho mi = 1 ;
- distribuição: Bernoulli (caso particular da Binomial);
- ligação: função logística;
- parte sistemática: delineamento em blocos casualizados e modelos de análise de variância
com preditor linear: η = µ + δ l + α i + β j + γ k + αβij + αγ ik + βγ ik + αβγ ijk ;
- objetivo: verificar a influência dos fatores sobre a regeneracão e se existe interação entre
eles.
η = µ + δ l + α j + γ k + +αγ jk ,
e os resultados estão na Tabela 34. Necessária se faz, ainda, uma análise de resíduos e
diagnósticos.
96 Clarice G.B. Demétrio
Considerações:
- variável resposta: Yi = número de brotos;
- distribuição: Poisson;
- ligação: função logarítmica, η = ln(µ) ;
- parte sistemática: delineamento inteiramente casualizado, modelos de análise de variância
com preditor linear: η = µ + α i + β j + αβ ij + ε k
- objetivo: verificar se existe interação entre meio de cultura e quantidade de hormônio e se
influenciam o número de brotos.
Modelos Lineares Generalizados na Experimentação Agronômica 97
Verifica-se que a diferença entre as deviances obtidas para Entre recipientes e Entre
plantas dentro de recipientes não é significativa. Adotou-se, então, como preditor linear
η = µ + α i + β j + αβij ,
A deviance residual mostra que existem evidências de que o modelo usado está se
ajustando relativamente bem aos dados. Há necessidade, porém, de se utilizarem outras
técnicas de diagnósticos como complementação. Vê-se, ainda, que a interação entre meios de
cultura e níveis de hormônio é significativa. Ao se observar o quadro de médias apresentado
98 Clarice G.B. Demétrio
na Tabela 39 verifica-se que a interação está sendo significativa devido ao meio de cultura C. O
exame da Tabela 36, indica duas parcelas em destaque cuja influência na análise mereceria ser melhor
estudada.
Tabela 39: Quadro de médias.
Meios de Níveis de Hormônio
Médias
Cultura Baixo Alto
A 2,9 2,6 2,7
B 3,0 2,9 2,9
C 1,8 4,3 2,8
Médias 2,5 3,2
isto é, 52 partículas de vírus por unidade de volume. Um intervalo de confiança para λ com
um coeficiente de confiança de 95% de probabilidade é dado por
$return
104 Clarice G.B. Demétrio
APÊNDICE B
B.3.1 - Para Cox, Golden e Crispin diferentes B.3.2 - Para Cox e Golden reunidas
data macieira; data macieira2;
input var $ X N Y; input var $ X N Y;
p=y/n; p=y/n;
datalines; datalines;
Cox 0 34 12 Crispin 0 69 42
Cox 1 92 15 Crispin 1 93 43
Cox 2 133 18 Crispin 2 147 59
Cox 3 146 14 Crispin 3 149 57
Cox 4 111 9 Crispin 4 151 43
Golden 0 21 6 CoxGold 0 34 12
Golden 1 89 20 CoxGold 1 92 15
Golden 2 118 20 CoxGold 2 133 18
Golden 3 124 21 CoxGold 3 146 14
Golden 4 81 4 CoxGold 4 111 9
Crispin 0 69 42 CoxGold 0 21 6
Crispin 1 93 43 CoxGold 1 89 20
Crispin 2 147 59 CoxGold 2 118 20
Crispin 3 149 57 CoxGold 3 124 21
Crispin 4 151 43 CoxGold 4 81 4
; ;
title 'Modelo Completo com Intercepto'; title 'Modelo Reduzido 1 com Intercepto';
proc genmod order=data; proc genmod order=data;
class var; class var;
model y/n=var|x /dist=bin type1 type3 covb; model y/n=var x /dist=bin type1 type3 covb;
run; estimate 'Crispin vs CoxGold' var 1 -1;
title; run;
title;
title 'Modelo Completo sem Intercepto'; title 'Modelo Reduzido 1 sem Intercepto';
proc genmod order=data; proc genmod order=data;
class var; class var;
model y/n=var|x /noint dist=bin type1 type3 model y/n=var x /noint dist=bin type1 type3 covb;
covb; estimate 'Crispin vs CoxGold' var 1 -1;
run; run;
title; title;
AITKIN, M.; ANDERSON; D.; FRANCIS, B.; HINDE, J. Statistical Modelling in GLIM.
New York: Oxford University Press, 1989. 374p.
BELSLEY, D. A.; KUH, E.; WELSCH, R. E. Regression Diagnostics. New York: John
Wiley & Sons, 1980.
BLISS, C. I. The calculation of the dosage-mortality curve. Annals Applied Biology, 22,
p.134-167, 1935.
BUSE, A. The likelihood ratio, Wald and Lagrange multiplier tests: An expository note. The
American Statistician, 36, 3, p.153-57, 1982.
COLLETT, D. Modelling Binary Data. London: Chapman & Hall, 1991. 369p.
COX, D. R.; SNELL, E. J. A general definition of residuals (with discussion). Journal of the
Royal Statistical Society B, 30, p.248-275, 1968.
COX, D. R.; HINKLEY, D.V. Theoretical Statistics. Cambridge: Chapman and Hall, 3rd ed.,
1986. 174p.
CORDEIRO, G.M. Modelos Lineares Generalizados. Campinas, VII SINAPE, 1986. 286p.
DYKE, G. V.; PATTERSON, H. D. Analysis of factorial arrangements when the data are
proportions. Biometrics, 8, p.1-12, 1952.
FIRTH, D. Generalized Linear models. In D. Hinkley, N., N. Reid, and E. Snell (Eds.),
Statistical Theory and Modelling, p.55-82, Chapman & Hall, 1991.
FISHER, R. A.; YATES, F. Statistical Tables for Biological, Agricultural and Medical
Research. Edinburgh: Oliver & Boyd, 1970.
FRANCIS, B. J.; GREEN, M.; PAYNE, C. The GLIM System. Release 4 Manual. New
York: Oxford University Press, 1993.
MARTIN, J.T. The problem of the evaluation of rotenone-containing plants. VI: The toxicity
of 1-elliptone and of poisons applied jointly, with further observations on the rotenone
equivalent method of assessing the toxicity of derris root. Annals of Applied Biology,
29, p 69-81, 1942.
McCULLOCH, C. E.; SEARLE, S.R. Generalized, Linear, and Mixed Models. New York:
John Wiley & Sons, 2000. 325p.
MORGAN, B. J. T. Analysis of Quantal Response Data. London: Chapman & Hall, 1992.
RIDOUT, M. S. Using Generalized Linear Models to Analyze Data from Agricultural, and
Horticultural Experiments. Minicurso lecionado no Departamento de Matemática e
Estatística da ESALQ/USP, 1991 (não publicado).
RYAN, T. A.; JOINER, B. L.; RYAN, B. F. Minitab Student Handbook. North Scituate,
Mass: Duxbury Press, 1976.
SAHA, A.; DONG, D. Estimating nested count data models. Oxford Bulletin of Economics
& Statistics, 59, p.423-430, 1997.
SEARLE, S. R. Matrix Algebrebra Useful for Statistics. New York: John Wiley & Sons,
1982
SAS Institute. SAS/STAT User’s Guide 8.0. Cary, N. C.: SAS Institute Inc., 1999.
SILVEIRA NETO, S.; NAKANO, O.; BARBIN, D.; VILLA NOVA, N. A. Manual de
Ecologia dos Insetos. São Paulo: Ed. Agronômica 'Ceres', 1976. 419p.
SILVEY, S. D. Statistical Inference. London: Chapman and Hall, 2nd ed., 1975. 191p.
SMYTH, G. K. Generalized linear models with varying dispersion. Journal of the Royal
Statistical Society B, London, 51, 1, p.47-60, 1989.
WALD, A. Tests os statistical hypotheses concerning several parameters when the number of
observations is large. Trans. Amer. Math. Soc., 54, p.426-482, 1943.
WEISBERG, S. Applied Linear Regression. New York: John Wiley & Sons, 2nd ed. 1985.
324p.
WILLIAMS, D.A. The Use of the deviance to test the goodness of fit of a logistic-linear
model to binary data". The GLIM Newsletter, 6, p.60-62, 1983.
WILLIAMS, D.A. Generalized Linear model diagnostics using the deviance and "single-case
deletions". Applied Statistics, 36, p.181-191, 1987.
1.5.1 Suponha que X tenha distribuição de Poisson com parâmetro Λ .Suponha ainda que Λ seja uma
variável aleatória com distribuição exponencial de parâmetro µ . Pede-se:
a) a distribuição marginal de X;
b) a densidade condicional de Λ dado X = k.
1.5.2 O número de acidentes em que se envolve um motorista durante um ano é uma variável aleatória
Y tendo distribuição de Poisson com parâmetro Λ . Suponha ainda que Λ seja uma variável aleatória
com distribuição Gama (α , β ). Pede-se:
a) a distribuição marginal de Y;
b) a densidade condicional de Λ dado Y = k;
c) a média e a variância de Y usando argumentos de esperança e variância condicionais;
d) o coeficiente de correlação entre Y e Λ.
1.5.4 Seja X1, X2, ..., Xn uma amostra aleatória de X ~ B(p). Suponha que p é uma variável aleatória
com distribuição Beta (α , β ).
1.5.6 Seja X1, X2, ... uma seqüência de variáveis aleatórias independentes e identicamente distribuídas
segundo uma distribuição exponencial de parâmetro λ > 0. Defina Y = 0 se N = 0 e Y = X1 + X2 + .....
+ XN se N = 1, 2, 3, ... , onde N é uma variável tendo distribuição Geométrica de parâmetro p, isto é,
P(N = n) = pqn – 1 IA(n), A = {1, 2, 3, ...}. Ache a distribuição de Y.
1.5.7 Seja X ~ B(N, p) onde N ~ Bin(m, a). Mostre que X ~ Bin(m, pa).
1.5.8 Suponha que X | N = n ~ Bin(n, p) e que N ~ Poisson( λ ). Mostre que X ~ Poisson( λ p).
1.5.9 Suponha que X | R = r ~ Binneg(r,p) e que R ~ Geométrica( β ), sendo A = {1, 2, 3....}. Mostre
que a distribuição marginal de X é geométrica com parâmetro c = (1- β ).p/ (1 - β p) e A = {0, 1, 2,
3...}.
Obs.: A = { x | f(x) = P ( X = x ) > 0}.
1.5.10 O número de acidentes por semana em uma usina de açúcar é uma variável aleatória com
distribuição de Poisson com média 2.O número de empregados acidentados em diferentes acidentes
são independentemente distribuídos com média 3 e variância 4. Determine a média e a variância do
número de empregados acidentados por semana.
1.5.11 Solomon (1983) detalha o seguinte modelo biológico. Suponha que cada um de um número
aleatório, N, de insetos ponha Xi ovos, onde as Xi´s são independentes e identicamente distribuídas. 0
número total de ovos postos é :
∑
N
H= i =1
Xi .
É muito comum supor que N ~ Poisson ( λ ). Além disso vamos supor ainda que cada Xi tenha uma
distribuição logarítmica de parâmetro p, isto é,:
1 (1 − p) x
P( X = x ) = - IA(x), sendo A={1,2,3....}.
ln( p ) x
Mostre que a distribuição de H ~ Binneg(r, p), em que r = - λ /ln(p).
1.5.12 Se Y | X = x ~ N (x, x2 ) e X ~ U (0, 1). Achar:
a) E(Y) e Var (Y);
b) a distribuição conjunta de (X, Y);
c) a marginal de Y.
2
1.5.13 Seja f(x,y) = IA(x,y), sendo A = {1, 2, ...., n} x {1, 2, ..., x}. Achar:
n(n + 1)
a) E(X | Y = y) e E (Y | X = x);
b) ρ (X,Y).
1.5.14 Seja f(x ,y) = ( x + y) I A(x , y), sendo A = (0, 1) x (0, 1). Calcular:
a) E(X), Var(X), E(Y), Var(Y);
b) E(X | Y = y) e Var(X | Y = y).
1.5.15 Sejam X e Y variáveis aleatórias relacionadas com ovelhas de um rebanho da raça Corriedale
assim definidas.
X : Cordeiros nascidos por ovelha parida;
Y : Cordeiros desmamados por ovelha parida.
x
y
1 2
0 0,15 0,05
1 0,50 0,20
2 0 0,10
n 10 11 12 13 14 15
P(N = n) 0,05 0,10 0,10 0,20 0,35 0,20
A probabilidade de que qualquer peça em particular seja defeituosa é a mesma para todas as peças
igual a 0,10. Se X representar o número de peças defeituosas recebidas pela loja durante o dia, qual
será a média e a variância de X?
1.5.17 Suponha que o fornecimento energético (quilowatts) a uma companhia hidrelétrica, durante um
período especificado, seja uma variável aleatória X, a qual admitiremos ter uma distribuição
uniforme sobre [10, 30]. A demanda da potência (quilowatts) é também uma variável aleatória Y, que
admitiremos ser uniformemente distribuída sobre [10,20]. Deste modo, em média, mais potência é
fornecida do que é demandada, porque E(X) = 20 e E(Y) = 15. Para cada quilowatt fornecido, a
companhia tem um lucro de US$ 0,03. Se a demanda exceder a oferta, a companhia obterá potência
adicional de outra fonte, tendo um lucro de US$ 0,01 por quilowatt desta potência fornecida. Qual
será o lucro esperado, durante o período especificado?
1.5.18 Suponha que o peso do filho de um homem com x quilos seja uma variável aleatória
normalmente distribuída com média (x +1) e variância 4. Você vai prever o peso do filho de um
homem com 72 quilos. Qual a melhor a previsão?
1.5.19 Um rato está preso em um labirinto. Nesse local há 3 portas. A primeira porta leva a um túnel
que após 3 minutos o levará para a liberdade. A segunda porta o levará a um outro túnel que o trará de
volta ao labirinto após 5 minutos. A terceira porta o levará par e um outro túnel que o trará de volta
após 7 minutos. Se supusermos que em todas as vezes o ratinho escolherá uma das portas com igual
probabilidade determine a média e a variância do tempo gasto pelo rato até alcançar a liberdade?