Documente Academic
Documente Profesional
Documente Cultură
Raydonal Ospina
Departamento de Estatística - CCEN/UFPE
Gustavo H. Esteves
Departamento de Estatística - CCT/UEPB
Introdução
Censura e Truncamento
Teoria básica sobre o truncamento
Introdução
Censura e Truncamento
Teoria básica sobre o truncamento
Conteúdo
Introdução
Censura e Truncamento
Teoria básica sobre o truncamento
Introdução
Censura e Truncamento
Censura e truncamento são problemas muito comuns em trabalhos aplicados de
diversas áreas, tais como Medicina, Epidemiologia ou indústria. Entretanto, eles são
coisas diferentes!
I Truncamento: ocorre quando o plano amostral do estudo inclui apenas os itens que
Alguns Exemplos
A seguir apresentamos alguns exemplos de estudos onde aparecem dados com censura
e/ou truncamento.
Conteúdo
Introdução
Censura e Truncamento
Teoria básica sobre o truncamento
Vamos considerar aqui apenas o caso contínuo, mas a extensão para o caso discreto é
natural.
Considerando agora uma nova v.a. X como a versão truncada de Y no intervalo [a, b],
com −∞ < a < b < ∞. Temos que as principais propriedades de X são dadas por:
g(x)
f (x) = , a ≤ x ≤ b;
G(b) − G(a)
Z b
E(X) = xf (x)dx;
a
Z b
VAR(X) = [x − E(X)]2 f (x)dx;
a
G{max[min(x, b), a]} − G(a)
F (x) = ;
G(b) − G(a)
Considerando agora uma nova v.a. X como a versão truncada de Y no intervalo [a, b],
com −∞ < a < b < ∞. Temos que as principais propriedades de X são dadas por:
g(x)
f (x) = , a ≤ x ≤ b;
G(b) − G(a)
Z b
E(X) = xf (x)dx;
a
Z b
VAR(X) = [x − E(X)]2 f (x)dx;
a
G{max[min(x, b), a]} − G(a)
F (x) = ;
G(b) − G(a)
onde f (x), E(X), VAR(X) e F (x) representam a f.d.p., esperança, variância e a f.d.a
da variável X . Naturalmente, para todos os valores de x ∈
/ [a, b], tem-se que f (x) = 0.
I Uma distribuição truncada pode ser pensada como uma distribuição condicionada
Conteúdo
Introdução
Censura e Truncamento
Teoria básica sobre o truncamento
A partir daqui vamos apresentar as principais propriedades para alguns dos principais
modelos probabilísticos contínuos, especicamente:
I Modelo Normal;
I Modelo Exponencial;
I Modelo de Cauchy.
Distribuição Uniforme
Seja X uma v.a. com distribuição uniforme em [α, β], isto é, X ∼ U [α, β].
0,
para x<α
x−α
G(x) = , para x ∈ [α, β) .
β−α
1, para x≥β
g(y) 1 1
fY (y) = = = .
G(t) − G(s) (t − α) − (s − α) t−s
g(y) 1 1
fY (y) = = = .
G(t) − G(s) (t − α) − (s − α) t−s
I Logo, Y ∼ U [s, t], isto é, a forma truncada de uma uniforme é uma nova uniforme
restrita ao intervalo de truncamento.
I Desta maneira as demais propriedades, tais como esperança, variância e etc decor-
Conteúdo
Introdução
Censura e Truncamento
Teoria básica sobre o truncamento
Distribuição Normal
1 1 x−µ
g(x) = √ exp − .
2πσ 2 σ
1
Z x
1 t−µ
G(x) = √ exp − dt.
2πσ −∞ 2 σ
Agora, seja Y a versão truncada de X em [a, b], denotada por N T (µ, σ 2 , a, b), então
" 2 #
1 1 y−µ
√ exp −
2πσ 2 σ
fY (y) = , para a ≤ y ≤ b,
G(b) − G(a)
0 caso contrário.
Agora, seja Y a versão truncada de X em [a, b], denotada por N T (µ, σ 2 , a, b), então
" 2 #
1 1 y−µ
√ exp −
2πσ 2 σ
fY (y) = , para a ≤ y ≤ b,
G(b) − G(a)
0 caso contrário.
Agora, seja Y a versão truncada de X em [a, b], denotada por N T (µ, σ 2 , a, b), então
" 2 #
1 1 y−µ
√ exp −
2πσ 2 σ
fY (y) = , para a ≤ y ≤ b,
G(b) − G(a)
0 caso contrário.
Truncamentos Simples
I Para o caso do truncamento simples acima, a f.d.p é dada por:
g(x)
fY (y) = fX (x|x < b) = .
G(b)
g(x)
fY (y) = fX (x|x > a) = .
1 − G(a)
Truncamentos Simples
I Para o caso do truncamento simples acima, a f.d.p é dada por:
g(x)
fY (y) = fX (x|x < b) = .
G(b)
g(x)
fY (y) = fX (x|x > a) = .
1 − G(a)
Esperança Matemática de Y
I A partir da denição, calcula-se a esperança matemática da variável aleatória Y:
2
√y exp − 21 y−µ
Z ∞ Z b 2πσ σ
E(Y ) = yfY (y)dy = dy,
−∞ a G(b) − G(a)
I com a transformação z = (y − µ)/σ , podemos simplicar o resultado
h 2i
µ+zσ
Z b−µ
σ
√ exp − z2
2π
E(Y ) = dz
a−µ
σ
G(b) − G(a)
a−µ b−µ
ϕ −ϕ
σ σ
=µ+ σ,
G(b) − G(a)
Variância de Y
I Após alguns cálculos, chegamos a variância de Y , dada por:
a−µ
σ
ϕ a−µ
σ
− b−µ σ
ϕ b−µσ
VAR(Y ) = 1 + σ2
G(b) − G(a)
2
a−µ b−µ
ϕ σ
−ϕ σ
− σ2 .
G(b) − G(a)
ϕ(β)
E(Y ) = E(X | X < b) = µ − σ ,
G(b)
" 2 #
ϕ(β) ϕ(β)
VAR(Y ) = VAR(X | X < b) = σ 2 1 − β − ,
G(b) G(b)
em que β = (b − µ)/σ.
Observações importantes
Do que foi exposto nos resultados anteriores é possível vericar facilmente as
propriedades enumeradas a seguir.
Observações importantes
Do que foi exposto nos resultados anteriores é possível vericar facilmente as
propriedades enumeradas a seguir.
Observações importantes
Do que foi exposto nos resultados anteriores é possível vericar facilmente as
propriedades enumeradas a seguir.
Observações importantes
Do que foi exposto nos resultados anteriores é possível vericar facilmente as
propriedades enumeradas a seguir.
Distribuições Truncadas no R
Conteúdo
Introdução
Censura e Truncamento
Teoria básica sobre o truncamento
Distribuição Exponencial
x
G(x) = 1 − exp − ,
λ
com E(X) = λ e VAR(X) = λ2 .
Agora, seja Y a versão truncada de X em [a, b], denotada por ExpT (λ, a, b), então
1
exp − y
f (y) = h λ i λ
exp − λb a
1− − 1− exp − λ
y
exp − λ
= h i .
a
− exp − λb
λ exp − λ
Agora, seja Y a versão truncada de X em [a, b], denotada por ExpT (λ, a, b), então
1
exp − y
f (y) = h λ i λ
exp − λb a
1− − 1− exp − λ
y
exp − λ
= h i .
a
− exp − λb
λ exp − λ
y
f (y) = c exp − , a ≤ y ≤ b,
λ
com
1
c= h i .
a
− exp − λb
λ exp − λ
Z b Z b
y
E(Y ) = y exp −
yf (y)dy = c dy
a a λ
a
− b exp − λb
a exp − λ
=λ+ ,
a
− exp − λb
exp − λ
Z b Z
y b
E(Y 2 ) = y 2 exp −
y 2 f (y)dy = c dy
a a λ
a
[a + 2λa + 2λ2 ] − exp − λb [b2 + 2λb + 2λ2 ]
2
exp − λ
= ,
a
− exp − λb
exp − λ
enm, usando a propriedade de que VAR(Y ) = E(Y 2 ) − [E(Y )]2 , podemos chegar
facilmente na expressão para a variância da variável aleatória.
VAR(Y )
exp − a+bλ
[a2 + b2 ]
2
VAR(Y ) = λ − h i2 .
a
− exp − λb
exp − λ
E então
0, para y<a
a −exp − y
exp(− λ ) ( λ)
F (y) = a −exp − b , para a≤y<b.
exp(− λ ) ( λ)
1, para y≥b
Distribuições Truncadas no R
Conteúdo
Introdução
Censura e Truncamento
Teoria básica sobre o truncamento
1 |x − µ|
g(x) = exp − , −∞ < x < ∞,
2λ λ
1 exp x−µ , para x<µ
2 λ
G(x) = .
1 − 1 exp − x−µ , para x≥µ
2 λ
Comentários
Para se construir a versão truncada, em um intervalo [a, b] qualquer, de uma
distribuição exponencial dupla, temos que tomar alguns cuidados especiais no que diz
respeito ao intervalo de truncamento e o parâmetro µ do modelo:
Comentários
Para se construir a versão truncada, em um intervalo [a, b] qualquer, de uma
distribuição exponencial dupla, temos que tomar alguns cuidados especiais no que diz
respeito ao intervalo de truncamento e o parâmetro µ do modelo:
Comentários
Para se construir a versão truncada, em um intervalo [a, b] qualquer, de uma
distribuição exponencial dupla, temos que tomar alguns cuidados especiais no que diz
respeito ao intervalo de truncamento e o parâmetro µ do modelo:
Comentários
Para se construir a versão truncada, em um intervalo [a, b] qualquer, de uma
distribuição exponencial dupla, temos que tomar alguns cuidados especiais no que diz
respeito ao intervalo de truncamento e o parâmetro µ do modelo:
3. Enm temos a, b ≥ µ.
Comentários
Para se construir a versão truncada, em um intervalo [a, b] qualquer, de uma
distribuição exponencial dupla, temos que tomar alguns cuidados especiais no que diz
respeito ao intervalo de truncamento e o parâmetro µ do modelo:
3. Enm temos a, b ≥ µ.
4. Aqui vamos nos concentrar apenas no item 2, sendo que a extensão para os outros
dois casos é natural.
Agora, seja Y a versão truncada de X em[a, b], denotada por EDT (µ, λ, a, b), então
1 |y−µ|
2λ
exp − λ
f (y) =
1 − 12 exp − b−µ λ
− 21 exp a−µ λ
|y−µ|
exp − λ
= h i ,
λ 2 − exp − b−µ λ
− exp a−µ λ
Agora, seja Y a versão truncada de X em[a, b], denotada por EDT (µ, λ, a, b), então
1 |y−µ|
2λ
exp − λ
f (y) =
1 − 12 exp − b−µ λ
− 21 exp a−µ λ
|y−µ|
exp − λ
= h i ,
λ 2 − exp − b−µ λ
− exp a−µ λ
|y − µ|
f (y) = c exp − , a ≤ y ≤ b,
λ
com
1
c= h i .
λ 2 − exp − b−µ
λ
− exp a−µ
λ
2µ2 +4λ2 −exp a−µ
λ [a2 −2λa+2λ2 ]−exp − b−µ [b2 +2λb+2λ2 ]
E(Y 2 ) = λ .
a−µ b−µ
2−exp λ
−exp − λ
2µ2 +4λ2 −exp a−µ
λ [a2 −2λa+2λ2 ]−exp − b−µ [b2 +2λb+2λ2 ]
E(Y 2 ) = λ .
a−µ b−µ
2−exp λ
−exp − λ
I A variância de Y pode ser obtida a partir desses dois valores, mas por ser algebri-
camente trabalhosa, esse resultado não será apresentado aqui.
radamente nos intervalos [a, µ) e [µ, b]. Desta forma, considerando o caso em que
y < µ.
radamente nos intervalos [a, µ) e [µ, b]. Desta forma, considerando o caso em que
y < µ.
I Assim, a função de distribuição acumulada de Y é dada por
0,
para y<a
exp y−µ −exp a−µ
λ λ a≤y<µ
2−exp − b−µ −exp a−µ ,
para
λ λ
F (y) =
y−µ a−µ .
2−exp − λ −exp λ ,
para µ≤y<b
b−µ a−µ
2−exp − λ −exp λ
1, para y≥b
Conteúdo
Introdução
Censura e Truncamento
Teoria básica sobre o truncamento
Distribuição Cauchy
1 1 γ
g(x) = 2 = π , −∞ < y < ∞,
x−µ (x − µ)2 + γ 2
πγ 1 + γ
1 x−µ 1
G(x) = arctan +
π γ 2
Agora, seja Y a versão truncada de X em [a, b], denotada por CauchyT (µ, γ, a, b),
então
γ
(y−µ)2 +γ2
f (y) =
b−µ a−µ
arctan γ
− arctan γ
γ
= h i , a ≤ y ≤ b.
b−µ a−µ
[(y − µ)2 + γ2] arctan γ
− arctan γ
∞
X (t)k (u)k xk
2 F1 (t, u; v; x) = ,
k=0
(v)k k!
onde (z)k = z(z + 1) · · · (z + k − 1) denota o fatorial ascendente. Essa regra geral para
a obtenção de qualquer momento de Y, pode ser usada para se encontrar E(Y ) e
VAR(Y ), entre outras propriedades.
Distribuições Truncadas no R