Sunteți pe pagina 1din 15

Captulo 5

Sucesiones de Variables Aleatorias


5.1. Introduccion
La introduccion de los conceptos de medida e integral nos va a permitir considerar nuevos modos
de convergencia para sucesiones de funciones. Vamos a comenzar por recordar dos conceptos clasicos de
convergencia.
Denicion 5.1 Sea X
n
, n 1 una sucesion de funciones medibles a valores reales denidas sobre el
espacio de medida (, F, ) y X una funcion real y medible, denida sobre el mismo espacio. Decimos
que la sucesion (X
n
) converge (puntualmente) a X si para todo se tiene que
lm
n
X
n
() = X(),
es decir, dados y > 0 existe N = N(, ) N tal que
n N |X
n
() X()| <
Usamos la notacion
X
n
X
para denotar la convergencia puntual.
Denicion 5.2 Sean X
n
, n 1 y X como en la denicion anterior. Decimos que la sucesion (X
n
)
converge uniformemente a X si dado > 0 existe N = N() N tal que, para cualquier punto en se
tiene que
n N |X
n
() X()| <
Usamos la notacion
X
n
U
X
para denotar la convergencia uniforme.
Observacion 5.1
La diferencia entre las dos deniciones radica en que en el primer caso N depende del punto en el
cual estamos viendo la convergencia, mientras que en el segundo caso el mismo N sirve para todos
los puntos del espacio.
La segunda denicion dice que si consideramos una banda de ancho 2 alrededor de la funcion X,
existe un N que depende unicamente de tal que, si n N la funcion X
n
esta dentro de esta
banda.
Es claro que convergencia uniforme implica convergencia puntual pero el recproco es falso.
84 CAP

ITULO 5. SUCESIONES DE VARIABLES ALEATORIAS


5.2. Convergencia Casi Segura
Denicion 5.3 Sean X
n
, n 1 y X como en la denicion 5.1. Decimos que la sucesion (X
n
) converge
casi seguramente a X si existe un conjunto nulo N F tal que, para cualquier punto / N se tiene que
X
n
() X().
Usamos las notaciones
X
n
c.s.
X o X
n
X, c.s.
para denotar la convergencia casi segura. Si (, F, ) es un espacio de probabilidad este tipo de conver-
gencia se conoce como convergencia con probabilidad 1 y se denota
X
n
c.p.1
X o X
n
X, c.p.1
Es obvio que convergencia puntual implica convergencia c.s. y el siguiente ejemplo muestra que el
recproco no es cierto.
Ejemplo 5.1
Sea (, F, ) el espacio de Lebesgue ([0, 1], B, ) y X
n
() =
n
, X() = 0 para [0, 1]. Entonces
X
n
() 0 para [0, 1),
es decir, la sucesion X
n
converge a X salvo en el punto 1, de modo que el conjunto donde no hay
convergencia es un conjunto nulo.
Proposicion 5.1 Si (, F, ) es un espacio completo, X
n
c.s.
X y las funciones X
n
son medibles,
entonces X tambien es medible.
Demostracion. Sabemos que existe un conjunto nulo (y por lo tanto medible) N tal que X
n
converge
a X fuera de N, es decir, si / N
lminf
n
X
n
() = lm
n
X
n
() = X().
Para c R los conjuntos
A
1
= { : X() > c}, A
2
= { : lminf X
n
() > c}
no necesariamente coinciden, pero cualquier punto que este en uno y no este en otro debe estar en N.
Ademas, sabemos que A
2
es medible porque lminf X
n
es medible. Sea
B
1
= A
1
A
2
, B
2
= A
2
A
1
.
Ambos conjuntos son subconjuntos de N y como el espacio es completo, son conjuntos medible. Finalmente
observamos que
A
1
= (A
2
B
1
) B
c
2
de modo que F
1
es medible.
Denicion 5.4 Sea X
n
, n 1 como en la denicion 5.1. Decimos que la sucesion (X
n
) es de Cauchy
casi seguramente si existe un conjunto nulo N F tal que, para cualquier punto / N la sucesion
X
n
() es de Cauchy.
Proposicion 5.2 Una sucesion de funciones medibles (X
n
) converge c.s. si y solo si es de Cauchy c.s.
La demostracion queda como ejercicio.
5.3. CONVERGENCIA EN MEDIDA 85
5.3. Convergencia en Medida
Denicion 5.5 Sean X
n
, n 1 y X como en la denicion 5.1. Decimos que la sucesion (X
n
) converge
en medida a X si para cualquier > 0 se tiene que
lm
n
({ : |X
n
() X()| > }) = 0.
Usamos las notaciones
X
n

X o X
n
X, en medida
para denotar la convergencia en medida. Si (, F, ) es un espacio de probabilidad este tipo de conver-
gencia se conoce como convergencia en probabilidad y se denota
X
n
P
X o X
n
X, en probabilidad.
Ese tipo de convergencia es mas debil que la convergencia casi segura, como lo muestran la siguiente
la proposicion y el ejemplo que le sigue.
Proposicion 5.3 Sean X
n
, n 1 y X como en la denicion 5.1 y supongamos que () < . Si X
n
converge a X c.s. entonces tambien converge en medida.
Demostracion. Si X
n
X c.s. entonces para cualquier > 0
0 = ({|X
n
X| > } para innitos n)
= (lmsup{|X
n
X| > })
= lm
n
(
kn
{|X
k
X| > })
lm
n
({|X
n
X| > }).

Para ver que el recproco no es cierto tenemos el siguiente ejemplo.


Ejemplo 5.2
Sea (, F, ) = ([0, 1], B, ) el espacio de Lebesgue y denimos la siguiente sucesion de variables aleatorias:
X
1
() = 1
[0,1]
(),
X
2
() = 1
[0,1/2)
(), X
3
() = 1
[1/2,1]
()
X
4
() = 1
[0,1/3
(), X
5
() = 1
[1/3,2/3)
(), X
6
() = 1
[2/3,1]
(),
.
.
.
Observamos que como las variables X
n
son funciones indicadoras de intervalos, solo son distintas de
0 en esos intervalos, cuya longitud tiende a 0 cuando n . Esto muestra que X
n
0 en probabilidad.
En cambio, para cualquier [0, 1] tenemos que X
n
() = 1 para innitos valores de n, y X
n
() = 0
para el resto, que tambien son innitos. Por lo tanto la sucesion X
n
no converge puntualmente en ning un
punto.
Ejemplo 5.3
Para ver que () < es una condicion necesaria en el teorema anterior consideramos el siguiente
ejemplo: Sea X
n
= 1
(n,n)
c , X = 0, entonces observamos que X
n
() X() para todo pero para
cualquier n N y cualquier > 0,
({ : |X
n
() X()| > }) =
y por lo tanto no hay convergencia en medida.
86 CAP

ITULO 5. SUCESIONES DE VARIABLES ALEATORIAS


5.3.1. Aplicaciones Estadsticas
Supongamos que tenemos una familia de modelos (, F, P

), , y observamos una muestra aleato-


ria simple X
1
, . . . , X
n
. Con base en estas observaciones queremos estimar el valor del parametro , es
decir, deseamos seleccionar el modelo correcto.
En esta situacion lo usual es usar un estadstico

=

(X
1
, . . . , X
n
) para estimar el valor de . Este
estadstico es una variable aleatoria denida sobre el mismo espacio de probabilidad. Decimos que el
estimador es debilmente consistente si para todo ,
P

(|

n
| > ) 0, n ,
es decir, si

n
converge en probabilidad al verdadero valor de . El estimador es (fuertemente) consistente
si esta convergencia se da con probabilidad 1.
5.3.2. Consecuencias de la Convergencia en Medida
A un cuando hemos visto que convergencia en medida es mas debil que convergencia c.s., el siguiente
teorema, debido a Riesz, muestra que si tenemos convergencia en medida, siempre hay una subsucesion
que converge c.s. al mismo lmite.
Teorema 5.1 (Riesz) Si la sucesion X
n
converge en medida a X en , existe una subsucesion (X
n
k
)
que converge c.s. a X.
Demostracion. Como la sucesion de funciones converge c.s. podemos hallar n
1
N tal que
({ : |X
n
1
() X()| 2
1
}) < 2
1
.
Para cada k > 1 hallamos n
k
> n
k1
tal que
({ : |X
n
k
() X()| 2
k
}) < 2
k
.
Veamos que la subsucesion (X
n
k
) converge c.s. a X. Sea
S
k
=
_
ik
{ : |X
n
i
() X()| 2
i
}.
Observamos que S
i
es una sucesion decreciente de conjuntos. Sea
S =

k1
S
k
.
Por sub-aditividad tenemos que la medida de S
k
esta acotada por
(S
k
) 2
k
+ 2
k1
+ 2
k2
+ = 2
1k
y en consecuencia la medida de S es
(S) = lm
k
(S
k
) = 0.
Veamos que si S entonces X
n
k
() X(). Sea > 0, escogemos K de modo que 2
K
< y
/ S
K
. Entonces para todo k K, / S
k
y en consecuencia
|X
n
k
() X()| < 2
k
< .

5.3. CONVERGENCIA EN MEDIDA 87


Corolario 5.1 X
n
converge en medida a X si y solo si cada subsucesion (X
n
k
) contiene una subsucesion
(X
n
k
i
) que converge a X c.s.
Demostracion. Si X
n

X y (X
n
k
) es una subsucesion, entonces X
n
k

X y por el teorema anterior


existe una subsucesion (X
n
k
i
) que converge a X c.s.
Recprocamente, supongamos que toda subsucesion tiene una subsucesion que converge c.s. a X y
supongamos que X
n
no converge a X en probabilidad para obtener una contradiccion.
Si X
n
no converge en probabilidad a X, existen una subsucesion (X
n
k
), > 0 y > 0 tales que
(|X
n
k
X| > ) . (5.1)
Pero esta subsucesion (X
n
k
) debera tener una subsucesion que converge c.s. a X y por lo tanto en
probabilidad. Esto contradice a (5.1).
Corolario 5.2 a) Si X
n
X c.s. y g : R R es continua entonces g(X
n
) g(X) c.s.
b) Si X
n

X y g : R R es continua entonces g(X


n
)

g(X).
Demostracion. (a) Existe un conjunto nulo N B tal que si / N entonces X
n
() X() en R. Por
continuidad de g, si / N,
g(X
n
()) g(X()),
es decir, (g(X
n
)) converge c.s. a g(X).
(b) Sea (g(X
n
k
)) una subsucesion de (g(X
n
)). Basta hallar una subsucesion (g(X
n
k
i
)) que sea c.s.
convergente. Sabemos que (X
n
k
) tiene una subsucesion c.s. convergente (X
n
k
i
) que converge a X. Por lo
tanto g(X
n
k
i
) g(X) c.s.
Corolario 5.3 (de Convergencia Dominada de Lebesgue) Si X
n

X y existe una funcion med-


ible Y L
1
tal que |X
n
| Y , entonces
_
X
n
d
_
X d.
Demostracion. Basta demostrar que toda subsucesion convergente de
_
X
n
d converge a
_
X d.
Supongamos que
_
X
n
k
d converge. Por hipotesis tenemos convergencia en probabilidad y en conse-
cuencia (X
n
k
) tiene una subsucesion (X
n
k
i
) que converge c.s. a X. Por el TCD tenemos que
_
X
n
k
i
d
_
X d
En consecuencia
_
X
n
k
d
_
X d.
Proposicion 5.4 (Propiedades) Si X
n

X y Y
n

Y
1. X
n
+Y
n

X +Y .
2. X
n
Y
n

XY .
88 CAP

ITULO 5. SUCESIONES DE VARIABLES ALEATORIAS


Demostracion. (1) Observamos que
{|(X
n
+Y
n
) (X +Y )| > } {|X
n
X| >

2
} {|Y
n
Y | >

2
}.
Tomando medidas, usando subaditividad y haciendo n se obtiene el resultado.
(2) Observamos que basta demostrar que para toda subsucesion (n
k
) existe una subsucesion n
k
i
tal
que
X
n
k
i
Y
n
k
i
c.s.
XY.
Como X
n
k

X, existe una subsucesion (n

k
) tal que
X
n

k
c.s.
X.
Como Y
n

Y , dada la subsucesion (n

k
), existe una subsucesion (n

k
i
) tal que
X
n

k
i
c.s.
X, Y
n

k
i
c.s.
Y,
y en consecuencia tenemos
X
n

k
i
Y
n

k
i
c.s.
XY.
Por lo tanto, toda subsucesion de (X
n
Y
n
) tiene una subsucesion que converge c.s.
Proposicion 5.5 (Ley Debil de Grandes N umeros) Si (X
n
, n 1) son i.i.d. con E(X
n
) = y
Var(X
n
) =
2
, entonces
1
n
n

i=1
X
i
P

Demostracion. Basta usar la desigualdad de Chebyshef.
5.4. Convergencia en L
p
En esta seccion estudiamos un nuevo tipo de convergencia que tiene gran importancia en el analisis
funcional. Recordemos que una funcion medible X pertenece al espacio L
p
si
_
|X|
p
d < . Para p 1
y X, Y L
p
denimos una distancia en este espacio por
d
p
(X, Y ) =
_
_
|X Y |
p
d
_
1/p
.
Para ver que d
p
es una distancia demostraremos mas adelante la desigualdad triangular, que se conoce
como la desigualdad de Minkowski. Por otro lado, es claro que d
p
(X, Y ) = d
p
(Y, X). Ademas si X = Y
tenemos que d
p
(X, Y ) = 0 pero el recproco no es cierto: Si d
p
(X, Y ) = 0 solo podemos concluir que
X
c.s.
= Y . Por lo tanto d
p
solo sera una pseudo-distancia.
Para tener una distancia podemos tomar la relacion de equivalencia X
c.s.
= Y sobre el espacio L
p
y
en lugar de considerar las funciones medibles X consideramos las clases de equivalencia

X. El espacio
cociente, formado por las clases de equivalencia, lo denotamos L
p
y d
p
si sera una distancia sobre este
espacio. En lo que sigue vamos a obviar este procedimiento y hablaremos de d
p
como una distancia sobre
el espacio L
p
.
Hay una norma que induce esta distancia:
||X||
p
=
_
_
(|X|
p
)
_
1/p
.
5.4. CONVERGENCIA EN L
P
89
Denicion 5.6 Decimos que la sucesion (X
n
, n 1) converge a X en L
p
si todas las variables estan en
L
p
y
_
|X
n
X|
p
d 0
cuando n . Usamos la notacion
X
n
L
p
X.
Proposicion 5.6 Convergencia en L
p
implica convergencia en medida.
Demostracion. Tenemos
(|X
n
X| ) =
_
1
{|X
n
X|>}
d
=
_
1
{|X
n
X|
p
>
p
}
d

_
|X
n
X|
p

p
1
{|X
n
X|
p
>
p
}
d

p
_
|X
n
X|
p
d 0
cuando n .
El siguiente ejemplo muestra que el recproco no es cierto.
Ejemplo 5.4
De nuevo, el espacio de medida es el espacio de probabilidad de Lebesgue ([0, 1], B, ) y denimos
X
n
= 2
n
1
(0,
1
n
)
.
Entonces
P(|X
n
| > ) = ((0,
1
n
)) =
1
n
0
pero
E(|X
n
|
p
) = 2
np
1
n
.
Convergencia en L
p
no implica convergencia c.s., como lo muestra el ejemplo 5.2. Para cualquier p > 0,
como la variable X
n
solo toma valores 0 o 1, el valor esperado E(|X
n
|
p
) es igual a la longitud del intervalo
correspondiente a X
n
, y esta longitud tiende a 0.
Convergencia casi segura tampoco implica convergencia en L
p
, como lo muestra el ejemplo 5.3. A un
cuando la medida del espacio sea nita, es posible dar ejemplo de sucesiones que convergen c.s. pero no
convergen en L
p
.
Desigualdades
Teorema 5.2 (Desigualdad de Holder) Sea p, q n umeros reales tales que p, q > 1 y
1
p
+
1
q
= 1. (5.2)
Sean X L
p
, Y L
q
, entonces el producto XY es integrable y
_
|XY | d
_
_
|X|
p
d
_
1/p
_
_
|Y |
q
d
_
1/q
. (5.3)
90 CAP

ITULO 5. SUCESIONES DE VARIABLES ALEATORIAS


En terminos de las normas la desigualdad dice que
||XY ||
1
||X||
p
||Y ||
q
.
Si p y q satisfacen (5.2) decimos que son conjugados.
Demostracion. Observamos inicialmente que si
_
|X|
p
d = 0 entonces X = 0 c.s. y en consecuencia
_
|XY | d = 0, de modo que la desigualdad es cierta. Algo similar ocurre si
_
|Y |
q
d = 0, as que podemos
suponer que el lado derecho de (5.3) es estrictamente positivo.
Dados a > 0, b > 0, existen s, t R tales que
a = exp{s/p}, b = exp{t/q}.
Como la funcion exponencial es convexa y p
1
+q
1
= 1 tenemos que
exp{p
1
s +q
1
t} p
1
exp{s} +q
1
exp{t},
y usando la denicion de s, t,
ab p
1
a
p
+q
1
b
q
.
Ahora reemplazamos a por |X|/||X||
p
y b por |Y |/||Y ||
q
y obtenemos
|XY |
||X||
p
||Y ||
q
p
1
_
|X|
||X||
p
_
p
+q
1
_
|Y |
||Y ||
q
_
q
Finalmente, tomando integrales,
1
||X||
p
||Y ||
q
_
|XY | d p
1
+q
1
= 1

Teorema 5.3 (Desigualdad de Minkowski) Supongamos que X, Y L


p
para 1 p < . Entonces
X +Y L
p
y
||X +Y ||
p
||X||
p
+||Y ||
p
.
Demostracion. La desigualdad
|X +Y |
p
2(|X|
p
|Y |
p
) 2(|X|
p
+|Y |
p
) L
p
muestra que los espacios L
p
, p 1 son cerrados aditivamente. So p = 1 la desigualdad de Minkowski
sigue de la desigualdad triangular usual. Sea 1 < p < y escojamos q conjugado de p de modo que
p
1
+q
1
= 1, es decir, p 1 = p/q. Usando la desigualdad de Holder,
||X +Y ||
p
p
=
_
|X +Y |
p
d =
_
|X +Y ||X +Y |
p/q
d

_
|X||X +Y |
p/q
d +
_
|Y ||X +Y |
p/q
d
||X||
p
|| |X +Y |
p/q
||
q
+||Y ||
p
|| |X +Y |
p/q
||
q
=(||X||
p
+||Y ||
p
)|| |X +Y |
p/q
||
q
=(||X||
p
+||Y ||
p
)
_
_
|X +Y |
p
d
_
1/q
=(||X||
p
+||Y ||
p
)||X +Y ||
p/q
p
=(||X||
p
+||Y ||
p
)||X +Y ||
p1
p
Si el ultimo factor es distinto de 0, podemos dividir por el para obtener el resultado. Si es igual a 0,
ambos lados de la desigualdad valen 0.
La desigualdad anterior es la desigualdad triangular para || ||
p
.
5.4. CONVERGENCIA EN L
P
91
Teorema 5.4 (Desigualdad de Jensen) Sea (, F, P) un espacio de probabilidad, g : R R una
funcion convexa y X una variable aleatoria integrable tal que g(X) tambien es integrable. Entonces
E(g(X)) g(E(X)).
Demostracion. Sea g una funcion convexa, sabemos que dado cualquier punto de la graca de g podemos
hallar (al menos) una recta que es tangente a la curva en ese punto y tal que la recta siempre esta por
debajo de la curva que representa a g. Esta recta (que en general no es unica) se conoce como la recta
de soporte de g. Sea r(x) = ax +b la recta de soporte de g en el punto (E(X), g(E(X))) sobre la graca
de funcion g. Entonces
aX() +b g(X()).
Tomando esperanza obtenemos
a E(X) +b E(g(X)).
Pero como la recta r(x) es tangente a la funcion g en (E(X), g(E(X))), a E(X) +b = E(g(X)).
Ejemplo 5.5
Sea (, F, P) un espacio de probabilidad, X una variable aleatoria y 0 < < . Denimos
r =

> 1, s =


.
Entonces
1
r
+
1
s
=

= 1.
Ahora ponemos Z = |X|

, Y = 1 usamos la desigualdad de Holder:


E(|ZY |) (E|Z|
r
)
1/r
(E(|Y |
s
)
1/s
,
es decir
E(|X|

) (E|X|
r
)
1/r
1 = (E|X|

)
/
de modo que
(E(|X|

))
1/
(E|X|

)
1/
y
||X||

||X||

.
Concluimos que X L

X L

si < . Mas a un, ||X||

= (E(|X|

))
1/
es no-decreciente en .
Como consecuencia tenemos que si X
n
L
p
X y r < p, X
n
L
r
X.
Teorema 5.5 Para p 1 el espacio L
p
es completo, es decir, si (X
n
) es una sucesion de Cauchy en L
p
,
existe X L
p
tal que X
n
L
p
X.
Demostracion. Dado > 0 sea N = N() N tal que si n, m N,
_
|X
n
X
m
|
p
d <
p+1
. (5.4)
Llamemos N
k
= N(2
k
) y supongamos que N
k+1
> N
k
para todo k. Denimos los conjuntos
A(, m, n) = { : |X
m
() X
n
()| }
92 CAP

ITULO 5. SUCESIONES DE VARIABLES ALEATORIAS


entonces
_
|X
n
X
m
|
p
d
_
A(,m,n)
|X
n
X
m
|
p

p
(A(, m, n)) (5.5)
y combinando (5.4) y (5.5) obtenemos (A(, m, n)) < si m, n N().
Sea ahora A
k
= A(2
k
, N
k+1
, N
k
), B
k
=
ik
A
i
, tenemos (A
k
) < 2
k
, (B
k
) < 2
1k
y si / B
k
|X
N
i+1
() X
N
i
()| < 2
i
para i k.
Por lo tanto la serie

i
(X
N
i+1
X
N
i
) converge fuera de B =
k1
B
k
y (B) = 0. En consecuencia existe
X tal que X
N
i
X c.s.
Para un entero jo r ponemos Y
i
= |X
N
i
X
r
|
p
, Y = |X X
r
|
p
y obtenemos una sucesion Y
i
de
funciones medibles no-negativas con lminf Y
i
= lmY
i
= Y c.s. Por el lema de Fatou tenemos
_
Y d lminf
i
_
|X
N
i
X
r
|
p
d <
si r > N(). En consecuencia Y es integrable, es decir (X X
r
) L
p
, lo cual implica que X L
p
.
Ademas probamos que
_
|X X
r
|
p
d < si r > N()
de modo que X
r
L
p
X.
Observacion 5.2 Es importante resaltar que el resultado anterior es falso para la integral de Riemann
sobre intervalos nitos. No es difcil construir ejemplos de sucesiones de funciones cuyas potencias de
orden p son integrables seg un Riemann, que son de Cauchy en L
p
pero cuyo lmite es discontinuo en un
conjunto de medida positiva y por lo tanto no pueden ser integrables seg un Riemann.
Como consecuencia del teorema anterior observamos que los espacios L
p
son espacios normados que
son completos respecto a la metrica inducida por la norma. Un espacio con estas propiedades se conoce
como un espacio de Banach.
Si p > 1 y q > 1 son conjugados decimos que los espacios L
p
y L
q
son conjugados. Por la desigualdad
de Holder sabemos que si X L
p
y Y L
q
entones el producto XY es integrable. Observamos que el
conjugado de p = 2 es q = 2, es decir que L
2
es su propio espacio conjugado, y ademas es el unico caso
en el que esto ocurre. Esto quiere decir que si tomamos dos funciones de L
2
, su producto es integrable,
y por lo tanto podemos denir un producto interno en L
2
: Para X, Y L
2
,
X, Y =
_
XY d.
Es facil ver que esta denicion satisface las condiciones de un producto interno (pasando al espacio
cociente L
2
si es necesario). Ademas, la norma asociada a este producto interno es la norma || ||
2
, que
denimos anteriormente, ya que
X, X =
_
|X|
2
d = ||X||
2
2
.
Por lo tanto L
2
es un espacio de Banach que tiene un producto interno que induce la norma del espacio.
Un espacio con estas propiedades se conoce como un espacio de Hilbert.
5.5. Convergencia en Distribucion
Denicion 5.7 Si F es una f.d. denimos el conjunto de puntos de continuidad o conjunto de continuidad
de F por
C(F) = {x R : F es continua en x}
Un intervalo nito I con extremos a < b es un intervalo de continuidad para F si a, b C(F).
5.5. CONVERGENCIA EN DISTRIBUCI

ON 93
Denicion 5.8 Sea (X
n
, n 1) una sucesion de v.a. con f.d. F
X
n
, n 1. X
n
converge en distribucion
a la v.a. X cuando n si
F
X
n
(x) F
X
(x) cuando n , x C(F
X
).
Notacion: X
n
d
X o X
n
w
X cuando n .
Observacion 5.3 Como en esta denicion solo intervienen las funciones de distribuciones, las variables
no necesariamente estan denidas en un mismo espacio de probabilidad.
Abusando la notacion, escribiremos X
n
w
N(0, 1) en lugar de X
n
w
X cuando n donde
X N(0, 1).
Ejemplo 5.6
Sea X
n

1/n
, es decir, la delta de Dirac concentrada en el punto 1/n. Si la denicion 5.8 tiene sentido
deberamos tener X
n
d

0
cuando n . Tenemos
F
X
n
(x) =
_
0, si x < 1/n,
1, si x 1/n,

_
0, si x 0,
1, si x > 1/n.
Por lo tanto F
X
n
F

0
(x) cuando n para todo x C(F

0
) pero no para todo x. Si en cambio
tuvieramos Y
n

1/n
entonces
F
Y
n
(x) =
_
0, si x < 1/n,
1, si x 1/n,

_
0, si x < 0,
1, si x 1/n.
y en este caso si tenemos convergencia para todo x.
Teorema 5.6 Sean X y X
n
, n 1 v.a. Si X
n
P
X entonces X
n
d
X.
Demostracion. Sea > 0, entonces
F
X
n
(x) = P(X
n
x) = P(X
n
x, |X
n
X| ) +P(X
n
x, |X
n
X| > )
P(X x +, |X
n
X| ) +P(|X
n
X| > )
P(X x +) +P(|X
n
X| > ),
y por la convergencia en probabilidad
limsup
n
F
X
n
(x) F
X
(x +).
De manera similar, cambiando X
n
por X, x por x , X por X
n
y x + por x, sigue que
liminf
n
F
X
n
(x) F
X
(x ).
Estas dos relaciones valen para todo x y todo > 0. Suponiendo ahora que x C(F
X
) y haciendo 0
obtenemos que
F
X
(x) = F
X
(x

) liminf
n
F
X
n
(x) limsup
n
F
X
n
(x) F
X
(x).

94 CAP

ITULO 5. SUCESIONES DE VARIABLES ALEATORIAS


Observacion 5.4 Si F
X
tiene un salto en x, solo podemos concluir que
F
X
(x

) liminf
n
F
X
n
(x) limsup
n
F
X
n
(x) F
X
(x).
Como F
X
(x) F
X
(x

) es el tama no del salto no es posible obtener convergencia en un salto.


Ejemplo 5.7
Sea N N(0, 1), de modo que la distribucion es simetrica. Denimos X
n
= (1)
n
N para n 1, entonces
X
n
d
= N de modo que X
n
d
N, pero (X
n
no converge ni c.s. ni en probabilidad.
Ejemplo 5.8
Para > 0 sea X
n
, n 1 una sucesion de v.a.i. tales que
P(X
n
= 0) = 1
1
n

y P(X
n
= n) =
1
n

Los siguientes resultados son ciertos:


X
n
P
0 (n ) a un sin independencia
X
n
c.s.
0 (n ) sii > 1
X
n
L
p
0 (n ) sii > p
La convergencia en probabilidad es consecuencia de:
P(|X
n
| > ) = P(X
n
= n) =
1
n

0 cuando n .
La convergencia con probabilidad 1 sigue del Lema de Borel-Cantelli ya que

n=1
P(|X
n
| > )
_
< cuando > 1,
= cuando 1,
En cuanto a la convergencia en L
p
E|X
n
|
p
= 0
p

_
1
1
n

_
+n
p

1
n

= n
p
_

_
0, para p < ,
= 1, para p = , cuando n ,
, para p > .
Observamos que E|X|
p
ni converge a 0 ni diverge a innito cuando p = , sino que es igual a 1.
Teorema 5.7 Sea (X
n
, n 1) una sucesion de v.a.i. y c una constante, entonces
X
n
d

c
(n ) X
n
P
c (n ).
Demostracion. Supongamos que X
n
d

c
cuando n y sea > 0. Entonces
P(|X
n
c| > ) = 1 P(c X
n
c +)
= 1 F
X
n
(c +) +F
X
n
(c ) P(X
n
= c )
1 F
X
n
(c +) +F
X
n
(c )
0 cuando n ,
ya que F
X
n
(c +) F
X
(c +) = 1, F
X
n
(c ) F
X
(c ) = 0, y c , c + C(F
X
).
5.5. CONVERGENCIA EN DISTRIBUCI

ON 95
5.5.1. Caracterizacion de la Convergencia en Distribucion
Teorema 5.8 Sea {X
n
, n 1} una sucesion de v.a. y supongamos que X
n
d
X cuando n .
Si h es una funcion continua a valores reales o complejos denida en el intervalo acotado [a, b], donde
a, b C(F
X
), entonces
Eh(X
n
) Eh(X) cuando n . (5.6)
Demostracion. El caso complejo sigue del caso real. Usaremos el lema de aproximacion. Sea A
C(F
X
) R un subconjunto denso numerable. Si h(x) = 1
(c,d]
para c, d A, a c < d b, (5.6) se
reduce a demostrar que P(c < X
n
d) P(c < X d), lo cual es cierto por hipotesis. Por linealidad
la conclusion vale para funciones escalera cuyos escalones tengan extremos en A. Sea ahora h [a, b], y
sea g una funcion simple aproximante, entonces
| Eh(X
n
) E(h(X)| | Eh(X
n
) Eg(X
n
)| +| Eg(X
n
) Eg(X)| +| Eg(X) Eh(X)|
E|h(X
n
) g(X
n
)| +| Eg(X
n
) Eg(X)| + E|g(X) h(X)|
+| Eg(X
n
) Eg(X)| +.
Como ya hemos visto que para funciones simples el termino central tiende a cero cuando n obten-
emos
limsup
n
| Eh(X
n
) Eh(X)| < 2,
lo cual demuestra el teorema.
Teorema 5.9 Sea {X
n
, n 1} una sucesion de v.a. y supongamos que X
n
d
X cuando n . Si h
es una funcion a valores reales o complejos, continua y acotada, entonces
Eh(X
n
) Eh(X) cuando n . (5.7)
Demostracion. De nuevo, el caso complejo sigue del caso real. Supongamos que |h| M, entonces
| Eh(X
n
) Eh(X)| | Eh(X
n
)1
{|X
n
|K}
Eh(X)1
{|X|K}
| +| Eh(X
n
)1
{|X
n
|>K}
| +| Eh(X)1
{|X|>K}
|
| Eh(X
n
)1
{|X
n
|K}
Eh(X)1
{|X|K}
| + E|h(X
n
)|1
{|X
n
|>K}
+ E|h(X)|1
{|X|>K}
| Eh(X
n
)1
{|X
n
|K}
Eh(X)1
{|X|K}
| +MP|X
n
| > K) +MP(|X| > K)
Sea > 0 y escojamos K C(F
X
) sucientemente grande como para que 2MP(|X| > K) < . Usando el
teorema 5.8 para el primer termino y la convergencia en distribucion para los otros dos, obtenemos que
limsup
n
| Eh(X
n
) Eh(X)| < 2MP(|X| > K) < .

Teorema 5.10 Sea {X


n
, n 1} una sucesion de v.a. Entonces X
n
d
X cuando n si y solo si
Eh(X
n
) Eh(X) cuando n . (5.8)
para toda funcion real continua y acotada.
Demostracion. Por el teorema 5.9 basta demostrar la suciencia. Sean a, b C(F), < a < b < .
Ponemos
g
k
(x) =
_

_
0 para x < a
k
,
x(a
k
)

k
para x [a
k
, a],
1 para x [a, b],
b+
k
x

k
para x [b, b +
k
],
0 para x > b +
k
96 CAP

ITULO 5. SUCESIONES DE VARIABLES ALEATORIAS


con
k
0 cuando k y observamos que 1
(a,b]
(x) g
k
(x). Supongamos que (5.8) vale. Por la
monotona de la funcion de distribucion y el teorema 5.9 obtenemos
F
n
(a, b] =
_
b
a
dF
n
(x) Eg
k
(X
n
) Eg
k
(X) cuando n .
Haciendo n
limsup
n
F
n
(a, b] Eg
k
(X) F([a
k
, b +
k
]).
Haciendo ahora k tenemos
k
0 y g
k
(x) 1
[a,b]
, y como a y b son puntos de continuidad
concluimos que
limsup
n
F
n
(a, b] F(a, b]. (5.9)
Si, en cambio,
h
k
(x) =
_

_
0 para x < a,
xa

k
para x [a, a +
k
],
1 para x [a +
k
, b
k
],
bx

k
para x [b
k
, b],
0 para x > b
los mismos argumentos nos dan
liminf
n
F
n
(a, b] F([a +
k
, b
k
]),
y como ahora h
k
(x) 1
(a,b)
, tenemos nalmente
liminf
n
F
n
(a, b] F(a, b]. (5.10)
Las ecuaciones (5.9) y (5.10) demuestran que X
n
d
X cuando n .
Como corolario obtenemos los siguientes resultados:
Corolario 5.4 Sea {F
n
, n 0} una familia de funciones de distribucion. Las siguientes armaciones
son equivalentes
(1) F
n
d
F
0
.
(2) Para toda funcion real f acotada y uniformemente continua,
_
f dF
n

_
f dF
0
,
cuando n .
Demostracion. Basta observar que las funciones g
k
y h
k
que usamos en la demostracion del teorema
anterior son continuas con soporte compacto y por lo tanto son uniformemente continuas.
Teorema 5.11 Sean X e Y v.a.
X
d
= Y Eh(X) = Eh(Y )
para toda funcion h continua y acotada.
Teorema 5.12 Sean X y {X
n
, n 1} v.a. y supongamos que X
n
d
X cuando n . Entonces
E|X| liminf
n
E|X
n
|.
5.5. CONVERGENCIA EN DISTRIBUCI

ON 97
Demostracion. Sea K C(F
X
) un n umero positivo. Por el teorema 5.8 tenemos
liminf
n
E|X
n
| liminf
n
E|X
n
|1
{|X
n
|K}
= E|X|1
{|X|K}
.
La conclusion sigue haciendo K tender a innito a traves de una sucesion de puntos de continuidad de
F
X
.

S-ar putea să vă placă și