CadenasDeMarkov PDF

Cadenas de Markov
Def: Sea un sistema dinámico cuyo conjunto de posibles estados es S = {0,1,2,…} donde cada
estado es la configuración del sistema en un momento dado. Dicho sistema evoluciona en el
tiempo, pasando al azar de un estado a otro. Sean las v.a. Xn = ”Estado del sistema en el instante n”
(con n = 0,1,2,…) con recorrido (valores posibles) S , la familia de v.a. X0 , X1 , X2 , … conforman una
Cadena de Markov si y sólo si (sii) se cumple que:
estados i , j , iK S, instantes n , K (con n , K = 0,1,2,…) :

P(Xn+1 = j │ Xn = i Xn-1 = in-1 Xn-2 = in-2 … X0 = i0 ) = P(Xn+1 = j │ Xn = i ) = pij
V.A.: X0 X1 X2 … Xn-1 Xn Xn+1
Estados: i0 i1 i2 … in-1 i j
├───┼───┼───/ /───┼───┼───┼─────> Tiempo
Instantes: 0 1 2 … n-1 n n+1
Es decir: El sistema no tiene “memoria”, pues la probabilidad de pasar del estado i al estado j, entre
el instante n y el instante n+1, sólo depende de i y j, sin importar cómo evolucionó el sistema en el
pasado (antes del instante n).
Def: La matriz de probabilidad de transición P tiene |S| |S| entradas pij = P(Xn+1 = j │ Xn = i )
(con i,j S para n=0,1,2,…) probabilidades condicionales, tales que:
i,j S : pij ≥ 0
∑ = 1 (entradas de cada fila de P suman 1)
Def: La matriz de probabilidad de transición en n instantes P(n) tiene |S| |S| entradas
pij(n) = P(Xk+n = j │ Xk = i ) (con i,j S para n,k=0,1,2,…) probabilidades condicionales,tales que:
i,j S : ≥0
∑ = 1 (entradas de cada fila de P(n) suman 1)
Casos particulares:
P(1) = P
P(0 )= I (matriz identidad) pues cada estado es alcanzable desde el mismo en 0 instantes de tiempo
Teorema de Chapman-Kolmogorov: Sean P(n) y P(m) las respectivas matrices de probabilidad de

transición en n y m instantes (con n , m = 0,1,2,…), la matriz de probabilidad de transición en n+m
instantes P(n+m) es igual al producto matricial de P(n) y P(m), es decir: P(n+m) = P(n)·P(m)
Casos particulares:
P(2) = P·P P(3) = P·P·P = P(2) ·P P(4) = P·P·P·P = P(3)·P = P(2)·P(2)
Este teorema puede expresarse también como sigue (Ecuaciones de Chapman-Kolmogorov):
Cada entrada de P(n+m) es el producto escalar del vector fila i de P(n) y el vector columna j de P(m)
V.A.: X0 … Xn … Xn+m
Estados: i … h … j
├───//───┼───//───┼──────────> Tiempo
Instantes: 0 … n … n+m
Def: El vector de probabilidad de estado en el instante n (con n=0,1,2,…) es un vector fila π(n)
con |S| entradas = P(Xn = j ), probabilidades no condicionadas, tales que:
j S: ≥0
∑ = 1 (entradas de π(n) suman 1)
Caso particular: π(0) = vector de probabilidad de estado inicial.
En general: π(n+1) = π(n)·P para n=0,1,2,… de modo que:
π(1) = π(0)·P → π(2) = π(1)·P = π(0)·P·P = π(0)·P(2) → π(n) = π(0)·P· … ·P·P = π(0)·P(n)
∑
NOTA: Cada entrada de π(n) es el producto escalar del vector fila π(0) y el vector columna j de P(n)
Def: El estado j es alcanzable (accesible) desde el estado i si y sólo si >0 para algún n≥0. Es
decir: j es alcanzable (accesible) desde i sii es posible llegar desde i hasta j en algún momento.
NOTA: Cada estado i es alcanzable (accesible) desde el mismo, pues 1
Def: El estado i comunica con el estado j si y sólo si j es alcanzable (accesible) desde i y viceversa,
es decir: i comunica con j sii j es alcanzable (accesible) desde i i es alcanzable (accesible) desde j
NOTA: La relación binaria R definida como , iRj sii “i comunica con j “ es una relación de
equivalencia, ya que R es Reflexiva, Simétrica y Transitiva. Así, los estados i,j pertenecen a una
misma clase de equivalencia sii i comunica con j. Dos clases de equivalencia son subconjuntos de S
que sólo pueden ser disjuntas ó idénticas, de modo que R induce una partición del conjunto S.
Def: Una cadena de Markov es irreducible sii todos sus estados comunican entre sí, perteneciendo
a una única clase de equivalencia.
Def: El estado i es absorbente si y sólo si pii = 1
Def: Sea fi = P(volver al estado i desde el mismo estado i) se tiene que:

Si fi = 1 entonces el estado i es recurrente, de lo contrario (fi<1) i es transitorio
NOTA: Los estados de una misma clase de equivalencia (es decir: que comunican entre sí) son
todos recurrentes ó todos transitorios, por tanto, en una cadena de Markov finita e irreducible todos
los estados son recurrentes.
Def: El período de un estado recurrente i es di = MCD{valores de n>0 tales que 0}, es

decir: di es el Máximo Común Divisor de todas las posibles n transiciones que permiten volver a i
desde i. Si di>1 entonces el estado i es periódico, de lo contrario (di=1) el estado i es aperiódico.
NOTA: Los estados recurrentes que comunican entre sí tienen el mismo período, así que en una
cadena de Markov irreducible todos los estados tienen el mismo período.
Def: Una cadena de Markov finita e irreducible es ergódica si y sólo si (sii) todos sus estados son
recurrentes y aperiódicos.
Def: En caso de existir, el vector límite de probabilidad de estado es un vector fila π con |S|
entradas πj = = P(Estar en el estado j sin importar estado inicial ni transiciones)
tales que:
j S : πj ≥ 0
∑ = 1 (entradas de π suman 1)
Teorema: Para toda cadena de Markov ergódica existe el vector límite de probabilidad de estado π
cuyas |S| entradas πj = lim son la solución única del sistema de ecuaciones:
: ∑
∑ = 1 (entradas de π suman 1)
NOTA: Cada entrada de π es el producto escalar del vector fila π y el vector columna j de P
NOTA: Si existe el vector límite de probabilidad de estado π entonces también existe =

matriz cuadrada cuyas |S| filas son iguales a dicho vector límite de probabilidad de estado π, siendo
π = π·P

CadenasDeMarkov PDF

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

CadenasDeMarkov PDF

Încărcat de

Drepturi de autor:

Formate disponibile

Cadenas de Markov

estados i , j , iK S, instantes n , K (con n , K = 0,1,2,…) :

Teorema de Chapman-Kolmogorov: Sean P(n) y P(m) las respectivas matrices de probabilidad de

Def: El estado i es absorbente si y sólo si pii = 1

Def: Sea fi = P(volver al estado i desde el mismo estado i) se tiene que:

Def: El período de un estado recurrente i es di = MCD{valores de n>0 tales que 0}, es

NOTA: Si existe el vector límite de probabilidad de estado π entonces también existe =

S-ar putea să vă placă și