Seminario

Pontificia Universidad Católica de Valparaı́so
Facultad de Ciencias Básicas y Matemáticas

Instituto de Matemáticas
Presión Topológica
Seminario para optar al grado de Licenciado en Matemáticas.
Enzo Abraham Fuentes Manrı́quez.
Profesor Guı́a: Carlos Vásquez.
Enero 2012.
(*) Parcialmente financiado por proyecto Fondecyt 1110040.

Introducción
En este seminario, el objeto de estudio será lo que se conoce como Presión Topológica,
estudiado principalmente del texto de P.Walters [?], lo cual estará dividido en 3 capı́tulos.
En el primer capı́tulo, veremos lo que conocemos como Entropı́a, término introducido en la
teorı́a ergódica por Kolmogorov en el año 1958 [?, ?], y éste ha sido, por lejos, el invariante
más exitoso hasta ahora. La noción de entropı́a que ahora se usa es ligeramente diferente
de la utilizada por Kolmogoorov, en donde la mejora fue hecha por Sinai en 1959 [?, ?]. La
definición de entropı́a de una transformación que preserva medida T de (X, A, µ) la daremos
en 3 etapas: la entropı́a de una sub-σ-álgebra finita de A, la entropı́a de la transformación T
relativa a una sub-σ-álgebra finita, y finalmente, la entropı́a de T .
En el segundo capı́tulo, se estudiará la entropı́a topológica, término introducido por Adler,
Konheim y McAndrew en 1965 [?] como un invariante de conjugación topológica. Más tarde,
Dinaburg [?] y Bowen [?] dan una nueva, pero equivalente definición, y esta definición llevó a
demostraciones de resultados que conectan entropı́a topológica y entropı́a de medida. Bowen
definió la entropı́a de una función uniformemente continua en un espacio métrico y esto lleva
a una demostración geométrica de la fórmula para la entropı́a topológica de un automorfismo
de un toro n-dimensional. En un primer lugar, daremos la definición de entropı́a topológica,
y en la segunda sección daremos la otra definición. Y finalmente, calcularemos la entropı́a
topológica de algunos ejemplos.
Por último, en el tercer capı́tulo estudiaremos la motivación de este seminario, lo que
se conoce como presión topológica. El concepto de presión fue introducida por Ruelle en
1973 [?] y estudiada en caso general por Walters en el año 1976 [?]. En esta teorı́a, ideas
provenientes de mecánica estadı́stica son usadas, además de tener aplicaciones importantes
en otros campos. Finalmente se puede ver el famoso Principio Variacional, el cual fue probado
para algunas transformaciones por Ruelle y después demostrado por Walters para todas las
transformaciones. La demostración dada en el seminario fue obra de M.Misiurewicz [?], y
otras demostraciones pueden estudiarse de los trabajos de M.Denker [?] y R.Bowen.
Índice
1. Entropı́a 4
1.1. Particiones y sub-álgebras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2. Entropı́a de una partición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3. Entropı́a Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4. Entropı́a de una transformación que preserva medida . . . . . . . . . . . . . . 15
1.5. Propiedades de h(T, B) y h(T ) . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.6. Algunos métodos para calcular h(T ) . . . . . . . . . . . . . . . . . . . . . . . 23
1.7. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2. Entropı́a Topológica 27
2.1. Definición a través de cubrimientos abiertos . . . . . . . . . . . . . . . . . . . 27
2.2. Definición de Bowen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3. Cálculo de entropı́a topológica . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3. Presión Topológica y su relación con Medidas Invariantes 39

3.1. Presión topológica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2. Propiedades de la presión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.3. El Principio Variacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.4. Presión determina M (X, T ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
1. Entropı́a
Sea X un conjunto. Una σ-álgebra de subconjuntos de X es una colección A de subcon-

juntos de X que satisface:
i) X ∈ A.
ii) Si A ∈ A, entonces X \ A ∈ A.
S∞
iii) Si An ∈ A, para n ≥ 1, entones n=1 An ∈ A.
Ası́, llamaremos al par (X, A) un espacio medible. P∞ finita en (X, A) es una
Una medida función
µ : A → R+ que satisface µ(∅) = 0 yµ( ∞ ∞ es una
S
A
n=1 n ) = n=1 µ(A n ), donde {A }
n 1
sucesión disjunta en A. Un espacio de medida finita es el trı́o (X, A, µ) donde (X, A) es un
espacio medible y µ es una medida finita en (X, A). Diremos que (X, A, µ) es un espacio
de probabilidad si µ(X) = 1. Supongamos que (X1 , A1 , µ1 ) y (X2 , A2 , µ2 ) son espacios de
probabilidad, diremos que la transformación T : X1 → X2 es medible si T −1 (A2 ) ⊂ A1 , y
diremos que la transformación T : X1 → X2 preserva medida si T es medible y µ1 (T −1 (A2 )) =
µ2 (A2 ), para todo A2 ∈ A2 . Además, diremos que la transformación T : X → X es ergódica
si los únicos elementos tal que T −1 A = A, satisfacen µ(A) = 0 o µ(A) = 1. Durante este
capı́tulo (X, A, µ) denotará un espacio de probabilidad.
1.1. Particiones y sub-álgebras

Definición 1.1. Una partición de (X, A, µ) es una familia de la forma:
( )
[
ξ = Ai ∈ A : Ai = X, Ai ∩ Aj = ∅ .
i∈I
Observación 1.1. 1. Nuestro interés va a estar puesto en particiones finitas, es decir,

familias de la forma:
n
( )
[
ξ = Ai ∈ A : Ai = X, Ai ∩ Aj = ∅ .
i=1
2. Si ξ es una partición finita de (X, A, µ), entonces

k
( )
[
A(ξ) = C ∈ A : C = Ai , Ai ∈ ξ, 1 ≤ k ≤ n
i=1
es un sub-σ-álgebra de A.
3. Recı́procamente, si C es una sub-σ-álgebra finita de A, digamos C = {Ci , i = 1 . . . n},
entonces
ξ(C) = {B1 ∩ . . . ∩ Bn : Bi = Ci ó Bi = Cic }
es una partición finita de (X, A, µ).
Definición 1.2. Sean ξ y η dos particiones finitas de (X, A, µ). Diremos que ξ ≤ η si todo
elemento de ξ es unión de elementos de η (i.e., η es un refinamiento de ξ). Ası́,
a) ξ ≤ η si y solamente si A(ξ) ⊆ A(η).
b) B ⊆ C si y solamente si ξ(B) ≤ ξ(C).
Definición 1.3. Sean ξ = {B1 , . . . , Bn }, η = {C1 , . . . , Ck } particiones finitas de (X, A, µ).
Definimos la partición ξ ∨ η por
ξ ∨ η = {Bi ∩ Cj , 1 ≤ i ≤ n, 1 ≤ j ≤ k} .
Si B y C son sub-σ-álgebras finitas de A, entonces B ∨ C = {Bi ∩ Cj : Bi ∈ B, Cj ∈ C} denota
la sub-σ-álgebra más pequeña de A que contiene a B y C. Por lo que tenemos
a) A(ξ ∨ η) = A(ξ) ∨ A(η)
b) ξ(B ∨ C) = ξ(B) ∨ ξ(C)
Definición 1.4. Sea T : X → X una transformación que preserva medida. Si ξ = {A1 , . . . , Ak }
es una partición finita de (X, A, µ), entonces
T −n ξ = T −n A1 , . . . , T −n Ak .

Si C es una sub-σ-álgebra de A, entonces

T −n C = T −n C : C ∈ C .

Si n ≥ 0, tenemos las siguientes propiedades:

a) ξ(T −n C) = T −n ξ(C).
b) A(T −n ξ) = T −n A(ξ).
c) T −n (B ∨ C) = T −n B ∨ T −n C.
d) T −n (ξ ∨ η) = T −n ξ ∨ T −n η.
e) Si ξ ≤ η, entonces T −n ξ ≤ T −n η.
f ) Si B ⊆ C, entonces T −n B ⊆ T −n C.
Definición 1.5. Si C, D son sub-σ-álgebras de A, decimos que C ⊂ D mod (0) si para todo
C ∈ C, existe D ∈ D tal que µ(D4C) = 0.
Observación 1.2. 1. Anotamos por C $ D cuando C ⊂ D mod (0) y D ⊂ C mod (0).
2. Si ξ, η son particiones finitas, entonces ξ $ η significa A(ξ) $ A(η).
3. Si C, D son sub-σ-álgebras finitas de A, C $ D y ξ(C) = {C1 , . . . , Cp , Cp+1 , . . . , Cq },
donde µ(Ci ) > 0, i = 1, . . . , p, µ(Ci ) = 0, i = p + 1, . . . , q, entonces
ξ(D) = {D1 , . . . , Dp , Dp+1 , . . . , Ds }
donde µ(Ci 4Di ) = 0, i = 1, . . . , p, µ(Di ) = 0, i = p + 1, . . . , s.
1.2. Entropı́a de una partición
A partir de ahora, la expresión 0 log(0) la consideraremos igual a 0. Sea ξ = {A1 , . . . , Ak }
partición de (X, A, µ), donde la probabilidad de que salga Ai , es µ(Ai ). Queremos describir el
número H(ξ) que nos dice la cantidad de incertidumbre sobre el resultado del experimento. Su-
pongamos que H(ξ) sólo depende de los números {µ(A1 ), . . . , µ(Ak )}. Sean ξ = {A1 , . . . , Ak }
y η = {B1 , . . . , Bl } dos particiones de (X, A, µ) y supongamos que queremos obtener H(ξ)
sabiendo H(η).
H(ξ) = H(µ(A1 ), . . . , µ(Ak )).
Si sabemos el resultado de que ocurra Bj , entonces
µ(Ai ∩ Bj )
µ(Ai /Bj ) = .
µ(Bj )
Ası́, la incertidumbre sobre el resultado de ξ dado Bj es

µ(A1 ∩ Bj ) µ(Ak ∩ Bj )
H ,..., .
µ(Bj ) µ(Bj )
Por lo tanto, la incertidumbre sobre el resultado de ξ dado η es

l
X µ(A1 ∩ Bj ) µ(Ak ∩ Bj )
H(ξ/η) = µ(Bj )H ,..., .
µ(Bj ) µ(Bj )
j=1
n o
(p1 , . . . , pk ) ∈ Rk : pi ≥ 0, ki=1 pi = 1 .
P
Teorema 1.1. Sea 4k = Supongamos
H: ∞
S
k=1 4k → R tiene las siguientes propiedades:
a) H(p1 , . . . , pk ) ≥ 0, y H(p1 , . . . , pk ) = 0 si existe i tal que pi = 1.
b) Para cada k ≥ 1, H|4k es continua.
c) Para cada k ≥ 1, H|4k es simétrica.

1 1

d) Para cada k ≥ 1, H|4k tiene su mayor valor en k,..., k .
e) H(ξ ∨ η) = H(ξ) − H(η/ξ)
f ) H((p1 , . . . , pk , 0)) = H((p1 , . . . , pk )).

Pk
Entonces existe λ > 0 talque H(p1 , . . . , pk ) = −λ i=1 pi log(pi ).
Demostración. Consideremos la función U : N → R definida por U (k) = H(1/k, . . . , 1/k).

Comenzaremos probando que existe una constante λ > 0 tal que U (k) = λ log(k), para todo
k ∈ N. Ahora, por las hipótesis, tenemos
U (k) = H(1/k, . . . , 1/k, 0) ≤ H(1/(k + 1), . . . , 1/(k + 1)) = U (k + 1)

es decir, U es una función no decreciente. Afirmamos que para todo n, k ∈ N se cumple
U (k n ) = nU (k). Consideremos k experimentos independientes entre sı́ que tengan resulta-
dos equidistribuidos (1/k, . . . , 1/k). La distribución del experimento conjunto es entonces
(1/k n , . . . , 1/k n ), y ası́ tenemos
U (k n ) = H(1/k n , . . . , 1/k n )
Xn
= H(1/k, . . . 1/k)
i=1
= nH(1/k, . . . , 1/k)
= nU (k).
Tomemos en cuenta ahora dos enteros positivos arbitrarios m y k. Para cada n ∈ N, existe
0 0
un único k 0 = k 0 n ∈ N tal que mk < k n ≤ mk +1 . Observe que estas desigualdades implican
k0 log(k) k0 1
≤ ≤ +
n log(m) n n
y por lo tanto
k0 log(k)
lı́m = .
n→∞ n log(m)
Por otra parte, como U es monótona y tenemos que U (k n ) = nU (k), entonces
k 0 U (m) ≤ nU (k) ≤ (k 0 + 1)U (m)
por lo que tenemos

U (k) log(k) 1
U (m) − log(m) ≤ n .

U (k) U (m)
Tomando el lı́mite cuando n → ∞, tenemos que log(k) = log(m) . Como m y k son enteros positi-
vos arbitrarios, la expresión anterior es constante (y positiva), es decir, que existe λ > 0 tal que
P k ∈ N, como querı́amos probar. Fijemos ahora k P
U (k) = λ log(k), para todo números raciona-
les pi = qi /q tales que pi = 1. Queremos probar que H(p1 , . . . , pk ) = −λ ki=1 pi log(1/pi ).
Para ello, consideremos un experimento a k resultados Ai de probabilidad pi . Imaginemos
ahora otro experimento dependiente del primero consistente de q eventos B1 , . . . , Bq tales que
dichos eventos pueden ser distribuidos en k grupos conteniendo respectivamente q1 , . . . , qk ele-
mentos, y si el evento Ai tuvo lugar en el primer experimento, entonces en el segundo sólo
pueden ocurrir los eventos del i-ésimo grupo, cada uno con la misma probabilidad 1/qi . Las
condiciones impuestas determinan únicamente la entropı́a condicional:
k
X k
X k
X
H(P2 /P1 ) = pi H(1/qi , . . . , 1/qi )λ pi log(qi ) = λ pi log(pi ) + λ log(q).
i=1 i=1 i=1
Por otra parte, para i ∈ {1, . . . , k}, cada evento de la forma Ai ∩ Bj se produce con
probabilidad nula o igual a pi /qi = 1/q, y ésta última situación se produce exactamente en
qi ocasiones. Esto implica que H(P1 ∨ P2 ) = λ log(q), por lo que nos da
k
X
H(P1 ) + λ pi log(pi ) + λ log(q) = λ log(q)
i=1
y ası́
k
X
H(p1 , . . . , pk ) = −λ pi log(pi ).
i=1
Definición 1.6. Sea B sub-σ-álgebra finita

Pk de A tal que ξ(B) = {B1 , . . . , Bk }. La entropı́a
de B (o de ξ(B)) es H(B) = H(ξ) = − i=1 µ(Bi ) log(µ(Bi )).
Observación 1.3. 1. Si B = {X, ∅}, entonces H(B) = 0. En efecto,

2
X
H(B) = − µ(Bi ) log(µ(Bi ))
i=1
= −µ(X) log(µ(X)) − µ(∅) log(µ(∅))
= −1 log(1) − 0 log(0)
= 0.
1
2. Si ξ(B) = {B1 , . . . , Bk }, donde µ(Bi ) = k, para todo i = 1, . . . , k, entonces H(B) =
log(k). En efecto,
k k
X X 1 1 k 1
H(B) = − µ(Bi ) log(µ(Bi )) = − log = − log = log(k).
k k k k
i=1 i=1
3. H(B) ≥ 0. En efecto, como (X, A, µ) es espacio de probabilidad,

P entonces 0 ≤ µ(Bi ) ≤ 1,
ası́ log(µ(Bi )) ≤ 0, entonces µ(Bi ) log(µ(Bi )) ≤ 0, luego − ki=1 µ(Bi ) log(µ(Bi )) ≥ 0.
Por lo tanto, H(B) ≥ 0.
4. Si B $ C, entonces H(B) = H(C).
5. Si T : X → X preserva medida, entonces H(T −1 B) = H(B). En efecto,

k
X k
X
−1 −1 −1
H(T B) = − µ(T Bi ) log(µ(T Bi )) = − µ(Bi ) log(µ(Bi )) = H(B).
i=1 i=1
Teorema 1.2. La función φ : [0, ∞) → R definida por

0 si x = 0
φ(x) =
x log(x) 6 0
si x =
es estrictamente convexa, i.e., si x, y ∈ [0, ∞) y α, β ≥ 0 tal que α + β = 1, entonces

φ(αx + βy) ≤ αφ(x) + βφ(y), y la igualdad P se da si x = y o, si α = 0 o bien β = 0.
Inductivamente, si xi ∈ [0, ∞), αi ≥ 0 tal que ki=1 αi = 1, entonces
k k
!
X X
φ αi xi ≤ αi φ(xi )
i=1 i=1
y la igualdad se da cuando xi = xj .
Demostración. Sea α, β > 0 fijos tal que α+β = 1. Sin pérdida de generalidad, supongamos
que y > x. Por el teorema de valor medio,
i) Existe z ∈ (αx + βy, y) tal que
φ(y) − φ(αx + βy) φ(y) − φ(αx + βy) φ(y) − φ(αx + βy)

φ0 (z) = = = .
y − αx − βy y − αx − (1 − α)y α(y − x)
Por lo tanto, φ(y) − φ(αx + βy) = αφ0 (z)(y − x).
ii) Existe w ∈ (x, αx + βy) tal que
φ(αx + βy) − φ(x) φ(αx + βy) − φ(x) φ(αx + βy) − φ(x)

φ0 (w) = = = .
αx + βy − x (1 − β)x + βy − x β(y − x)
Por lo tanto, φ(αx + βy) − φ(x) = βφ0 (w)(y − x).
Ahora, φ(x) = x log(x), φ0 (x) = log(x)+1, φ00 (x) = x1 . Como φ00 (x) > 0, para todo x ∈ (0, ∞),
entonces φ0 es creciente, ası́, si x < w < αx + βy < z < y, entonces φ0 (w) < φ0 (z). Luego,
β(φ(y) − φ(αxβy)) = φ0 (z)αβ(x − y) = φ0 (w)αβ(x − y) = α(φ(αxβy) − φ(x)).
Finalmente, se tiene
αφ(αx + βy) − αφ(x) < βφ(y) − β(αx + βy)

(α + β)φ(αx + βy) < αφ(x) + βφ(y)
φ(αx + βy) < αφ(x) + βφ(y).
Corolario 1.1. Si ξ = {A1 , . . . , Ak }, entonces H(ξ) ≤ log(k) y H(ξ) = log(k) si µ(Ai ) = k1 ,
para todo i = 1, . . . , k.
1
Demostración. Sea αi = k y xi = µ(Ai ) como en el teorema anterior, ası́
k k
!
X X 1
φ µ(Ai ) ≤ φ(µ(Ai )).
k
i=1 i=1
Aplicando la definición de φ tenemos

k k k
!
1X 1X 1X
µ(Ai ) log µ(Ai ) ≤ µ(Ai ) log(µ(Ai ))
k k k
i=1 i=1 i=1
k
X 1
− µ(Ai ) log(µ(Ai )) ≤ − log
k
i=1
H(ξ) ≤ log(k).
1.3. Entropı́a Condicional

Definición 1.7. Sean B, C sub-σ-álgebras finitos de A y ξ(B) = {B1 , . . . , Bk }, ξ(C) =
{C1 , . . . , Cp }. La entropı́a de B dado C es el número
p k
X X µ(Bi ∩ Cj )
µ(Bi ∩ Cj )
H(ξ(B)/ξ(C)) = H(B/C) = − µ(Cj ) log
µ(Cj ) µ(Cj )
j=1 j=1

X µ(Bi ∩ Cj )
=− µ(Bi ∩ Cj ) log
µ(Cj )
i,j
omitiendo los j-elementos donde µ(Cj ) = 0.
Observación 1.4. 1. Si N = {∅, X}, entonces H(B/N ) = H(B), ya que

k
X µ(Bi ∩ Cj ) X
H(B/N ) = − µ(Bi ∩ Cj ) log =− µ(Bi ) log(µ(Bi )) = H(B).
µ(Cj )
i,j i=1
2. H(B, C) ≥ 0.
3. Si B $ D, entonces H(B/C) = H(D/C).
4. Si C $ D, entonces H(B/C) = H(B/D).

Teorema 1.3. Sea (X, A, µ) un espacio de probabilidad. Si B, C y D son sub-σ-álgebras finitas
de A, entonces
a) H(B ∨ C/D) = H(B/D) + H(C/B ∨ D).
b) H(B ∨ C) = H(B) + H(C/B).
c) Si B ⊆ C, entonces H(B/D) ≤ H(C/D).
d) Si B ⊆ C, entonces H(B) ≤ H(C).
e) Si C ⊆ D, entonces H(B/C) ≥ H(B/D).
f ) H(B) ≥ H(B/D).
g) H(B ∨ C/D) ≤ H(B/D) + H(C/D).
h) H(B ∨ C) ≤ H(B) + H(C).
i) Si T preserva medida, entonces H(T −1 B/T −1 C) = H(B/C).
j) H(T −1 B) = H(B).
Demostración. Sean ξ(B) = {Bi }, ξ(C) = {Cj }, ξ(D) = {Dk }.

P µ(Bi ∩Cj ∩Dk )
a) H(B ∨ C/D) = − i,j,k µ(Bi ∩ Cj ∩ Dk ) log µ(Dk ) , pero
µ(Bi ∩ Cj ∩ Dk ) µ(Bi ∩ Cj ∩ Dk ) µ(Bi ∩ Dk )

=
µ(Dk ) µ(Bi ∩ Dk ) µ(Dk )
a menos que µ(Bi ∩ Dk ) = 0, entonces

X µ(Ai ∩ Dk )
H(B ∨ C/D) = − µ(Ai ∩ Cj ∩ Dk ) log
µ(Dk )
i,j,k

X µ(Ai ∩ Cj ∩ Dk )
=− µ(Ai ∩ Cj ∩ Dk ) log
µ(Ai ∩ Dk )
i,j,k

X µ(Ai ∩ Dk )
=− µ(Ai ∩ Dk ) log + H(C/B ∨ D)
µ(Dk )
i,k
= H(B/D) + H(C/B ∨ D).
b) Sea D = {X, ∅}, entonces
H(B ∨ C) = H(B ∨ C/D) = H(B/D) + H(C/B ∨ D) = H(B) + H(C/B).
c) Por a) tenemos que
H(C ∨ D) = H(B ∨ C/D) = H(B/D) + H(C/B ∨ D) ≥ H(B/D).

d) Sea D = {X, ∅}, entonces
H(C) = H(C/D) ≥ H(B/D) = H(B).
µ(Dk ∩Cj ) µ(Bi ∩Dk )

e) Fijemos i, j y sea αk = µ(Cj ) , xk = µ(Dk ) . Por teorema anterior, tenemos
!
X X
φ αk xk ≤ αk φ(xk ),
k k
!
X µ(Dk ∩ Cj ) µ(Bi ∩ Dk ) X µ(Dk ∩ Cj ) µ(Bi ∩ Dk )
φ ≤ φ .
µ(Cj ) µ(Dk ) µ(Cj ) µ(Dk )
k k
Pero C ⊆ D, luego
!
X µ(Dk ) µ(Bi ∩ Dk ) X µ(Dk ) µ(Bi ∩ Dk ) µ(Bi ∩ Dk )
φ ≤ log ,
µ(Cj ) µ(Dk ) µ(Cj ) µ(Dk ) µ(Dk )
k k
!
1 X X µ(Bi ∩ Dk ) µ(Bi ∩ Dk )
φ µ(Bi ∩ Dk ) ≤ log .
µ(Cj ) µ(Cj ) µ(Dk )
k k
P
Pero k µ(Bi ∩ Dk ) = µ(Bi ∩ Dj ), por lo tanto

µ(Ai ∩ Cj ) 1 X µ(Bi ∩ Dk )
φ ≤ µ(Bi ∩ Dk ) log ,
µ(Cj ) µ(Cj ) µ(Dk )
k

µ(Bi ∩ Cj ) µ(Bi ∩ Cj ) 1 X µ(Bi ∩ Dk )
log ≤ µ(Bi ∩ Dk ) log .
µ(Cj ) µ(Cj ) µ(Cj ) µ(Dk )
k
Multiplicando por µ(Cj ) y haciendo la suma sobre i y j, finalmente tenemos

X
X µ(Bi ∩ Cj ) µ(Bi ∩ Dk )
µ(Bi ∩ Cj ) log ≤ µ(Bi ∩ Dk ) log ,
µ(Cj ) µ(Dk )
i,j i,k
−H(B/C) ≤ −H(B/D),
H(B/D) ≤ H(B/C).
f) Sea C = {X, ∅}, ası́, C ⊆ D, y por e) tenemos H(B/D) ≤ H(B/C) = H(B).
g) Por a), sabemos que H(B ∨ C/D) = H(B/D) + H(C/B ∨ D), pero D ⊆ B ∨ D, entonces
H(C/B ∨ D) ≤ H(C/D), por lo tanto H(B ∨ C/D) ≤ H(B/D) + H(C/D).
h) Sea D = {X, ∅}, luego
H(B ∨ C) = H(B ∨ C/D) ≤ H(B/D) + H(C/D) = H(B) + H(C).

i) Si T preserva medida, entonces
µ(T −1 Bi ∩ T −1 Cj )
X
−1 −1 −1 −1
H(T B/T C) = − µ(T Bi ∩ T Cj ) log
µ(T −1 Cj )
i,j
µ(T −1 (Bi ∩ Cj ))
X
−1
=− µ(T (Bi ∩ Cj )) log
µ(T −1 Cj )
i,j

X µ(Bi ∩ Cj )
=− µ(Bi ∩ Cj ) log
µ(Cj )
i,j
= H(B/C).
j) Como T preserva medida

k
X k
X
H(T −1 B) = − µ(T −1 Bi ) log(µ(T −1 Bi )) = − µ(Bi ) log(µ(Bi )) = H(B).
i=1 i=1
Teorema 1.4. Sean B, C sub-σ-álgebras finitas de A, entonces
a) H(B/C) = 0 (i.e., H(B ∨ C) = H(C)) si y solamente si B ⊂ C mod (0).
b) H(B/C) = H(B) (i.e., H(B∨C) = H(B)+H(C)) si y solamente si B y C son independientes

(i.e., µ(B ∩ C) = µ(B)µ(C), B ∈ B, C ∈ C).
Demostración. Sean ξ(B) = {B1 , . . . , Bk ) y ξ(C) = {C1 , . . . , Cp }. Supongamos que µ(Bi ) 6=

0 y µ(Cj ) 6= 0.
a) Supongamos que B ⊂ C mod (0), entonces µ(Bi ∩ Cj ) = µ(Cj ), o bien, µ(Bi ∩ Cj ) = 0.

Ası́,
• Si µ(Bi ∩ Cj ) = µ(Cj ), entonces

X µ(Bi ∩ Cj ) X µ(Cj )
H(B/C) = − µ(Bi ∩ Cj ) log =− µ(Cj ) log = 0.
µ(Cj ) µ(Cj )
i,j i,j
• Si µ(Bi ∩ Cj ) = 0, entonces

X µ(Bi ∩ Cj ) X
H(B/C) = − µ(Bi ∩ Cj ) log =− 0 log(0) = 0.
µ(Cj )
i,j i,j
Ahora supongamos que H(B/C) = 0, entonces

X µ(Bi ∩ Cj )
− µ(Bi ∩ Cj ) log = 0.
µ(Cj )
i,j
Pero como
µ(Bi ∩ Cj )
−µ(Bi ∩ Cj ) log ≥0
µ(Cj )
para todo i, j, entonces

µ(Bi ∩ Cj )
µ(Bi ∩ Cj ) log = 0,
µ(Cj )

µ(Bi ∩Cj )
para todo i, j. Luego, µ(Bi ∩ Cj ) = 0 o log µ(Cj ) = 0, y ası́ µ(Bi ∩ Cj ) = 0 o
µ(Bi ∩ Cj ) = µ(Cj ). Por lo tanto, B ⊂ C mod (0).
b) Supongamos que B y C son independientes, entonces

X µ(Bi ∩ Cj )
H(B/C) = − µ(Bi ∩ Cj ) log
µ(Cj )
i,j

X µ(Bi )µ(Cj )
=− µ(Bi )µ(Cj ) log
µ(Cj )
i,j
X
=− µ(Bi )µ(Cj ) log(µ(Bi ))
i,j
k
X p
X
=− µ(Bi ) log(µ(Bi )) µ(Cj )
i=1 j=1
= H(B).
Ahora supongamos que H(B/C) = H(B), entonces

p
k X k
X µ(Bi ∩ Cj ) X
− µ(Bi ∩ Cj ) log =− µ(Bi ) log(µ(Bi )).
µ(Cj )
i=1 j=1 i=1
µ(Bi ∩ Cj )
Fijando i y aplicando el Teorema 1.2, con αj = µ(Cj ) y xj = , entonces
µ(Cj )
 
p p
X µ(Bi ∩ C j ) ≤
X µ(B i ∩ C j )
φ µ(Cj ) µ(Cj )φ .
µ(Cj ) µ(Cj )
j=1 j=1
Aplicando la definición de φ tenemos

 
p p p
X X X µ(B i ∩ C j ) µ(B i ∩ C j )
µ(Bi ∩ Cj ) log  µ(Bi ∩ Cj ) ≤ µ(Cj ) log
µ(Cj ) µ(Cj )
j=1 j=1 j=1
p
X µ(Bi ∩ Cj )
− µ(Bi ∩ Cj ) log ≤ −µ(Bi ) log(µ(Bi ))
µ(Cj )
j=1
µ(Bi ∩ Cj ) µ(Bi ∩ Cj )
y se tiene la igualdad cuando no depende de j. Dado esto, sea ai = ,
µ(Cj ) µ(Cj )
entonces ai µ(Cj ) = µ(Bi ∩ Cj ). Ası́,
p
X µ(Bi ∩ Cj )
− µ(Bi ∩ Cj ) log = −µ(Bi ) log(µ(Bi ))
µ(Cj )
j=1
p
X ai µ(Cj )
ai µ(Cj ) log = µ(Bi ) log(µ(Bi ))
µ(Cj )
j=1
p
X
ai log(ai ) µ(Cj ) = µ(Bi ) log(µ(Bi ))
j=1
ai log(ai ) = µ(Bi ) log(µ(Bi )).

Por lo tanto, ai = µ(Bi ), finalmente, µ(Bi ∩ Cj ) = µ(Bi )µ(Cj ), pero es para todo i, j,
luego, µ(A ∩ C) = µ(A)µ(C).
1.4. Entropı́a de una transformación que preserva medida

Recordemos que si ξ(B) = {B1 , . . . , Bk }, entonces
k
X
H(ξ(B)) = H(B) = − µ(Bi ) log(µ(Bi )).
i=1
La segunda etapa de la definición de la entropı́a de una transformación que preserva me-

dida
W T es dadaporWla siguiente definición. Recordemos que los elementos de la partición
n−1 −i n−1 −i Tn−1 −i
ξ i=0 T (B) = i=0 T ξ(B) son todos los conjuntos de la forma i=0 T (Bji ).
Definición 1.8. Supongamos T : X → X es una transformación que preserva medida del

espacio de probabilidad (X, A, µ). Si B es una sub-σ-álgebra de A, entonces
n−1
!
1 _
h(T, ξ(B)) = h(T, B) = lı́m H T −i (B)
n→∞ n
i=0
es llamada la entropı́a de T con respecto a B.
Esto significa
Wn−1 −ique si pensamos en una aplicación de T como un pasaje de un dı́a de tiempo,
entonces i=0 T (B) representa la experiencia combinada de realizar el experimento original,
representado por B, en n dı́as consecutivos. Entonces h(T, B) es la media de información por
dı́a que uno obtiene de realizar el experimento original para siempre.
Observación 1.5. h(T, B) ≥ 0.
Ahora podemos dar la última etapa de la definición de la entropı́a de una transformación

que preserva medida.
Definición 1.9. Sea T : X → X una transformación que preserva medida del espacio de
probabilidad (X, A, µ), entonces h(T ) = sup h(T, B), donde el supremo se toma sobre todas
las sub-σ-álgebras finitas B de A, es llamada la entropı́a de T . Equivalentemente, h(T ) =
sup h(T, ξ), donde el supremo se toma sobre todas las particiones finitas de (X, A, µ).
Si pensamos, como lo hicimos anteriormente, en una aplicación de T como un pasaje de

un dı́a de tiempo, entonces h(T ) es la media de información máxima por dia que se obtiene
realizando el mismo experimento diariamente.
Observación 1.6. 1. 0 ≤ h(T ) ≤ +∞.
2. h(Id = 0. Si h(T ) = 0, entonces h(T, B) = 0, para todo B, lo que implica que

Wn−1X ) −i
i=0 T (B) no cambia mucho si n → ∞.
3. Si el logaritmo es usado en otra base, entonces la entropia de una transformación

se multiplica por una constante dependiendo solamente de la base empleada. Algunos
autores usan logaritmo en base 2.
Ahora, vamos a demostrar la existencia del lı́mite de la Definición 1.9. Lo haremos de 2

formas, la primera, usa un resultado simple de sucesiones de números reales y también puede
ser aplicado para probar el resultado correspondiente para entropı́a topológica, mientras que
la segunda forma usa propiedades de entropı́a condicional pero da un resultado más fuerte.
Teorema 1.5. Si {an }n≥1 es una sucesión de números reales tal que an+p ≤ an + ap , para
todo n, p ∈ N, entonces lı́mn→∞ ann existe y es igual a ı́nf ann . (El lı́mite puede ser −∞ pero
si {an } es acotada inferiormente entonces el lı́mite será no-negativo.)
Demostración. Fijemos p > 0. Cada n > 0 puede ser escrito n = kp + i, con 0 ≤ i < p.
Entonces
an akp+i ai akp ai kap ai ap
= ≤ + ≤ + = + .
n kp + i kp kp kp kp kp p
ap ap ap
Si n → ∞, entonces k → ∞, ası́ lı́m ann ≤ p , y por lo tanto lı́m ann ≤ ı́nf p , pero ı́nf p ≤
lı́m ann , luego
an an
lı́m = ı́nf .
n→∞ n n
Corolario 1.2. Sea T : X → X es una transformación

! que preserva medida y B una sub-σ-
n−1
1 _
álgebra finita de A, entonces lı́m H T −i (B) existe.
n→∞ n
i=0
n−1
!
_
Demostración. Sea an = H T −i (B) ≥ 0. Entonces
i=0
n+p−1
!
_
−i
an+p = H T (B)
i=0
n−1 n+p−1
! !
_ _
≤H T −i (B) +H T −i (B) por Teorema 1.3, parte h
i=0 i=n
p−1
!
_
= an + H T −i (B) por Teorema 1.3, parte j
i=0
= an + ap .
Entonces aplicando el Teorema 1.5, se obtiene el resultado.
Teorema 1.6. Sea T : X → WX es una transformación

que preserva medida y B un sub-σ-
1 n−1 −i
álgebra de A, entonces n H i=0 T (B) decrece a h(T, B).
Demostración. Primero demostraremos por inducción que

n−1 n−1 j
! !
_ X _
−i −i
H T (B) = H(B) + H B/ T B .
i=0 j=1 i=1
Para n = 1 es claro. Ahora, si asumimos verdadero para n = p, también se da para n = p + 1,

ya que
p p
! !
_ _
H T −i (B) = H T −i (B) ∨ B
i=0 i=1
p p
! !
_ _
=H T −i (B) +H B/ T −i (B)
i=1 i=1
p−1 p
! !
_ _
=H T −i (B) +H B/ T −i (B)
i=0 i=1
p j
!
X _
−i
= H(B) + H B/ T (B) .
j=1 i=1
Por lo tanto,
Wn−1 la−i
fórmula se da para n ∈ N. A partir de esto y por el Teorema 1.3, tenemos
Wntodo−i
que H( i=0 T (B)) ≥ nH(A/ i=1 T (B)), ası́
n n−1 n
! ! !!
_ _ _
−i −i −i
nH T B =n H T B + H B/ T B
i=0 i=0 i=1
n−1
!
_
≤ (n + 1)H T −i B .
i=0
Luego
n n−1
! !
1 _
−i 1 _
−i
H T (B) ≤ H T B .
n+1 n
i=0 i=0
Definición 1.10. Sean (X1 , A1 , µ1 ), (X2 , A2 , µ2 ) espacios de probabilidad, y T1 : X1 → X1 ,

T2 : X2 → X2 transformaciones que preservan medida. Decimos que T1 es isomorfa a T2
si existen M1 ∈ A1 , M2 ∈ A2 con µ1 (M1 ) = µ2 (M2 ) = 1 y existe φ : M1 → M2
transformación que preserva medida invariante tal que T1 ◦ φ = φ ◦ T2 .
Definición 1.11. T1 se dice conjugada a T2 si existe Φ : (Ã2 , µ˜2 ) → (Ã1 , µ˜1 ) isomorfismo
de álgebras de medida tal que Φ ◦ T2˜−1 = T1˜−1 ◦ Φ.
Teorema 1.7. Entropı́a es un invariante por conjugación, esto es, si T1 es conjugada a T2 ,

entonces h(T1 ) = h(T2 ).
Demostración. Sean T1 : X1 → X1 , T2 : X2 → X2 transformaciones que preservan medida, y

sea φ : (Ã2 , µ˜2 ) → (Ã1 , µ˜1 ) un isomorfismo de álgebras medibles tal que φ◦T2−1 = T1−1 ◦φ. Sea
B2 finito, B2 ⊂ A2 , y ξ(B2 ) = {B1 , . . . , Br }. Escojamos Ai ∈ A1 talque ÃiT= φ(Ãi ), ası́ η =
n−1 −i
{A1 , . . . , Ar } forma una partición de (X , A1 , µ1 ). Sea B1 = B(η). Ahora, i=0
T1n−1 T1 Aqi , qi ∈
{1, . . . , r}, tiene la misma medida que i=0 T2−i Bqi , ya que
n−1 n−1
! !
\ \
φ (T2−i Aqi )˜ =φ T̃2−i Ãqi
i=0 i=0
n−1
\
= T̃1−i φ(Ãqi )
i=0
n−1
\
= T̃1−i B̃qi
i=0
\
= (T1−i Bqi )˜.
Entonces, H( n−1 −i
W Wn−1 −i
i=0 T1 B1 ) = H( i=0 T2 B2 ), lo cual implica que h(T1 , B1 ) = h(T2 , B2 ),
y ası́ h(T1 ) ≥ h(T2 ). Por simetrı́a, tenemos que h(T1 ) = h(T2 ).
La demostración del Teorema 1.7 también muestra que si T2 es un factor de T1 (o una

imagen semi-conjugada ) entonces h(T2 ) ≤ h(T1 ). Después de desarrollar algunas propiedades
de h(T, B) y h(T ), consideraremos el problema de cómo calcular h(T ). Estos cálculos y el
Teorema 1.7 nos permitirá dar ejemplos de transformaciones que preservan medida no-
conjugadas.
1.5. Propiedades de h(T, B) y h(T )
Recordemos que
n−1
!
_
−i
h(T, B) = lı́m H T B .
n→∞
i=0
Teorema 1.8. Sean B, C son sub-álgebras de A y T una transformación del espacio de

probabilidad (X, A, µ). Entonces
a) h(T, B) ≤ H(B).
b) h(T, B ∨ C) ≤ h(T, B) + h(T, C).
c) B ⊆ C ⇒ h(T, B) ≤ h(T, C).
d) h(T, B) ≤ h(T, C) + H(B/C).
e) h(T, T −1 B) = h(T, B).
f ) Si k ≥ 1, entonces
k−1
!
_
−i
h(T, B) = h T, T B .
i=0
g) Si k ≥ 1 y T es invertible, entonces
k
!
_
h(T, B) = h T, T iB .
i=−k
Demostración. a)
n−1
!
1 _
−i
h(T, B) = lı́m H T B
n→∞ n
i=0
n−1
1 X
≤ lı́m H(T −i B) (por Teorema 1.3)
n→∞ n
i=0
n−1
1 X
= lı́m H(B) (por Teorema 1.3, parte j)
n→∞ n
i=0
= H(B).
b)
n−1
!
1 _
h(T, B ∨ C) = lı́m H T −i (B ∨ C)
n→∞ n
i=0
n−1 n−1
!
1 _ _
= lı́m H T −i B ∨ T −i C
n→∞ n
i=0 i=0
n−1 n−1
! !
1 _
−i 1 _
−i
≤ lı́m H T B + lı́m H T C (por Teorema 1.3, parte h)
n→∞ n n→∞ n
i=0 i=0
= h(T, B) + h(T, C).
Wn−1 Wn−1
c) Si B ⊆ C, entonces i=0 T −i B ⊆ i=0 T −i C, con n ≥ 1. Ahora,
n−1
!
1 _
−i
h(T, B) = lı́m H T B
n→∞ n
i=0
n−1
!
1 _
≤ lı́m H T −i C (por Teorema 1.3, parte d)
n→∞ n
i=0
= h(T, C).
Wn−1 W W
n−1 −i n−1 −i
d) Sabemos que i=0 T −i B ⊆ i=0 T B ∨ i=0 T C , entonces
n−1
!
1 _
h(T, B) = lı́m H T −i B
n→∞ n
i=0
n−1 n−1
! !!
1 _
−i
_
−i
≤ lı́m H T B ∨ T C (por Teorema 1.3, parte d)
n→∞ n
i=0 i=0
n−1 n−1 n−1
! ! !!
1 _ 1 _ _
= lı́m H T −i C + lı́m H T −i B / T −i C ,
n→∞ n n→∞ n
i=0 i=0 i=0
donde la última igualdad se obtiene por la parte b del Teorema 1.3. Pero por Teorema
1.3, parte g
n−1
! n−1
!! n−1  
n−1

_ _ X _
H T −i B / T −i C ≤ H T −i B/  T −j C 
i=0 i=0 i=0 j=0
n−1
X
≤ H(T −i B/T −i C) (por Teorema 1.3, parte e)
i=0
n−1
X
= H(B/C) (por Teorema 1.3, parte i)
i=0
= nH(B/C).
Ası́,
n−1 n−1 n−1
! ! !!
1 _ 1 _ _
h(T, B) ≤ lı́m H T −i C + lı́m H T −i B / T −i C
n→∞ n n→∞ n
i=0 i=0 i=0
≤ h(T, C) + H(B/C).
e)
n−1
!
1 _
h(T, T −1 B) = lı́m H T −i T −1 B
n→∞ n
i=0
n
!
1 _
= lı́m H T −i B
n→∞ n
i=1
n−1
!
1 _
−i
= lı́m H T B (por Teorema 1.3, parte j)
n→∞ n
i=0
= h(T, B).
f)
 !
k n−1 k
!
_ 1  _ _
h T, T −i B = lı́m H T −j T −i B 
n→∞ n
i=0 j=0 i=0
k+n−1
!
1 _
−i
= lı́m H T B
n→∞ n
i=0
k+n−1
!
k+n−1 1 _
= lı́m H T −i B
n→∞ n k+n−1
i=0
= h(T, B).
g) Por la parte (e) y (f) tenemos

k 2k
! !
_ _
h T, T −i B = h T, T −i B = h(T, B).
i=−k i=0
Gracias al Teorema 1.8, podemos deducir simples propiedades de h(T ).
Teorema 1.9. Sea T una transformación que preserva medida del espacio de probabilidad
(X, A, µ).
a) Para k > 0, h(T k ) = k · h(T ).

b) Si T es invertible, entonces h(T k ) = |k| · h(T ), para todo k ∈ Z.
Demostración. a) Primero demostraremos que h(T k , k−1 −i
W
i=0 T B) = kh(T, B) si k > 0.
 !
k−1 k−1 k−1
_ 1 _ _
h(T k , T −i B) = lı́m H  T −kj T −i B 
n→∞ n
i=0 j=0 i=0
nk−1
!
k _
−i
= lı́m H T B
n→∞ nk
i=0
= k · h(T, B).
Ası́,
k−1
!
_
k −i
k · h(T ) = k · sup h(T, B) = sup h T , T B ≤ sup h(T k , C) = h(T k ).
B B i=0 C
Además,
k−1
!
_
h(T k , B) ≤ h T k , T −i B = k · h(T, B),
i=0
y ası́, tomando supremo, tenemos h(T k ) ≤ k · h(T ). Por lo tanto, h(T k ) = k · h(T ).
b) Es suficiente demostrar que h(T −1 ) = h(T ), lo que equivale a mostrar que h(T −1 , B) =
h(T, B), para todo B finito. Pero
n−1 n−1 n−1
! ! !
_ _ _
i −(n−1) i −i
H T B =H T T B =H T B .
i=0 i=0 i=0
Vamos a obtener más información en cómo se comporta h(T ) relativamente a operaciones

naturales en transformaciones, cuando probemos algunos resultados que harán este cálculo
más simple. El siguiente resultado nos permitirá entender cuando h(T, B) es cero, y permi-
tirnos concluir que una transformación que preserva medida no invertible T , la cual no es
mod 0 invertible (i.e., T −1 6= B) obligadamente tiene entropı́a positiva (estricta).
Teorema 1.10. Sea B una sub-σ-álgebra finita de A y T una transformación que preserva
medida del espacio de probabilidad (X, A, µ), entonces
n ∞
! !
_ _
h(T, B) = lı́m H B/ T −i B = H B/ T −i B
n→∞
i=1 i=0
Demostración. El lı́mite existe dado que el lado derecho no es cada vez mayor en n por el
Teorema 1.3, parte e. Ahora, por la demostración del Teorema 1.6 que para n ≥ 1, tenemos
n−1 n−1 j
! !
_ X _
H T −i B = H(B) + H B/ T −i B .
i=0 j=1 i=1
Diviendo por n y tomando lı́mite, obtenemos
n−1 n−1 j
! !
1 _ 1 1X _
lı́m H T −i B = lı́m H(B) + lı́m H B/ T −i B
n→∞ n n→∞ n n→∞ n
i=0 j=1 i=1
∞
!
_
h(T, B) = H B/ T −i B
i=0
donde la parte derecha de la igualdad se da debido al lı́mite de Cesaro.
Corolario 1.3. Sea T una transformación que preserva medida del espacio de probabilidad
W∞A, µ)
(X,
−i
y sea B una sub-álgebra finita de A. Entonces h(T, B) = 0 si y solamente si B ⊂
i=1 T B mod (0).
1.6. Algunos métodos para calcular h(T )

Es difı́cil calcular h(T ) de su definición ya que uno necesitarı́a calcular h(T, B), para toda
sub-álgebra finita B. Vamos a considerar que condiciones en una sub-álgebra B son necesarias
para asegurar h(T ) = h(T, B) (y ası́ simplificar el cálculo de h(T )), y también considerar
condiciones en una sucesión Bn de sub-álgebras implicarán h(T ) = lı́mn→∞ h(T, Bn ). Estos
resultados llevan a los métodos de calcular h(T ) para ejemplos especı́ficos de transformaciones
que preservan medida, y también nos llevan a demostrar algunas propiedades de h(T ).
Lema 1.1. Sea r ≥ 1 un entero fijo. Para todo ε > 0, existe δ > 0, tal que si ξ =
{B1 , . . . , Br }, η = {C1 , . . . , Cr } son dos particiones de (X, A, µ) de r conjuntos, con
r
X
µ(Ai 4C1 ) < δ
i=1
, entonces H(ξ/η) + H(η/ξ) < ε.
Demostración. Sea ε > 0, elijamos δ > 0 tal que δ < 41 y −r(r − 1)δ
Srlog(δ) − (1 − δ) log(1 −
ε
los conjuntos Bi ∩ Cj (i 6= j), y i=1 (Bi ∩ Ci ). Entonces
δ) < 2 . Sea ζ la partición en S
ξ ∨ η = η ∨ ζ y como Bi ∩ Cj ⊂ rn=1 (An 4Cn ) (i 6= j), tenemos que µ(Bi ∩ Cj ) < δ(i 6= j) y
r
!
[
µ (Bi ∩ Cj ) > 1 − δ.
i=1
Luego, H(ζ) < r(r − 1)δ log(δ) − (1 − δ) log(1 − δ) < 2ε . Por lo tanto H(η) + H(ε/η) =
H(ξ ∨ η) = H(η ∨ ζ) ≤ H(η) + H(ζ) < H(η) + 2ε , y ası́, H(ξ/η) < 2ε . Por simetrı́a, también
tenemos que H(η/ξ) < 2ε .
Teorema 1.11. Sea (X, A, µ) un espacio de probabilidad y B una álgebra tal que la σ-álgebra
generada por B (denotada por A(B)) satisface A(B) = A. Sea C una sub-álgebra finita de A.
Entonces para todo ε > 0, existe una álgebra finita D, D ⊆ B tal que H(D/C) + H(C/D) < ε.
Demostración. Sea ξ(C) = {C1 , . . . , Cr }. Sea ε > 0 y elijamos δ igual al del Lema 1.1. Es
suficiente demostrar que para cada σ > 0, podemos encontrar una partición {D1 , . . . , Dr }
con Di ∈ B y µ(Ci 4Di ) < σ, para cada i. Para hacer esto, elijamos λ > 0 tal que
λ(r − 1)[1 + r(r − 1)] < σ, y para cada i elijamos Bi ∈ B tal que µ(Ci 4Bi )S< λ. Si i 6= j,
entonces Bi ∩ Bj ⊂ (Bi 4Ci ) ∪ (Bj 4Cj ), ası́ µ(Bi ∩ Bj ) < 2λ. Sea N = i6=j (Bi ∩ Bj ).
Entonces S tenemos µ(N ) < r(r − 1)λ. Sea Di = Bi \ N , para 1 ≤ i < r y
Dr = X \ r−1 i=1 Di . Con esto, {Di , . . . , Dr } es una partición de X y cada Di ∈ B. Si i < r,
entonces Di 4Ci ⊂ (Bi 4Ci ) ∪ N y ası́,
µ(Di 4Ci ) < λ[1 + r(r − 1)] < σ.

Sr−1
Sin embargo, Dr 4Cr ⊂ i=1 (Di 4Ci ), y por lo tanto
µ(Dr 4Cr ) < (r − 1)λ[1 + r(r − 1)] < σ.
W
Si {Bn } es una sucesión de sub-σ-álgebras
S de A, entonces n Bn denotará la sub-σ-álgebra
de A generada por {Bn }. Vamos a usar n Bn para denotar la colección de conjuntos S que
pertenecen a algún Bn . Si {Bn }∞
n=1 es una sucesión creciente de sub-σ-álgebras entonces n Bn
es una álgebra, pero no necesariamente una σ-álgebra.
Corolario 1.4. Si {Bn } es una W sucesión creciente de sub-álgebras finitos de A y C es un
sub-álgebra finito tal que C ⊂ n Bn , entonces H(C/Bn ) → 0, cuando n → ∞.
Demostración. Sea B0 = ∞
S
j=1 Bj , entonces B0 es un álgebra y C ⊂ A(B0 ) mod (0) por
hipótesis. Sea ε > 0. Por Teorema 1.11, existe un sub-álgebra finito Dε de B0 tal que
H(C/Dε ) < ε. Pero Dε ⊆ Aj0 , para algún j0 , dado que Dε es finito. Si j ≥ j0 , el
Teorema 1.3, parte e, nos dice que H(C/Aj ) ≤ H(C/Aj0 ) ≤ H(C/Dε ) < ε.
Teorema 1.12 (Kolmogorov-Sinai). Sea T una transformación que preserva medida

invertible
W∞ del espacio de probabilidad (X, A, µ) y sea B una sub-álgebra finita de A tal que
T n B $ A. Entonces h(T ) = h(T, B).
n=−∞
Demostración. Sea C ⊆ A finito. Queremos demostrar que h(T, C) ≤ h(T, B). Para n ≥ 1,
n n
! !
_ _
h(T, C) ≤ h T, T i B + H C/ T i B (por Teorema 1.8, parte d)
i=−n i=−n
n
!
_
= h(T, B) + H C/ T −i B (por Teorema 1.8, parte g).
i=−n
Sea Bn = ni=−n T i B. Es suficiente mostrar que H(C/Bn ) → 0 cuando n → ∞. Esto sigue

W
por el Corolario 1.4.
Teorema 1.13. Sea T una transformación que preserva medida (no necesariamente in-
vertible) del espacio de probabilidad (X, A, µ) y si B es un sub-álgebra finito de A tal que
W ∞ −i
i=0 T B $ A, entonces h(T ) = h(T, B).
Wn−1
Demostración.
Wn La demostración es similar a la del Teorema anterior usando i=0 T −i B en
−i
lugar de i=−n T B, y el Teorema 1.8, parte f.
Corolario 1.5. Si T esWuna transformación que preserva medida invertible del espacio de
probabilidad (X, A, µ) y ∞ −i
i=0 T B $ A, para algún sub-álgebra finito B, entonces h(T ) = 0.
Demostración. Por Teorema 1.13,

n
!
_
h(T ) = h(T, B) = lı́m H B/ T −i B
n→∞
i=1
Teorema 1.10. Pero ∞

W −i −1 A $ A. Sea B =
Wn −i
por
W∞ i=1 T B $ T n i=1 T B, entonces B1 ⊂ B2 ⊂ ···
y n=1 Bn $ A. Por Corolario 1.4 tenemos H(B/Bn ) → 0, y ası́ h(T ) = 0.
1.7. Ejemplos
Ahora calcularemos la entropı́a de algunos ejemplos.
1. Si Id : (X, A, µ) → (X, A, µ) es la identidad, entonces h(I) = 0. Esto es ya que

h(I, B) = lı́m n1 H(B) = 0. Además, si T p = I, para algún p 6= 0, entonces h(T ) = 0.
Esto sigue de que 0 = h(I) = h(T p ) = |p|h(T ) por Teorema 1.9. En particular, cualquier
transformación que preserva medida en un espacio finito tiene entropı́a cero.
2.
Teorema 1.14. Toda rotación T (z) = az del cı́rculo unitario S1 , tiene entropı́a cero.
Demostración. Caso 1: Supongamos que {an : n ∈ Z} no es denso, i.e., a es una raı́z

de la unidad. Ası́, ap = 1, para algún p 6= 0, y T p (z) = ap z = z, por lo tanto h(T ) = 0.
Caso 2: Supongamos que {an : n ∈ Z} es denso en S1 . Entonces {an /n < 0} es denso en
S1 . Sea ξ = {A1 , A2 }, donde A1 es el semicı́rculo superior [1, −1) y A2 es el semicı́rculo
inferior [−1, 1). Para n > 0, T −n ξ consiste de semicı́rculos queWcomienzan en a−n y
−a−n . Como {a−n /n >W0} es denso, todo semicı́rculo pertenece a ∞ n=0 T
−n A(ξ). Luego,
∞ ∞
todo arco pertenece a n=0 T −n A(ξ). Ası́, A = n=0 T −n A(ξ), y por el Corolario 1.5,
W
concluı́mos que h(T ) = 0.
3.
Definición 1.12. Sea k ≥ 2 un entero fijo y seaP(p0 , . . . , pk−1 ) un vector de probabilidad

con entradas distintas de cero (i.e., pi > 0 y k−1 Y
i=0 pi = 1). Sea (Y, 2 , µ) el espacio
Q∞medidaYdonde Y = {0, 1, . . . , k − 1} y el punto i tiene medida pi . Sea (X, A, µ) =
de
−∞ (Y, 2 , µ). Definamos T ({xn }) = {yn }, donde yn = xn+1 . Si P denota la semi-
álgebra de todos los rectángulos medibles, entonces µ(T −1 A) = µ(A), para todo A ∈ P.
Llamaremos a T el (p0 , . . . , pk−1 )-shift bidireccional.
Teorema 1.15. El (p0 , . . . , pk−1 )-shift bidireccional tiene entropı́a − k−1

P
i=0 pi log(pi ).
Demostración. Sea Y = {0, . . . , k − 1}, X = ∞
Q
−∞ Y , y sea T : X → X el shift. Sea
Ai = {{xk } : x0 = i}, 0 ≤ i ≤ k − 1. Entonces ξ = {A0 , . . . , Ak−1 } es una partición de
X.
W∞Por notación, B := A(ξ). Por la definición del σ-álgebra producto A, tenemos que
i
i=−∞ T B = A. Por el Teorema de Kolmogorov-Sinai,
1
h(T ) = lı́m H(B ∨ T −1 B ∨ · · · ∨ T −(n−1) B).
n→∞ n
Un elemento de n−1 −i −1 A ∩···∩T −(n−1) A
W
i=0 T ξ es de la forma Ai0 ∩T i1 in−1 = {{xn }/x0 =
i0 , x1 = i1 , . . . , xn−1 = in−1 }, el cual tiene medida pi0 · pi1 · . . . · pin−1 . Luego
X
H(B ∨ T −1 B ∨ · · ·T −(n−1) B) = − (pi0 · . . . · pin−1 ) log(pi0 · . . . · pin−1 )
k−1
X
=− (pi0 · . . . · pin−1 )[log(pi0 ) + · · · + log(pin−1 )]
i0 ,...,in−1 =0
k−1
X
= −n pi log(pi ).
i=0
k−1
X
Por lo tanto, h(T ) = h(T, B) = − pi log(pi ).
i=0
2. Entropı́a Topológica
2.1. Definición a través de cubrimientos abiertos

Sea X un espacio topológico compacto. Estaremos interesados en cubrimientos abiertos
de X los cuales denotaremos por α, β, . . ., etc.
Definición 2.1. Sean α, β cubrimientos abiertos de X, definimos α ∨ β por
α ∨ β := {A ∩ B : A ∈ α, B ∈ β}.
De manera análoga definimos ni=1 αi , donde {αi } son cubrimientos abiertos de X.

W
Definición 2.2. Sean α, β cubrimientos abiertos de X. Diremos que β es un refinamiento de

α si para todo B ∈ β, existe A ∈ α tal que B ⊆ A, y lo notaremos por α < β.
De la definición, claramente tenemos α < α ∨ β, para todo α, β cubrimientos abiertos de

X. Además, si β es un subcubrimiento de α, entonces α < β.
Definición 2.3. Si α es un cubrimiento abierto de X y T : X → X es continua, entonces se

define el cubrimiento abierto
T −1 α = {T −1 A : A ∈ α}.
Además denotaremos n−1 −i −1 α ∨ . . . ∨ T −(n−1) α.
W
i=0 T α = α ∨ T
De la definición, fácilmente podemos ver que:
• T −1 (α ∨ β) = T −1 α ∨ T −1 β .

• Si α < β, entonces T −1 α < T −1 β.
Definición 2.4. Si α es un cubrimiento abierto de X, sea N (α) el número de conjuntos

en un subcubrimiento finito de α con cardinalidad mı́nima. Definimos la entropı́a de α por
H(α) = log(N (α)).
Observación 2.1. 1. H(α) ≥ 0.
2. H(α) = 0 si y solamente si N (α) = 1 si y solamente si X ∈ α.
3. Si α < β, entonces H(α) ≤ H(β).
Demostración. Sea {B1 , . . . , BN (β) } un subcubrimiento de β con cardinalidad

mı́nima. Como α < β, para cada i, existe Ai ∈ α tal que Bi ⊆ Ai . Por lo tanto,
{A1 , . . . , AN (β) } cubre a X y es un subcubrimiento de α. Luego N (α) ≤ N (β), y ası́,
H(α) ≤ H(β).
4. H(α ∨ β) ≤ H(α) + H(β).
Demostración. Sea {A1 , . . . , AN (α) } un subcubrimiento de α con cardinalidad mı́ni-

ma,y {B1 , . . . , BN (β) } un subcubrimiento de α con cardinalidad mı́nima, entonces
{Ai ∩ Bj : 1 ≤ i ≤ N (α), 1 ≤ j ≤ N (β)}
es un subcubrimiento de α ∨ β, luego N (α ∨ β) ≤ N (α)N (β), y ası́,

H(α ∨ β) ≤ H(α) + (β).
5. Si T : X → X es una aplicación continua, entonces H(T −1 α) ≤ H(α). Si T es además

sobreyectiva, entonces H(T −1 α) = H(α).
Demostración. Si {A1 , . . . , AN (α) } es un subcubrimiento finito de α con cardina-

lidad mı́nima, entonces {T −1 A1 , . . . , T −1 AN (α) } es un subcubrimiento de T −1 α, ası́
N (T −1 α) ≤ N (α). Si T es sobreyectiva y {T −1 A1 , . . . , T −1 AN (T −1 α) } es un subcubri-
miento de T −1 α con cardinalidad mı́nima, entonces {A1 , . . . , AN (T −1 α) } es un subcu-
brimiento de α, por lo tanto, N (α) ≤ N (T −1 α), y ası́, H(α) = H(T −1 α).
Teorema 2.1. Si α es unWcubrimiento abierto de X y T : X → X es una aplicación continua,

entonces lı́mn→∞ (1/n)H( n−1 −i
i=0 T α) existe.
Demostración. Si definimos
n−1
!
_
an = H T −i α
i=0
entonces por Teorema 1.5 es suficiente demostrar que an+k ≤ an + ak , para todo k, n ≤ 1.
Tenemos
n+k−1
!
_
an+k = H T −i α
i=0
 
n−1 k−1
!
_ _
≤H T −i α + H T −n T −j α , por Observación 2.1, parte 4
i=0 j=0
≤ an + ak
esta última desigualdad por Observación 2.1, parte 5. Entonces, por Teorema 1.5 tenemos
n−1
!
an 1 _
que lı́m = lı́m H T −i α existe.
n→∞ n n→∞ n
i=0
Definición 2.5. Si α es un cubrimiento abierto de X y T : X → X es una aplicación continua,

entonces la entropı́a de T relativa a α se define por
n−1
!
1 _
h(T, α) = lı́m H T −i α .
n→∞ n
i=0
Observación 2.2. 1. Por Observación 2.1, parte 1 se obtiene que h(T, α) ≥ 0.
2. Si α < β, entonces h(T, α) ≤ h(T, β).
Wn−1 −i Wn−1 −i
Demostración.W Si α < β, entonces i=0 T α < i=0 T β, luego por Oservación
1.3 tenemos H( n−1 −i α) ≤ H( i = 0n−1 T −i β). Luego, h(T, α) ≤ h(T, β).
W
i=0 T
Notar que si β es un subcubrimiento finito de α, entonces α < β, ası́, h(T, α) ≤ h(T, β).
3. h(T, α) ≤ H(α).
Demostración. Por Observación 2.1, parte 4 tenemos

n−1
! n−1
_ X
−i
H T α ≤ H(T −i α)
i=0 i=0
≤ nH(α)
debido a Observación 2.1, parte 5 Dividiendo por n y haciendo tender n a ∞, tenemos
h(T, α) ≤ H(α).
Definición 2.6. Si T : X → X es continuo, la entropı́a topológica de T se define por
h(T ) = sup h(T, α)
α
donde el supremo está sobre todos los cubrimientos abiertos de X.
Observación 2.3. 1. h(T ) ≥ 0.
2. h(I) = 0, donde I es la aplicación identidad de X.
3. Si Y es un subconjunto cerrado de X y T (Y) = Y, entonces h(T |Y ) ≤ h(T ).
Teorema 2.2. Si X1 , X2 son espacios compactos y Ti : Xi → Xi son aplicaciones continuas,
para i = 1, 2, y si φ : X1 → X2 es una aplicación continua tal que φX1 = X2 y φT1 = T2 φ,
entonces h(T1 ) ≥ h(T2 ). Si φ es un homeomorfismo, entonces h(T1 ) = h(T2 ).
Demostración. Sea α un cubrimiento abierto de X2 . Entonces
n−1
!
1 _
h(T2 , α) = lı́m H T2−i α
n→∞ n
i=0
n−1
!
1 −1
_
−i
= lı́m H φ T2 α por Observación 2.1, parte 5
n→∞ n
i=0
n−1
!
1 _
= lı́m H φ−1 T2−i α
n→∞ n
i=0
n−1
!
1 _
−i −1
= lı́m H T1 φ α
n→∞ n
i=0
−1
= h(T1 , φ α).
Luego h(T2 ) = supα h(T2 , α) = supα h(T1 , φ−1 α) ≤ h(T1 ). Si φ es un homeomorfismo,
entonces φ−1 T2 = T1 φ−1 , entonces de manera análoga, tenemos h(T1 ) ≤ h(T2 ).
Teorema 2.3. Si T : X → X es un homeomorfismo del espacio compacto X, entonces

h(T ) = h(T −1 ).
Demostración.
n−1
!
1 _
−i
h(T, α) = lı́m H T α
n→∞ n
i=0
n−1
!!
1 _
= lı́m H T n−1 T −i α por Observación 2.1, parte 5
n→∞ n
i=0
n−1
!
1 _
−i
= lı́m H T α
n→∞ n
i=0
= h(T −1 α).
Por lo tanto, h(T ) = h(T −1 ).
2.2. Definición de Bowen

En esta sección, (X, d) denotará un espacio métrico, no necesariamente compacto. La
bola abierta centrada en x de radio r será denotada por B(x, r), y la bola cerrada por
B(x, r). El espacio de todas las aplicaciones uniformemente continuos del espacio métrico
(X, d) será denotado por U C(X, d). En el transcurso de esta sección T será un elemento
de U C(X, d). Si n es un número natural podemos definir una nueva métrica dn en X por
dn (x, y) = máx0≤i≤n−1 d(T i x, T i y). La bola
Tn−1abierta centrada en x de radio r en la métrica dn
es Bdn (x, r) = {y ∈ X : dn (x, y) < r} = i=0 T −i B(T i x, r).
Definición 2.7. Sea n un número natural, ε > 0 y K un subconjunto compacto de X. Un

subconjunto F de X se dice (n, ε)-generador para K con respecto a T si para todo x ∈ K,
existe y ∈ F tal que dn (x, y) ≤ ε, es decir,
[ n−1
\
K⊂ T −i B(T i y, ε).
y∈F i=0
Definición 2.8. Sea n un número natural, ε > 0 y K un subconjunto compacto de X,

denotaremos por rn (ε, K) la cardinalidad mı́nima de cualquier conjunto (n, ε) generador para
K con respecto a T . (Si fuera necesario enfatizar T , anotaremos rn (ε, K, T ).)
Observación 2.4. 1. Claramente rn (ε, K) < ∞, yaTque la compacidad de K implica que

n−1 −i
el cubrimiento de K por los conjuntos abiertos i=0 T B(T i x, ε), x ∈ X tiene un
subcubrimiento finito.
2. Si ε1 < ε2 , entonces rn (ε1 , K) ≥ rn (ε2 , K).

Demostración. Sea F un conjunto (n, ε1 ) generador para K de cardinalidad rn (ε1 , K),
o sea, para todo x ∈ K, existe y ∈ F tal que dn (x, y) ≤ ε1 , pero ε1 < ε2 , entonces
dn (x, y) ≤ ε2 , por lo tanto, rn (ε1 , K) ≥ rn (ε2 , K), ya que eventualmente puedo encon-
trar un conjunto (n, ε2 ) de cardinalidad mı́nima. (Esto razonamiento se aplicará regu-
larmente durante el capı́tulo.)
Definición 2.9. Sea ε > 0 y K es un subconjunto compacto de X. Definimos el número

r(ε, K, T ) = lı́m supn→∞ (1/n) log(rn (ε, K)). Escribiremos r(ε, K, T, d) si queremos enfatizar
la métrica d.
Observación 2.5. 1. Por Observación 2.4, parte 2, si ε1 < ε2 , entonces r(ε1 , K, T ) ≥

r(ε2 , K, T ).
2. r(ε, K, T ) puede ser ∞.
Definición 2.10. Sea K un subconjunto compacto de X, y sea h(T, K) = lı́mε→0 r(ε, K, T ).

La entropı́a topológica de T es h(T ) = supK h(T, K), donde el supremo está tomado sobre
la colección de todos los subconjuntos compactos de X. En algunas ocasiones escribiremos
hd (T ).
Antes de dar alguna interpretación a la definición, daremos la definición para conjuntos

separados, que en algunos casos va a ser más útil para las demostraciones.
Definición 2.11. Sea n un número natural, ε > 0 y K un subconjunto compacto de X.

Un subconjunto E de K es (n, ε)-separado con respecto a T si x, y ∈ E, x 6= y, implica
Tn−1
dn (x, y) < ε, es decir, para x ∈ E, el conjunto i=0 T −i B(T i x, ε) no contiene otro punto de
E.
Definición 2.12. Sea n un número natural, ε > 0 y K un subconjunto compacto de X,

denotaremos por sn (ε, K) la cardinalidad máxima de cualquier conjunto (n, ε) separado para
K con respecto a T . (Si fuera necesario enfatizar T , anotaremos sn (ε, K, T ).)
Observación 2.6. 1. Tenemos que rn (ε, K) ≤ sn (ε, K) ≤ rn (ε/2, K), y ası́, sn (ε, K) <
∞.
Demostración. Si E es un conjunto (n, ε) separado de K de cardinalidad máxima,

entonces E es un conjunto (n, ε) generador de K. En efecto, supongamos que E no es
un conjunto (n, ε) generador para K, es decir, existe x ∈ K tal que para todo y ∈ E,
dn (x, y) > ε, si definimos E 0 = E ∪ {x}, E 0 es un conjunto (n, ε) separado para K de
cardinalidad sn (ε, K) + 1, contradicción. Por lo tanto, rn (ε, K) ≤ sn (ε, K).
Sea E un subconjunto (n, ε) separado de K y F un conjunto (n, ε/2) generador para
K. Definamos φ : E → F eligiendo, para cada x ∈ E, algún punto φ(x) ∈ F con
dn (x, φ(x) ≤ ε/2, esto porque F es un conjunto (n, ε/2) generador para K, y E ⊆ K.
Entonces φ es inyectiva y por lo tanto sn (ε, K) ≤ rn (ε/2, K).
2. Si ε1 < ε2 , entonces sn (ε1 , K) ≥ sn (ε2 , K). La demostración es análoga a la Observa-

ción 2.4, parte 2.
Definición 2.13. Sea ε > 0 y K es un subconjunto compacto de X. Definimos el número
s(ε, K, T ) = lı́m supn→∞ (1/n) log(sn (ε, K)). Escribiremos s(ε, K, T, d) si queremos enfatizar
la métrica d.
Observación 2.7. 1. Por Observación 2.5, parte 1, tenemos que r(ε, K, T ) ≤ s(ε, K, T ) ≤
r(ε/2, K, T ).
2. Si ε1 < ε2 , entonces s(ε1 , K, T ) ≥ s(ε2 , K, T ).
3. Tenemos que h(T, K) = lı́mε→0 s(ε, K, T ), por la parte 1, y ası́, h(T ) = supk lı́mε0 s(ε, K, T ).
Luego, h(T ) puede ser definido con conjuntos generadores o conjuntos separados.
4. Si T es una isometrı́a de (X, d), entonces claramente dn = d para todo n, ası́,
sn (ε, K) = s1 (ε, K) y hd (T ) = 0.
A partir de ahora, veremos que la definición de entropı́a que vimos en la Sección 2.1 y la
que hemos visto en esta sección coinciden en espacios métricos compactos.
Definición 2.14. Dos métricas d y d0 en X son uniformemente equivalentes si
id. : (X, d) → (X, d0 ) y id. : (X, d0 ) → (X, d)
son uniformemente continuas.

En este caso, T ∈ U C(X, d) si y solamente si T ∈ U C(X, d).
Teorema 2.4. Si d y d0 son uniformemente equivalentes y T ∈ U C(X, d), entonces
hd (T ) = hd0 (T ).
Demostración. Sea ε1 > 0. Escojamos ε2 > 0 tal que d0 (x, y) < ε2 implique d(x, y) < ε1 ,
y ε3 > 0 tal que d(x, y) < ε3 implique d0 (x, y) < ε2 . Sea K un conjunto compacto, en-
tonces rn (ε1 , K, d) ≤ rn (ε2 , K, d0 ) y rn (ε2 , K, d0 ) ≤ rn (ε3 , K, d). Luego, r(ε1 , K, T, d) ≤
r(ε2 , K, T, d0 ) ≤ r(ε3 , K, T, d). Si ε1 → 0, entonces ε2 → 0 y ε3 → 0, y ası́, tenemos
hd (T ) = hd0 (T ).
Si X es un espacio compacto, además si d y d0 son métricas equivalentes, entonces son

uniformemente equivalentes, por lo tanto, si X es un espacio compacto metrizable, entonces
h(T ) no depende de la métrica elegida en X.
Teorema 2.5. Sea (X, d) un espacio métrico y T ∈ U C(X, d). Si K ⊂ K1 ∪ . . . ∪ Km , donde
K, K1 , . . . , Km ⊆ X compactos, entonces h(T, K) ≤ máx1≤i≤m h(T, Ki ).
Demostración. Claramente tenemos que sn (ε, K) ≤ sn (ε, K1 ) . . . + sn (ε, Km ). Fijemos
ε > 0, para cada n escojamos Ki(n,ε) tal que sn (ε, Ki(n,ε) ) = máxj sn (ε, K), entonces sn (ε, K) ≤
m · sn (ε, Ki(n,ε) ) y ası́ log(sn (ε, K)) ≤ log(m) + log(sn (ε, Ki(n,ε) )). Escogiendo nj → ∞ tal
que
1 1
log(snj (ε, K)) → lı́m sup log(sn (ε, K))
nj n→∞ n
y tal que Ki(nj ,ε) no depende de j. Por lo tanto, s(ε, K, T ) ≤ s(ε, Ki(ε) , T ). Escojamos εq → 0
tal que Ki(εq ) es constante, digamos Ki0 , entonces h(T, K) ≤ h(T, Ki0 ) ≤ máxj h(T, Kj ).
Corolario 2.1. Sea (X, d) un espacio métrico y T ∈ U C(X, d). Sea δ > 0. Para calcular hd (T )
es suficiente tomar el supremo de h(T, K) sobre conjuntos compacto de diámetro menor que
δ.
Demostración. Si K es compacto, puede S ser cubierto con unaScantidad finita de bolas
B1 , . . . , Bm de diámetro δ/2, o sea, K ⊂ m B
i=1 i , entonces K ⊂ m
B
i=1 i ∩ K. Es claro que
h(T, K ∩ Bi ) ≤ h(T, K), para todo i. Por Teorema 2.5, k(T, K) ≤ máx h(T, K ∩ Bi ), por lo
tanto, h(T, K) = máxi h(T, K ∩ Bi ).
Corolario 2.2. Si X es un espacio compacto metrizable y d es una métrica cualquiera,
entonces h(T ) = hd (T ) = h(T, X).
Ahora definiremos unos previos sobre el número de Lebegue y homeomorfismos expansi-
vos.
Teorema 2.6 (Lema del Cubrimiento de Lebesgue). Sea (X, d) un espacio métrico
compacto y α un cubrimiento abierto de X, entonces existe δ > 0 tal que para cada subconjunto
de X de diámetro menor o igual a δ, está contenido en algún miembro de α. Tal δ es llamado
número de Lebesgue para α.
Definición 2.15. Sea X un espacio compacto metrizable y T : X → X un homeomorfismo. Un
cubrimiento abierto finito α de X
T∞es un generador para T si para toda bisucesión {An }∞
−∞
de miembros de α, el conjunto T −n A contiene a lo más un punto de X. Si esta
T n=−∞−n n
condición es reemplazada por ∞ n=−∞ T An contiene a lo más un punto de X, entonces α
es llamado un generador débil.
Definición 2.16. Un homeomorfismo T de un espacio métrico compacto (X, d) es llamado
expansivo si existe δ > 0 con la propiedad de que si x 6= y, entonces existe n ∈ Z con
d(T n x, T n y) > δ. Llamaremos a δ una constante de expansividad para T .
Teorema 2.7. Sea T un homeomorfismo del espacio métrico compacto (X, d). Entonces son
equivalentes
a) T es un homeomorfismo expansivo.
b) T tiene un generador.
c) T tiene un generador débil.
Teorema 2.8. Sea T : X → X un homeomorfismo del espacio métrico compacto (X, d). Sea
α unW generador para T . Entonces para todo ε > 0, existe N > 0 tal que para cada conjunto
en N −N T −n α tiene diámetro menor que ε. Recı́procamente, para todo N > 0, existe ε > 0
tal que d(x, y) < ε implica

N
_
x, y ∈ T −n An
−N
para algún A−N , . . . , AN ∈ α.
Llamaremos h∗ (T ) y h∗ (T, α) los números definidos en la Sección 2.1 usando cubrimien-
tos abiertos. En un espacio métrico (X, d) definimos el diámetro de un cubrimiento como
diam (α) = supA∈α diam (A).
Teorema 2.9. Sea (X, d) un espacio métrico compacto. Si {αn }∞
1 es una sucesión de cubri-
mientos de X, con diam (α) → 0, entonces
a) Si h∗ (T ) < ∞, lı́mn→∞ h∗ (T, αn ) existe y es igual a h∗ (T ).
b) Si h∗ (T ) = ∞, lı́mn→∞ h∗ (T, αn ) = ∞.
Demostración. a) Sea h∗ (T ) < ∞. Sea ε > 0 y escojamos un cubrimiento abierto γ tal que
h∗ (T, γ) > h∗ (T ) − ε. Sea δ un número de Lebesgue para γ, y escojamos N tal que para
n ≥ N , diam (αn ) < δ. Sea A ∈ αn , entonces diam (A) < δ, por lo tanto, existe B ∈ γ
tal que A ⊆ B, ası́, γ < αn , por lo tanto, h∗ (T, γ) ≤ h∗ (T, αn ). Luego,
h∗ (T ) ≥ h∗ (T, αn ) ≥ h∗ (T, γ) > h∗ (T ) − ε
Ası́, lı́mn→0 (T, αn ) = h∗ (T ).
b) Si h∗ (T ) = ∞, sea a > 0 y escojemos γ cubrimiento abierto tal que h∗ (T, γ) > a, y de

manera análoga a la demostración anterior, lı́mn→0 h∗ (T, αn ) = ∞.
Corolario 2.3. De lo anterior, tenemos h∗ (T ) = lı́mδ→0 {sup h∗ (T, α) : diam (α) < δ}.
Teorema 2.10. Sea T : X → X una aplicación continua del espacio métrico compacto (X, d).
a) Si α es un cubrimiento abierto de X con número de Lebesgue δ, entonces

n−1
!
_
−i
N T α ≤ rn (δ/2, X) ≤ sn (δ/2, X).
i=0
b) Si ε > 0 y γ es un cubrimiento abierto con diam (γ) ≤ ε, entonces

n−1
!
_
−i
rn (ε, X) ≤ sn (ε, X) ≤ N T γ .
i=0
Demostración. Sabemos por Observación 2.6, parte 1 que rn (ε, X) ≤ sn (ε, X), para todo
ε > 0.
a) Sea F un conjunto (n, δ/2) generador para X de cardinalidad rn (δ/2, T ). Entonces
[ n−1
\
X= T −i B(T i x, δ/2)
x∈F i=0
y como para cada i, B(T i x, δ/2) es subconjunto de un miembro de α, tenemos que

n−1
!
_
N T −i α ≤ rn (δ/2, X) ≤ sn (δ/2, X).
i=0
b) Sea E un conjunto (n, ε) separado de cardinalidad sn (ε, X). Ningún miembro del cubri-
Wn−1
miento i=0 T −i γ puede contener dos elementos de E, ası́
n−1
!
_
−i
rn (ε, X) ≤ sn (ε, X) ≤ N T γ .
i=0
Corolario 2.4. Sea T : X → X una aplicación continua del espacio métrico compacto (X, d).
Sea ε > 0. Sea αε el cubrimiento de X de todas las bolas abiertas de radio 2ε y sea γε el
cubrimiento de X de todas las bolas abiertas de radio ε/2. Entonces
n−1 n−1
! !
_ _
N T −i αε ≤ rn (ε, X) ≤ sn (ε, X) ≤ N T −i γε .
i=0 i=0
Teorema 2.11. Sea T : X → X una aplicación continua del espacio métrico compacto (X, d),
entonces h(T ) = h∗ (T ), es decir, las dos definiciones de entropı́a topológica coinciden.
Demostración. Sea ε > 0 y αε , γε son como en el Corolario 2.4, entonces h∗ (T, αε ) ≤

r(ε, X, T ) ≤ s(ε, X, T ) ≤ h∗ (T, γε ). Si ponemos ε = 1/n y n → ∞, los dos términos extremos
convergen a h∗ (T ) y los términos del medio convergen a h(T ).
Teorema 2.12. Sea T : X → X una aplicación continua del espacio métrico compacto (X, d),
entonces
1 1
h(T ) = lı́m lı́m inf log(rn (ε, X)) = lı́m lı́m inf log(sn (ε, K)).
ε→0 n→0 n ε→0 n→∞ n
Demostración. Del Corolario 2.4 se sigue que

1 1
h∗ (T, αε ) ≤ lı́m inf log(rn (ε, K)) ≤ lı́m inf log(sn (ε, K)) ≤ h∗ (T, γε ).
n→∞ n n→∞ n
Poniendo ε = 1/k, haciendo k → ∞ y aplicando Teorema 2.9 se obtiene la fórmula.
Teorema 2.13. a) Sea (X, d) un espacio métrico, T ∈ U C(X, d) y m > 0, entonces hd (T m ) =

m · hd (T ).
b) Sea (Xi , di ), i = 1, 2, un espacio métrico y Ti ∈ U C(Xi , di ). Definamos una métrica d en

X1 × X2 dada por d((x1 , x2 ), (y1 , y2 )) = máx{d1 (x1 , y1 ), d2 (x2 , y2 )}. Entonces T1 × T2 ∈
U C(X1 × X2 , d) y hd (T1 × T2 ) ≤ hd1 (T1 ) + hd2 (T2 ). Si X1 o bien X2 es compacto, entonces
hd (T1 × T2 ) = hd1 (T1 ) + hd2 (T2 ).
Demostración. a) Sea F un conjunto (mn, k)-generador para K de cardinalidad mı́nima.

O sea, para todo x ∈ K, existe y ∈ F tal que dmn (x, y) ≤ ε, entonces
máx {d((T m )i x, (T m )i y)} ≤ dmn (x, y) ≤ ε.

0≤i≤n−1
Por lo tanto, F es un conjunto rn (ε, K, T m ) generador para K, luego, rn (ε, K, T m ) ≤
rmn (ε, K, T ), ası́
1 m
log(rn (ε, K, T m )) ≤ log(rmn (ε, K, T ))
n mn
y por lo tanto hd (T m ) ≤ m · hd (T ). Ahora, sea F un conjunto (n, δ)-generador para K
con respecto a T m de cardinalidad mı́nima, como T es uniformemente continua, para todo
ε > 0, existe δ(ε) > 0 tal que d(x, y) < δ implica máx0≤j≤m−1 {d(T j x, T j y)} < ε, es decir,
B(x, δ) ⊆ BT (x, ε, m). Ası́ tenemos
n−1
\ n−1
\
BT m (x, δ(ε), n) = T −im B(T im , δ(ε)) ⊂ T −im BT (T im x, ε, m) = BT (x, ε, mn).
i=0 i=0
Entonces, rmn (ε, K, T ) ≤ rn (δ, K, T m ) y ası́, m · h(T ) ≤ h(T m ). Para mayor detalle de la
demostración, ver [?].
b) Sea Ki ⊆ Xi compacto. Si Fi es un conjunto (n, ε) generador para Ki de cardinalidad

mı́nima con respecto a Ti , entonces F1 × F2 es un conjunto (n, ε) generador para K1 × K2
con respecto a T1 × T2 . Luego rn (ε, K1 × K2 , T1 × T2 ) ≤ rn (ε, K1 , T1 ) · rn (ε, K2 , T2 ), y ası́,
hd (T1 × T2 , K1 × K2 ) ≤ hd1 (K1 , T1 ) + hd2 (K2 , T2 ). Sea Πi : X1 × X2 → Xi la aplicación
proyección. Si K ⊆ X1 × X2 es compacto, entonces K1 = Π1 (K) y K2 = Π2 (K) son
compactos y K ⊆ K1 × K2 . Luego hd (T1 × T2 , K) ≤ hd (T1 × T2 , K1 × K2 ). Por lo tanto
hd (T1 × T2 ) = sup hd (T1 × T2 , K)

K⊆X1 ×X2
≤ sup hd (T1 × T2 , K1 × K2 )
K1 ⊆X1
K2 ⊆X2
≤ sup hd1 (T1 , K1 ) + sup hd2 (T2 , K2 )
K1 ⊆X1 K2 ⊆X2
= hd1 (T1 ) + hd2 (T2 ).
Ahora supongamos que X1 es compacto (la demostración cuando X2 es compacto es análo-

ga). Como todo subconjunto copacto de X1 ×X2 es un subconjunto de X1 ×K2 , para algún
K2 compacto, entonces hd (T1 × T2 ) = sup{hd (T1 × T2 , X1 × X2 ) : K2 ⊆ X2 compacto}. Sea
K2 ⊆ X2 compacto y δ > 0, si E1 es un conjunto (n, δ)-separado de X1 y E2 es un conjunto
(n, δ)-separado de K2 , entonces E1 × E2 es un conjunto (n, δ)-separado de X1 × K2 , por
lo tanto sn (δ, X1 × K2 , T1 × T2 ) ≥ sn (δ, X1 , T1 ) · sn (δ, K2 , T2 ), y ası́
1
s(δ, X1 × K2 , T1 × T2 ) ≥ lı́m sup [log(sn (δ, X1 , T1 )) + log(sn (δ, K2 , T2 ))]
n→∞ n
1 1
≥ lı́m inf log(sn (δ, X1 , T1 )) + lı́m sup log(sn (δ, K2 , T2 ))
n→∞ n n
Haciendo δ → 0, y tomando supremo, finalmente tenemos hd (T1 ×T2 ) ≥ hd1 (T1 )+hd2 (T2 ).
2.3. Cálculo de entropı́a topológica
Teorema 2.14. Sea T : X → X un homeomorfismo expansivo del espacio métrico compacto
(X, d).
a) Si α es un generador para T , entonces h(T ) = h(T, α).
b) Si δ es una constante expansiva para T , entonces h(T ) = r(δ0 , T ) = s(δ0 , T ), para todo
δ0 < δ/4.
Demostración. a) Sea β un cubrimiento abierto cualquiera. Sea δ un número de Lebesgue
para β. Por Teorema 2.8, escojamos N > 0 tal que cada conjunto de N −n α tenga
W
n=−N T
WN
diámetro menor que δ, entonces β < n=−N T −n α, y ası́,
N
!
_
−n
h(T, β) ≤ h T, T α
−N
k−1 N
!!
1 _
−i
_
−n
= lı́m H T T α
k→∞ k
i=0 n=−N
N +k−1
!
1 _
−n
= lı́m H T α
k→∞ k
n=−N
2N_
+k−1
!
1
= lı́m H T −n α
k→∞ k
n=0
2N_
+k−1
!
2N + k − 1 1
= lı́m · H T −n α
k→∞ k 2N + k − 1
n=0
= h(T, α).
Por lo tanto, h(T, β) ≤ h(T, α), para todo cubrimiento abierto β, luego, h(T ) = h(T, α).
b) Sea δ0 < δ/4. Escojamos x1 , . . . , xk tal que X = ki=1 B(xi , δ/2 − 2δ0 ). El cubrimiento
S
α = {B(xi , δ/2) : 1 ≤ i ≤ k} tiene a 2δ0 como número de Lebesgue, ası́ por Teorema
2.10 h(T, α) ≤ r(δ0 , X) ≤ s(δ0 , X) ≤ h(T ). Como α es un generador para T , entonces
h(T ) = h(T, α) = r(δ0 , T ) = s(δ0 , T ).
Corolario 2.5. Todo homeomorfismo expansivo tiene entropı́a topológica finita.

Teorema 2.15. El shift bidireccional en X = ∞
Q
−∞ Y, donde Y = {0, 1, . . . , k − 1}, tiene
entropı́a topológica log(k).
Demostración. Sea α = {A0 , . . . , Ak−1 } el generador natural, es decir, Aj = {{xn }∞
−∞ :
x0 = j}. Entonces, por Teorema 2.14
n−1
!!
1 _
−i
h(T ) = h(T, α) = lı́m log N T α = lı́m log(k n ) = log(k).
n→∞ n n→∞
i=0
Teorema 2.16. Si T : K → K es un homeomorfismo del cı́rculo unitario, entonces h(T ) = 0.
Demostración. Sabemos que los conjuntos conexos de K son intervalos, entonces T mapea
intervalos en intervalos. Consideremos que K tiene longitud 1, y escojamos ε > 0 tal que
d(x, y) ≤ ε implique d(T −1 , T −1 y) ≤ 1/4. Claramente r1 (ε, K) ≤ [1/ε]+1, donde [1/ε] denota
la parte entera de 1/ε. Vamos a demostrar que rn (ε, K) ≤ n([1/ε] + 1), para todo n ∈ N. Sea
F un conjunto (n − 1, ε)-generador de cardinalidad rn−1 (ε, K). Consideremos los puntos de
T n−1 F y los intervalos que determinan. Agreguemos puntos a este conjunto tal que los nuevos
intervalos tengan longitud menor que ε, entonces agregaremos a lo más [1/ε] + 1 puntos. Sea
E la colección de puntos nuevos y F 0 = F ∪T −(n−1) E. Afirmamos que F 0 es un conjunto (n, ε)
generador para K. Sea x ∈ K, entonces existe y ∈ F tal que máx0≤i≤n−2 d(T i x, T i y) ≤ ε. Si
d(T n−1 x, T n−1 y) ≤ ε, entonces la afirmación está probada. Si no existe y ∈ F con estas dos
propiedades, fijemos y ∈ F tal que máx0≤i≤n−2 d(T i x, T i y) ≤ ε. Hay dos intervalos cerrados
con puntos extremos T n−1 x y T n−1 y, escojamos uno, llamémoslo I tal que T −1 (I) = I 0 ,
donde I 0 = [T n−2 x, T n−2 y] y longitud de I 0 es menor o igual a ε. Escojamos z ∈ F 0 tal
que T n−1 z ∈ I y d(T n−1 x, T n−1 z) ≤ ε, entonces T n−2 z ∈ I 0 y d(T n−2 x, T n−2 z) ≤ ε. Ahora
sea T −1 (I 0 ) = I 00 , con puntos extremos T n−3 x y T n−3 y y longitud menor que 1/4, entonces
l(I 00 ) ≤ ε. Como T n−3 z ∈ I 00 , entonces d(T n−3 x, T n−3 z) ≤ ε. Inductivamente, se deduce que
d(T i x, T i z) ≤ ε, con 0 ≤ i ≤ n − 1, ası́, F 0 es un conjunto (n, ε) generador para K, por lo
tanto rn (ε, K) ≤ rn−1 (ε, K) + [1/ε] + 1, y ası́
1 1
r(ε, K) ≤ lı́m sup log(n) + lı́m sup ([1/ε] + 1).
n→∞ n n→∞ n
Luego, r(ε, K) = 0, y finalmente, h(T ) = 0.
Corolario 2.6. Todo homeomorfismo de [0, 1] tiene entropı́a cero.

Demostración. T : [0, 1] → [0, 1] tiene dos opciones, o T (0) = 0 y T (1) = 1, o T (0) = 1 y
T (1) = 0. En cualquiera de los dos casos, T 2 fija a 0 y a 1. Sea S cualquier homeomorfismo
de [0, 1] que fija a 0 y 1, y sea φ : [0, 1] → K la función continua φ(t) = e2πit . φ es inyectiva
en (0, 1) y φSφ−1 es un homeomorfismo de K que fija a 1 ∈ K. Sean αn = {[0, 1/n), (1 −
1/n, 1], {(k/2n, (k + 2)/2n) : 1 ≤ k ≤ 2n − 3}} cubrimientos abiertos de [0, 1], entonces
φ((k/2n, (k + 2)/2n)), 1 ≤ k ≤ 2n − 3), con φ([0, 1/n) ∪ (1 − 1/n, 1]) forman un cubrimiento
βn de K, entonces    
p−1
_ p−1
_
N S j αn  ≤ 2p N  (φSφ−1 )j βn 
j=0 j=0
y ası́ h(S, αn ) ≤ log(2) + h(φSφ−1 , βn ). Aplicando el Teorema 2.9 y haciendo n → ∞, se tiene
h(S) ≤ log(2) + h(φSφ−1 ) = log(2).
Como esto ocurre para todo S homeomorfismo que fija a 0 y 1, si hacemos S = T 2q ,

2qh(T ) ≤ log(2), luego, h(T ) = 0.
3. Presión Topológica y su relación con Medidas Invariantes
Sea T : X → X una transformación continua del espacio métrico compacto (X, d). Sea
C(X, R) el espacio de Banach de funciones continuas de X con valores reales equipado con
la norma del supremo. La presión topológica de T será una función P (T, ·) : C(X, R) →
R ∪ {∞}, la cual tendrá buenas propiedades relativas a las estructuras en C(X, R). Esto
contiene entropı́a topológica, en el sentido que P (T, 0) = h(T ), donde 0 denota el elemento
de C(X, R) el cual es idénticamente cero.
3.1. Presión topológica

Sea (X, d) un espacio métrico compacto, C(X, R) el espacio de funciones continuas con
valores reales de X y T : X → X una transformación continua. La definición de presión
puede ser dada usando cubrimientos abiertos, conjuntos generadores o conjuntos separados.
Como X es compacto, podemos generalizar
Pn−1 lai definición de h(T ) dada en el Capı́tulo 2. Para
f ∈ C(X, R) y n ≥ 1 denotaremos i=0 f (T (x)) := (Sn )f (x).
Definición 3.1. Para f ∈ C(,R), n ≥ 1 y ε > 0, definamos

( )
X
Qn (T, f, ε) = ı́nf e(Sn f )(x) : F es un (n, ε)-conjunto generador para X .
x∈F
Observación 3.1. 1. 0 < Qn (T, f, ε) ≤ keSn f krn (ε, X) < ∞.
2. Si ε1 < ε2 , entonces Qn (T, f, ε1 ) ≥ Qn (T, f, ε2 ).
3. Qn (T, 0, ε) = rn (ε, X).
Definición 3.2. Para f ∈ C(X, R) y ε > 0, definamos

1
Q(T, f, ε) = lı́m sup log(Qn (T, f, ε)).
n→∞ n
Observación 3.2. 1. Por Teorema 2.10, se obtiene que Q(T, f, ε) ≤ kf k+r(ε, X, T ) < ∞.
2. Si ε1 < ε2 , entonces Q(T, f, ε1 ) ≥ Q(T, f, ε2 ).
Definición 3.3. Si f ∈ C(X, R), definimos P (T, f ) = lı́m Q(T, f, ε).

ε→0
Observación 3.3. 1. Por la observación anterior, P (T, f ) existe pero puede ser ∞.
Definición 3.4. La función P (T, ·) : C(X, R) → R ∪ {∞} es llamada la presión topológica

de T .
Claramente P (T, 0) = h(T ). Encontraremos otras formas equivalentes de dar la definición.

Definición 3.5. Para f ∈ C(X, R), n ≥ 1 y ε > 0, definamos
( )
X
Pn (T, f, ε) = sup e(Sn f )(x) : E es un (n, ε)-conjunto separado de X
x∈E
Observación 3.4. 1. Si ε1 < ε2 , entonces Pn (T, f, ε1 ) ≥ Pn (T, f, ε2 ).
2. Pn (T, 0, ε) = sn (ε, X).
3. Qn (T, f, ε) ≤ Pn (T, f, ε). Esto es ya que un (n, ε) conjunto separado el cual no se puede
ampliar a un (n, ε) conjunto separado tiene que ser un (n, ε) conjunto generador para
X.
4. Si δ > 0 es tal que d(x, y) < ε/2 implica |f (x) − f (y)| < δ, entonces Pn (T, f, ε) ≤
enδ Qn (T, f, ε/2).
Demostración. Sea E un (n, ε) conjunto separado y F un (n, ε/2) conjunto generador.

Definamos φ : E → F tal que para cada x ∈ E, existe φ(x) ∈ F tal que dn (x, φ(x)) ≤ ε/2
(usando la notación dn (x, y) = máx d(T i (x), T i (y)). Entonces φ es inyectiva, ası́
0≤i≤n−1
X X
e(Sn f )(y) ≥ e(Sn f )(y)
y∈F y∈φE
X
≥ mı́n e(Sn f )(φx)−(Sn f )(x) e(Sn f )(x)
x∈E
x∈E
X
−nδ (Sn f )(x)
≥e e .
x∈E
Por lo tanto, Qn (T, f, ε/2) ≥ e−nδ Pn (T, f, ε).
Definición 3.6. Para f ∈ C(X, R) y ε > 0, definamos

1
P (T, f, ε) = lı́m sup log(Pn (T, f, ε)).
n→∞ n
Observación 3.5. 1. Q(T, f, ε) ≤ P (T, f, ε).
2. Si δ es tal que d(x, y) < ε/2 implica |f (x) − f (y)| < δ, entonces P (T, f, ε) ≤ δ +
Q(T, f, ε).
3. Si ε1 < ε2 , entonces P (T, f, ε1 ) ≥ P (T, f, ε2 ).

Teorema 3.1. Si f ∈ C(X, R), entonces P (T, f ) = lı́m P (T, f, ε).
ε→0
Demostración. El lı́mite existe por la Observación 3.5, parte 3, y por la Observación 3.5,
parte 1 tenemos que P (T, f ) ≤ lı́m P (T, f, ε). Por la Observación 3.5, parte 2, para todo
ε→0
δ > 0, tenemos que lı́m P (T, f, ε) ≤ δ + P (T, f ) ≤ P (T, f ).
ε→0
Definición 3.7. Para f ∈ C(X, R), n ≥ 1 y α un cubrimiento abierto de X, definamos
 
X n−1
_ 
(Sn f )(x) −i
qn (T, f, α) = ı́nf ı́nf e : β es un subcubrimiento finito de T α
 x∈B 
B∈β i=0
 
X n−1
_ 
pn (T, f, α) = ı́nf sup e(Sn f )(x) : β es un subcubrimiento finito de T −i α .
B∈β x∈B
 
i=0
Claramente, qn (T, f, α) ≤ pn (T, f, α).

Teorema 3.2. Sea T : X → X continua y f ∈ C(X, R).
a) Si α es un cubrimiento abierto de X con número de Lebesgue δ, entonces qn (T, f, α) ≤
Qn (T, f, δ/2) ≤ Pn (T, f, δ/2).
b) Si ε > 0 y γ es un cubrimiento abierto con diam (γ) ≤ ε, entonces Qn (T, f, ε) ≤

Pn (T, f, ε) ≤ pn (T, f, γ).
Demostración. Sabemos que Qn (T, f, ε) ≤ Pn (T, f, ε), para todo ε > 0.
Tn−1 −i
T B̄(T i x; δ/2). Como
S
a) Si F es un (n, δ/2) conjunto generador, entonces X = x∈F i=0
cada i x; δ/2) es un subconjunto de algun miembro de α, tenemos que qn (T, f, α) ≤
P B̄(T (S f )(x) , luego q (T, f, α) ≤ Q (T, f, δ/2).
x∈F e
n
n n
Wn−1 −i
b) Sea E un conjunto (n, ε)-separadoPde X. Como ningún miembro de i=0 T γ contiene
dos elementos de E, tenemos que x∈E e(Sn f )(x) ≤ pn (T, f, γ). Por lo tanto, Pn (T, f, ε) ≤
pn (T, f, γ).
Observación 3.6. 1. Si α, γ son cubrimientos abiertos de X y α < γ, entonces qn (T, f, α) ≤

qn (T, f, γ).
2. Si d(x, y) diam (α) implica que |f (x) − f (y)| ≤ δ entonces pn (T, f, α) ≤ enδ qn (T, f, α).
1
Lema 3.1. Si f ∈ C(X, R) y α es un cubrimiento abierto de X, entonces lı́m log(pn (T, f, α))
n→∞ n
existe y es igual a ı́nf n (1/n) log(pn (T, f, α)).
Demostración. Por Teorema 1.5 es suficienteWdemostrar que pn+k (T, f, α) ≤ pn (T, f, α) ·
n−1 −i
pk (T, f, α). Si β es un subcubrimiento finito de i=0 T α y γ es un subcubrimiento finito de
Wn−1 −i −n γ es un subcubrimiento finito de k+n−1 T −i α, y ası́ tenemos
W
i=0 T α, entonces β ∨ T i=0
  
X X X
sup e(Sn+k f )(x) ≤  sup e(Sn f )(x)   sup e(Sk f )(x)  .
x∈D B∈β x∈B C∈γ x∈C
D∈β∨T −n γ
Por lo tanto, pn+k (T, f, α) ≤ pn (T, f, α) · pk (T, f, α).

Teorema 3.3. Si T : X → X es continua y f ∈ C(X, R), entonces las siguientes expresiones
son iguales a P (T, f ).
n o
a) lı́m sup lı́m (1/n) log(pn (T, f, α)/α) es un cubrimiento abierto de X con diam (α) ≤ δ .
δ→0 α n→∞
h i
b) lı́m lı́m (1/n) log(pn (T, f, αk )) si {αk } es una sucesión de cubrimientos abiertos con
k→∞ n→∞
diam (αk ) → 0.
n o
c) lı́m sup lı́m inf (1/n) log(qn (T, f, α)/α) es un cubrimiento abierto de X con diam (α) ≤ δ .
δ→0 α n→∞

d) lı́m sup lı́m sup(1/n) log(qn (T, f, α)/α) es un cubrimiento abierto de X con diam (α) ≤ δ .
δ→0 α n→∞
h i
e) lı́m lı́m (1/n) log(qn (T, f, αk )) si {αk } es una sucesión de cubrimientos abiertos con
k→∞ n→∞
diam (αk ) → 0.

f ) sup lı́m sup(1/n) log(qn (T, f, α))/α es un cubrimiento abierto de X .
α n→∞
g) lı́m lı́m inf (1/n) log(Qn (T, f, ε)).

ε→0 n→∞
h) lı́m lı́m inf (1/n) log(Pn (T, f, ε)).

ε→0 n→∞
Demostración. a) Si δ > 0 y γ es un cubrimiento abierto con diam (γ) ≤ δ, entonces

Pn (T, f, δ) ≤ pn (T, f, γ) por Teorema 3.2, parte b, y ası́, usando Lema 3.1 tenemos

1
P (T, f, δ) ≤ sup lı́m log(pn (T, f, γ))/γ es un cubrimiento de X con diam (γ) ≤ δ .
n→∞ n
Por lo tanto, P (T, f ) no es más grande que

n o
lı́m sup lı́m (1/n) log(pn (T, f, α)/α) es un cubrimiento abierto de X con diam (α) ≤ δ .
δ→0 α n→∞
Si α es un cubrimiento y δ es un número de Lebesgue para α, entonces qn (T, f, α) ≤

Pn (T, f, δ/2) por Teorema 3.2, parte a. Además, si definimos τα = sup{|f (x) − f (y)| :
dist (x, y) ≤ diam (α)}, entonces pn (T, f, α) ≤ enτα qn (T, f, α), por Observación 3.6, parte
2. Luego
pn (T, f, α) ≤ enτα Pn (T, f, δ/2)
ası́
1
lı́mlog(pn (T, f, α)) ≤ τα + P (T, f ),
n→∞ n
y
1
lı́m sup lı́m log(pn (T, f, α)) / diam (α) ≤ η ≤ P (T, f ).
η→0 α n→∞ n
b) Análogo a (a)
c) Sabemos que qn (T, f, α) ≤ pn (T, f, α), para todo α. Además si τα = sup{|f (x) − f (y)| :
d(x, y) ≤ diam (α)}, entonces pn (T, f, α) ≤ enτα qn (T, f, α). Por lo tanto,
e−nτα pn (T, f, α) ≤ qn (T, f, α) ≤ pn (T, f, α),
ası́
1 1
−τα + lı́m log(pn (T, f, α)) ≤ lı́m inf log(qn (T, f, α))
n→∞ n n→∞ n
1
≤ lı́m sup log(qn (T, f, α))
n→∞ n
1
≤ lı́m log(pn (T, f, α)).
n→∞ n
Por lo tanto, se tiene lo de (c).
d) Análogo a (c)
e) Análogo a (c)
f) Sea α un cubrimiento abierto de X y sea 2ε un número de Lebesgue para α. Por Teorema

3.2, qn (T, f, α) ≤ Qn (T, f, ε), y ası́ lı́m supn→∞ (1/n)qn (T, f, α) ≤ Q(T, f, ε) ≤ P (T, f ).
Por lo tanto, la expresión en (e) está mayorada por P (T, f ). La otra desigualdad se deduce
de (d).
g) Sea αε = {B(x, 2ε)/x ∈ X} y γε = {B(x, ε/2)/x ∈ X}. Entonces, por Teorema 3.2 y
Observación 3.6, parte 2,
e−nτ4ε pn (T, f, αε ) ≤ qn (T, f, αε ) ≤ Qn (T, f, ε) ≤ Pn (T, f, ε) ≤ pn (T, f, γε )
donde τ4ε = sup{|f (x) − f (y)| : d(x, y) ≤ 4ε}. Entonces tomando lı́m inf se obtiene lo
deseado.
h) Análogo a (g).
Observación 3.7. 1. Para algunos ejemplos,

n o
sup lı́m (1/n) log(pn (T, f, α)) : α es un cubrimiento abierto de X
n→∞
es estrictamente mayor que P (T, f ).
2. De la parte (f ) del Teorema 3.3 se observa que P (T, f ) no depende de la métrica de X.
Como uno puede esperar, de lo que sabemos de entropı́a topológica, la definición de

presión puede ser simplificada para homeomorfismos expansivos.
Lema 3.2. Si T : X → X es una transformación continua del espacio compacto metrizable
X y α es un cubrimiento abierto de X, entonces para k > 0 y f ∈ C(X, R),
k
!!
1 1 _
−i
lı́m sup log(qn (T, f, α)) = lı́m sup log qn T, f, T α
n→∞ n n→∞ n
i=0
Wk
ylı́mn→∞ (1/n) log(pn (T, f, α)) = lı́mn→∞ (1/n) log(pn (T, f, i=0 T −i α)). Si T es un homeo-
morfismo y k, m ≥ 0 entonces estas fórmulas se mantienen remplazando ki=0 T −i α por
W
Wk −i
i=−m T α.
Demostración. Fácilmente uno puede ver que

k
!
_
−(k+1)kf k −i
e qn+k (T, f, α) ≤ qn T, f, T α ≤ e(k+1)kf k qn+k (T, f, α)
i=0
y
k
!
_
e−(k+1)kf k pn+k (T, f, α) ≤ pn T, f, T −i α ≤ e(k+1)kf k pn+k (T, f, α).
i=0
Lo primero que uno quiere demostrar sale de lo anterior. Para demostrar lo segundo, es
suficiente mostrar que
1 1
lı́m sup log(qn (T, f, T −1 β)) = lı́m sup log(qn (T, f, β))
n→∞ n n→∞ n
y
1 1
lı́m sup log(pn (T, f, T −1 β)) = lı́m sup log(pn (T, f, β))
n→∞ n n→∞ n
cuando T es un homeomorfismo y β es un cubrimiento abierto de X. Como γ es W un subcu-
brimiento finito de i=0 T β si y solo si T γ es un subcubrimiento finito de ni=1 T −i β
−i −1
W
tenemos
 X 
Sn f (x)

 ı́nf e 

 x∈C n−1 
qn (T, f, β) 
C∈γ _
−i

≥ ı́nf : γ es un subcubrimiento finito de T β
qn (T, f, T −1 β)
X

 ı́nf eSn f (y) i=0


y∈T −1 C

 

C∈γ
 X 
Sn f (x)

 ı́nf e 


 x∈C n−1 

C∈γ _
−i
= ı́nf X −1 : γ es un subcubrimiento finito de T β

 ı́nf eSn f (T x) i=0



 x∈C 

C∈γ
ı́nf eSn f (x)

 
 n−1 
x∈C
_
−i
≥ ı́nf mı́n : γ es un subcubrimiento finito de T β
 C∈γ ı́nf eSn f (T −1 x) 
i=0
x∈C
−2kf k
≥e .
Una demostración similar nos da que
qn (T, f, T −1 β)
≥ e−2kf k
qn (T, f, β)
y ası́ obtenemos el resultado. La demostración para pn es análoga.
El siguiente resultado generaliza al Teorema 2.14.
Teorema 3.4. a) Si α es un generador para T , entonces para todo f ∈ C(X, R),

1 1
P (T, f ) = lı́m log(pn (T, f, α)) = lı́m sup log(qn (T, f, α))
n→∞ n n→∞ n
b) Si δ es una constante de expansividad para T , entonces P (T, f ) = P (T, f, δ0 ) = Q(T, f, δ0 ),

para todo δ0 < δ/4 y todo f ∈ C(X, R).
Demostración. a) Sea α un generador para T . Por Teorema 2.8 tenemos que

k
!
_
−i
diam T α →0
i=−k
y ası́ por Teorema 3.2, parte b

k
!!
1 _
−i
P (T, f ) = lı́m lı́m log pn T, f, T α .
k→∞ n→∞ n
i=−k
Una aplicación del Lema 3.2 nos da el resultado deseado. La fórmula para qn se prueba
de forma similar usando Teorema 3.2, parte e y Lema 3.2.
b) Sea δ0 < δ/4 y escojamos x1 , . . . , xk tal que X = ki=1 B(xi ; (δ/2) − 2δ0 ). El cubrimiento
S
α = {B(xi ; δ/2) : 1 ≤ i ≤ k} tiene a 2δ0 como número de Lebesgue, entonces por Teorema
3.2 tenemos
1 1
lı́m sup log(qn (T, f, α)) ≤ lı́m sup log(Qn (T, f, δ0 ))
n→∞ n n→∞ n
1
≤ lı́m sup log(Pn (T, f, δ0 ))
n→∞ n
≤ P (T, f )
Y ası́ el resultado sigue por (a) dado que α es un generador.
Podemos usar esto para calcular P (T, f ) cuando T es el shift bidireccional en X = ∞

Q
−∞ Y,
Y = {0, 1, . . . , k − 1}, y f depende solo en la 0-ésima coordenada, es decir, f ({xn }) =
ax0 , donde a0 , a1 , . . . , ak−1 ∈ R. Si α denota el generador natural, entonces qn (T, f, α) =
pn (T, f, α) = (ea0 + · · · + eak−1 )n y ası́ P (T, f ) = log(ea0 + · · · + eak−1 ).
3.2. Propiedades de la presión
Ahora estudiaremos las propiedades de P (T, ·) : C(X, R) → R ∪ {∞}. En particular,
veremos que P (T, ·) o nunca toma el valor ∞ o es idénticamente ∞.
Teorema 3.5. Sea T : X → X una transformación continua del espacio compacto metrizable
X. Si f, g ∈ C(X, R), ε > 0 y c ∈ R, entonces
a) P (T, 0) = h(T ).
b) Si f ≤ g, entonces P (T, f ) ≤ P (t, g). En particular, h(T )+ı́nf f ≤ P (T, f ) ≤ h(T )+sup f .
c) P (T, ·) o es finito o es constantemente ∞.
d) |P (T, f, ε) − P (T, g, ε)| ≤ kf − gk. Ası́, si P (T, ·) < ∞, entonces |P (T, f ) − P (T, g)| ≤
|f − gk.
e) P (T, ·, ε) es convexo. En consecuencia, si P (T, ·) < ∞, entonces P (T, ·) es convexo.
f ) P (T, f + c) = P (T, f ) + c.
g) P (T, f + g ◦ T − g) = P (T, f ).
h) P (T, f + g) ≤ P (T, f ) + P (T, g).
i) P (T, cf ) ≤ cP (T, f ) si c ≥ 1 y P (T, cf ) ≥ cP (T, f ) si c ≤ 1.
j) |P (T, f )| ≤ P (T, |f |).
Demostración. En varias ocasiones en las demostraciones usaremos la desigualdad

sup aj aj
≤ sup
sup bj bj
donde (aj ), (bj ) son colecciones de números reales positivos.
a) Es claro de la definición de presión.
b) Es claro de la definición de presión.
c) De (a) y (b) tenemos
h(T ) + ı́nf f ≤ P (T, f ) ≤ h(T ) + sup f
y ası́ P (T, f ) = ∞ si, y sólo si, h(T ) = ∞.

d) Por la desigualdad mencionada en el comienzo de la demostración, tenemos
 X (S f )(x) 

 e n 

Pn (T, f, ε) 
x∈E

≤ sup X : es un conjunto (n, ε) generador
Pn (T, g, ε) 
 e(Sn g)(x) 

 
x∈E
( ( ) )
e(Sn f )(x)
≤ sup máx : E es un conjunto (n, ε) generador
x∈E e(Sn g)(x)
≤ enkf −gk .
Esto prueba (d).
e) Por la Desigualdad de Hölder, si p ∈ [0, 1] y E es un conjunto finito de X, tenemos

!p !1−p
X X X
p(Sn f )(x)+(1−p)(Sn g)(x) (Sn f )(x) (Sn g)(x)
e ≤ e e .
x∈E x∈E x∈E
Por lo tanto, Pn (T, pf + (1 − p)g, ε) ≤ Pn (T, f, ε)p · Pn (T, g, ε)1−p y ası́, tenemos (e).
f) Es claro de la definición de presión.
g) Tenemos
( )
f )(x)+g(T n x)−g(x)
X
Pn (T, f +g◦T −g, ε) = sup e(Sn : E es un conjunto (n, ε)-generador
x∈E
y ası́
e−2kgk Pn (T, f, ε) ≤ Pn (T, f + g ◦ T − g, ε) ≤ e2kgk Pn (T, f, ε).
Y con esto, se tiene el resultado.
h) Esto se tiene, dado que Pn (T, f + g, ε) ≤ Pn (T, f, ε) · Pn (T, g, ε).
i) Si a1 , . . . , ak son números positivo tal que ki=1 ai = 1, entonces ki=1 aci ≤ 1 si c ≥ 1 y

P P
Pk c
i=1 ai ≥ 1 si c ≤ 1. Por lo tanto, si E es un conjunto finito de X tenemos
!c
X X
ec(Sn f )(x) ≤ e(Sn f )(x) si c ≥ 1
x∈E x∈E
y !c
X X
c(Sn f )(x) (Sn f )(x)
e ≥ e si c ≤ 1
x∈E x∈E
Por lo tanto, Pn (T, cf, ε) ≤ (Pn (T, f, ε))c si c ≥ 1 y Pn (T, cf, ε) ≥ (Pn (T, f, ε))c si c ≤ 1.
j) Como −|f | ≤ f ≤ |f | tenemos por (b), P (T, −|f |) ≤ P (T, f ) ≤ P (T, |f |). De (i) tenemos
que −P (T, |f |) ≤ P (T, −|f |) y ası́, |P (T, f )| ≤ P (T, |f |).
Ahora estudiaremos como P (T, ·) depende de T . Otras propiedades que pueden ser de-
mostradas ahora, las daremos después de demostrar el Principio Variacional en la sección
3.3.
Teorema 3.6. Sea T : X → X una transformación continua del espacio compacto metrizable
X y f ∈ C(X, R), entonces
a) Si k > 0, entonces P (T k , Sk f ) = kP (T, f ).
b) Si T es un homeomorfismo, P (T −1 , f ) = P (T, f ).
c) Si Y es un subconjunto cerrado de X con T Y ⊂ Y, entonces P (T |Y , f |Y ) ≤ P (T, f ).
d) Si Ti : Xi → Xi con i = 1, 2, es una transformación continua del espacio compacto
metrizable (Xi , di ) y si φ : X1 → X2 es una transformación continua sobreyectiva con
φT1 = T2 φ, entonces P (T2 , f ) ≤ P (T1 , f ◦ φ), para todo f ∈ C(X2 , R). Si φ es un homeo-
morfismo, entonces P (T2 , f ) = P (T1 , f ◦ φ), para todo f ∈ C(X2 , R).
e) Si Ti : Xi → Xi con i = 1, 2, es una transformación continua del espacio compacto
metrizable (Xi , di ) y si fi ∈ C(Xi , R), entonces P (T1 × T2 , f1 × f2 ) = P (T1 , f1 ) + P (T2 , f2 ),
donde f1 × f2 ∈ C(X1 × X2 , R) está definido por (f1 × f2 )(x1 , x2 ) = f1 (x1 ) + f2 (x2 ).
Demostración. a) Si F es un conjunto (nk, ε)-generador para T , entonces F es un
conjunto (n, ε)-generador para T k . Luego Qn (T k , Sk f, ε) ≤ Qnk (T, f, ε), y ası́
P (T k , Sk f ) ≤ kP (T, f ). Para mostrar la otra desigualdad, sea ε > 0 y escojamos δ > 0 tal
que d(x, y) < δ implique máx1≤i≤k−1 d(T i x, T i y) < ε. Si F es un conjunto (n, δ) genera-
dor para T k , entonces F es un conjunto (nk, ε)-generador para T . Luego Qn (T k , Sk f, δ) ≥
Qnk (T, f, ε) y ası́ P (T k , Sk f ) ≥ Q(T k , Sk f, δ) ≥ kQ(T, f, ε). Tomando lı́mite cuando ε
tiende a 0 tenemos que P (T k , Sk f ) ≥ kP (T, f ).
b) Un conjunto E es (n, ε)-separado para T si, y solamente si, T n−1 E es (n, ε) para T −1 .
Además
−1 −(n−1) y)
X X
e(Sn f )(x) = ef (y)+f (T y)+...+f (T .
x∈E y∈T n−1 E
Ası́ Pn (T, f, ε) = Pn (T −1 , f, ε) y P (T, f ) = P (T −1 , f ).

c) Es claro ya que un conjunto (n, ε) separado de Y es un conjunto (n, ε) generador para X.
d) Sea ε > 0 y escojamos δ > 0 tal que d1 (x, y) < δ implique d2 (φ(x), φ(y)) < ε. Si F es un
conjunto (n, ε) generador para T1 , entonces φF es un conjunto (n, ε)-generador para T2 y
X n−1 X n−1
ef (φx)+f (φT1 x)+...+f (φT1 x) ≥ ef (y)+f (T2 y)+...+f (T2 y) ≥ Qn (T2 , f, ε).
x∈F y∈φF
Por lo tanto P (T1 , f ◦ φ) ≥ Q(T1 , f ◦ φ, δ) ≥ Q(T2 , f, ε) y ası́ P (T1 , f ◦ φ) ≥ P (T2 , f ). Si

φ es un homeomorfismo entonces podemos aplicar lo hecho anteriormente reemplazando
T1 , T2 , φ, f por T2 , T1 , φ−1 , f ◦ φ respectivamente, para obtener P (T2 , f ) ≥ P (T1 , f ◦ φ).
e) Consideremos la métrica en X1 ×X2 dada por d((x1 , x2 ), (y1 , y2 )) = máx{d1 (x1 , y1 ), d2 (x2 , y2 )}.
Si Fi es un conjunto (n, ε) generador para X, entonces F1 × F2 es un conjunto (n, ε)-
generador para X1 × X2 con respecto a T1 × T2 . Además
n−1
!
X X
exp (f1 × f2 )(T1 × T2 )(x1 , x2 ) =
(x1 ,x2 )∈F1 ×F2 i=0
 !  !
X n−1
X X n−1
X
 exp f1 (T1i (x1 ))   exp f2 (T2i (x2 )) 
x1 ∈F1 i=0 x2 ∈F2 i=0
y ası́
Qn (T1 × T2 , f1 × f2 , ε) ≤ Qn (T1 , f1 , ε) · Qn (T2 , f2 , ε).
Por lo tanto, P (T1 × T2 , f1 × f2 ) ≤ P (T1 , f1 ) + P (T2 , f2 ). Si Ei es un conjunto (n, ε)
separado para Xi , entonces E1 × E2 es un conjunto (n, ε) separado para X1 × X2 , ası́
Pn (T1 × T2 , f1 × f2 , ε) ≥ Pn (T1 , f1 , ε) · Pn (T2 , f2 , ε).
Ası́,
1 1 1
lı́m sup log(Pn (T1 ×T2 , f1 ×f2 , ε)) ≥ lı́m inf log(Pn (T1 , f1 , ε))+lı́m sup log(Pn (T2 , f2 , ε)),
n→∞ n n→∞ n n→∞ n
y el Teorema 3.3, parte h nos da que P (T1 × T2 , f1 × f2 ) ≥ P (T1 , f1 ) + P (T2 , f2 ).
3.3. El Principio Variacional

Pk
Lema 3.3. Sean a1 , . . . , ak números reales. Si pi ≥ 0 y i=1 = 1, entonces
k k
!
X X
pi (ai log(pi )) ≤ log eai
i=1 i=1
y la igualdad se da si, y solamente si,

eai
pi = Pk
ai
j=1 e
Pk aj .
Demostración. Sea M = j=1 e En el Teorema 1.2, pongamos
eai pi M
αi = y xi = a .
M e i
Entonces
k
eai pi M

X pi M
0 = φ(1) ≤ log
M eai eai
i=1
k
X
= pi [log(pi ) + log(M ) − ai ].
i=1
pi (ai − log(pi )) ≤ log(M ), y la igualdad se da si, y solamente si, (pi M/eai ) es
P
Entonces,
independiente de i, es decir, pi = (eai /M ).
Ahora enunciaremos algunos previos sobre medidas invariantes.

Definición 3.8. Denotaremos por M (X) la colección de todas las medidas de probabilidad
definidas en el espacio medible (X, A). Notar que M (X) es un conjunto convexo. Denotaremos
por M (X, T ) a todas las medidas invariantes por T . A partir de T , definimos una nueva
función T̃ : M (X) → M (X) dada por (T̃ µ)(B) = µ(T −1 B).
Teorema 3.7. Sea T : X → X continua. P Si {σn }∞
n=1 es una sucesión en M (X) y formamos la
∞ n−1 −i
nueva sucesión {µn }n=1 por µn = (1/n) i=0 T̃ σn , entonces todo punto lı́mite µ de {µn }
es un miembro de M (X, T ).
Definición 3.9. La función de entropı́a de la transformación continua T : X → X es la
función definida en M (X) y toma valores en [0, ∞], definida por µ → hµ (T ).
Lema 3.4. Sea X un espacio métrico compacto y µ ∈ M (X).
a) Si x ∈ X y δ > 0, existe δ 0 < δ tal que µ(∂B(x, δ 0 )) = 0.
b) Si δ > 0, existe una partición ξ = {A1 , . . . , Ak } de (X, B(X)) tal que diam (Aj ) < δ y
µ(∂Aj ) = 0, para todo j.
1. Si µi ∈ M (X), 1 ≤ i ≤ n, y pi ≥ 0 tal que ni=1 pi = 1, entonces
P
Observación 3.8.
n
X
HPn i=1 pi µi (ξ) ≥ pi Hµi (ξ)
i=1
para toda partición finita ξ de (X, B(X))
2. Si µ ∈ M (X, T ) y si µ(∂Ai ) = 0, 0 ≤ i ≤ n − 1, entonces

n−1
!!
\
−i
µ ∂ T Ai =0
i=0
ya que
n−1 n−1
!
\ [
−i
∂ T Ai ⊂ T −i ∂Ai
i=0 i=0
.
Teorema 3.8. Sea T : X → X un mapeo continuo del espacio métrico compacto X. Entonces
h(T ) = sup{hµ (T ) : µ ∈ M (X, T )}.
Teorema 3.9. Sea T : X → X un mapeo continuo del espacio métrico compacto X y sea
f ∈ C(X, R). Entonces
Z
P (T, f ) = sup hµ (T ) + f dµ : µ ∈ M (X, T ) .
R
Demostración. 1. Sea µ ∈ M (X, T ). Mostraremos que hµ (T ) + f dµ ≤ P (T, f ). Sea
ξ = {A1 , . . . , Ak } una partición de (X, B(X)). Sea a > 0 dado. Escojamos ε > 0 tal
que εk log(k) < a. Como µ es regular, existen conjuntos compactos Bj ⊂ Aj con
µ(Aj \ Bj ) < ε, 1 ≤ j ≤ k. Sea η = {B0 , B1 , . . . , Bk } una particion de (X, B(X)) donde
B0 = X \ kj=1 Bj . Entonces como en la demostración del Teorema 3.8, Hµ (ξ/η) <
S
εk log(k) < a. Sea
b = mı́n d(Bi , Bj ) > 0.
1≤i6=j≤k
Escojamos δ > 0 tal que δ < b/2 y d(x, y) < δ implique |f (x) − f (y)| < ε. Fijemos n y
sea E un conjunto (n, ε)-separado con respecto a T , el cual deja de ser (n, ε)-separado es
agregado cuando cualquier punto. Entonces E es también un conjunto (n, δ) generador.
Wn−1
Si C ∈ i=0 T −i η, sea α(C) = sup{(Sn f )(x) : x ∈ C}. Entonces
n−1
! Z
_ X
−i
Hµ T η + Sn f dµ ≤ µ(C)[− log µ(C) + α(C)]
i=0 C∈ n−1 −i η
W
i=0 T
 
X
≤ log  eα(C)  .
Wn−1
C∈ i=0 T −i η
Wn−1 −i
Esta última desigualdad obtenida del Lema 3.3. Para cada C ∈ i=0 T η escojamos
algún x ∈ C tal que (Sn f )(x) = α(C). Como E es un conjunto (n, δ)-generador, es-
cojamos y(C) ∈ E tal que d(T i x, T i y(C)) ≤ δ, 0 ≤ j ≤ n − 1. Entonces α(C) ≤
(Sn f )(y(C)) + nε. Además cada bola de radioWδ intersecta a la clausura de a lo más dos
miembros de η y ası́, si y ∈ E entonces {C ∈ n−1 −i
i=0 T η : y(C) = y} tiene cardinalidad
n
a lo más 2 . Por lo tanto
X X X
eα(C)−nε ≤ e(Sn f )(y(C)) ≤ 2n e(Sn f )(y)
C∈ n−1
Wn−1
−i η T −i η y∈E
W
i=0 T C∈ i=0
y ası́    
X X
log  eα(C)  − nε ≤ n log(2) + log  e(Sn f )(y)  .
Wn−1
C∈ y∈E
i=0
Luego
n−1 n−1
! Z Z !
1 _
−i 1 _ 1 −i
Hµ T η + f dµ = Hµ T η + Sn f dµ
n n n
i=0 i=0
 
1 X
≤ ε + log(2) + log  e(Sn f )(y) 
n
y∈E
1
≤ ε + log(2) + log(Pn (T, f, δ))
n
y por lo tanto
Z
hµ (T, η) + f dµ ≤ ε + log(2) + P (T, f, δ) ≤ ε + log(2) + P (T, f ).
R
Ahora, por Teorema 1.8, parte d, hµ (T,Rξ) ≤ hµ (T, η)+Hµ (ξ/η) y ası́ hµ (T, ξ)+ f dµ ≤
2a + log(2) + P (T, f ), luego hµ (T ) + f dµ ≤ 2a + log(2) + P (T, f ). Esto se da para
n
R toda f ∈ C(X, R) ası́ que podemos aplicarlo para T
toda aplicación continua T y para
y Sn f para obtener n[hµ (T ) + f dµ] ≤ 2a + log(2) + nP (T, f ) (por Teorema 3.6, parte
a). Como esto se da para todo n tenemos
Z
hµ (T ) + f dµ ≤ P (T, f ).
R
2. Sea ε > 0. Vamos a encontrar µ ∈ M (X,R T ) tal que hµ (T ) + f dµ ≥ P (T, f, ε), y
esto claramente implica que sup{hµ (T ) + f dµ : µ ∈ M (X, T )} ≥ P (T, f ). Sea En un
conjunto (n, ε) separado con
X
log e(Sn f )(y) ≥ log(Pn (T, f, ε)) − 1.
y∈En
Sea σn ∈ M (X) la medida atómica concentrada en En dada por la fórmula

(Sn f )(y) δ
P
y∈E e y
σn = P n (S f )(x) .
z∈En e
n
Sea µn ∈ M (X) definida por

n−1
1X
µn = σn ◦ T −i .
n
i=0
Como M (X) es compacto, podemos escoger una subsucesión {nj } de números naturales
tal que
1
lı́m log(Pnj (T, f, ε)) = P (T, f, ε)
j→∞ nj
y {µnj } converge en M (X) a algúnR µ ∈ M (X). Por Teorema 3.7 sabemos que µ ∈
M (X, T ). Por demostrar, hµ (T ) + f dµ ≥ P (T, f, ε). Por Lema 3.4 escojamos una
partición ξ = {A1 , . . . , Ak } de (X, B(X))
Wn−1 tal−jque diam (Ai ) < ε y µ(∂Ai ) = 0, para
i ≤ i ≤ k. Como cada elemento de j=0 T ξ contiene a lo más un elemento de En
tenemos
 
n−1
_ Z X
Hσn  T −i ξ  + Sn f dσn = σn ({y})((Sn f )(y) − log(σn ({y})))
j=0 y∈En
 
X
= log  e(Sn f )(y) 
y∈En
por la definición de σn y Lema 3.3. Fijemos números naturales q, n con 1 ≤ q < n y
definamos, para 0 ≤ j ≤ q − 1, a(j) = [(n − j)/q]. Fijemos 0 ≤ j ≤ q − 1. Por la
Observación 3.8, parte 1 tenemos
 
n−1 a(j)−1 q−1
_ _ _ _
T −i ξ =  T −(rq+j) T −i ξ  ∨ T −l ξ
i=0 r=0 j=0 l∈S
y S tiene cardinalidad a lo más 2q. Por lo tanto

   
X n−1
_ Z
(Sn f )(y)  −j 
log  e = Hσn  T ξ + Sn f dσn
y∈En j=0
a(j)−1 q−1
! ! Z
X _ _
−(rq+j) −i −k
≤ Hσn T T ξ + Hσn T ξ + Sn f dσn
r=0 i=0 k∈S
a(j)−1 q−1
! Z
X _
−i
≤ Hσn ◦T −(rq+j) T ξ + 2q log(k) + Sn f dσn .
r=0 i=0
Sumando esto sobre j y usando Observación 3.8, parte 3 tenemos

 
n−1 q−1
! Z
X X _
(Sn f )(y)  −i 2
q log  e ≤ Hσ◦T −p T ξ + 2q log(k) + q Sn f dσn .
y∈En p=0 i=0
Ahora dividamos por n y usando Observación 3.8, parte 1 tenemos

 
q−1
!
2q 2
Z
q X
(Sn f )(y) 
_
−i
log  e ≤ Hµn T ξ + log(k) + q f dµn . (1)
n n
y∈En i=0
Como µ(∂Ai ) = 0 para todo i, por Observación 3.8, parte 3 tenemos

q−1 q−1
! !
_ _
−i −i
lı́m Hµnj T ξ = Hµ T ξ .
j→∞
i=0 i=0
Ası́ reemplazando n por nj en (1), tenemos

q−1
! Z
_
−i
qP (T, f, ε) ≤ Hµ T ξ +q f dµ.
i=0
Dividiendo por q y haciendo tender q a infinito, nos da

Z Z
P (T, f, ε) ≤ hµ (T, ξ) + f dµ ≤ hµ (T ) + f dµ.
Corolario 3.1. Sea T : X → X una aplicación continua del espacio compacto metrizable X
y sea f ∈ C(X, R). Entonces
R
a) P (T, f ) = sup hµ (T ) + f dµ : µ ∈ E(X, T ) .
b) P (T, f ) = P (T |Ω(T ) , f |Ω(T ) ).
c) P (T, f ) = P (T |Trn=0 T n X , f |Trn=0 T n X ).
El Principio Variacional ayuda para calcular la presión de algunos ejemplos. Fácilmente

se puede observar del Principio Variacional, que si T es la aplicación identidad de X, entonces
P (T, f ) = sup f . Las medidas ergódicas invariantes para T son las medidas Delta de Dirac
δx , x ∈ X, ası́ la fórmula sigue por Corolario 3.1, parte a.
CorolarioR 3.2. Si T : X → X es únicamente ergódica y M (X, T ) = {m}, entonces P (T, f ) =

hm (T ) + f dm.
3.4. Presión determina M (X, T )

Demostraremos como P (T, ·) determina los miembros de M (X, T ) cuando T : X → X
es una aplicación continua del espacio compacto metrizable X. Recordemos que una medida
finita signada en X es una aplicación µ : B(X) → R el cual es contablemente aditivo.
Teorema 3.10. Sea T : X → X una aplicación continua del espacio compacto metrizable X
con h(T ) < ∞.R Sea µ : B(X) → R una medida finita signada. Entonces µ ∈ M (X, T ) si, y
solamente si, f dµ ≤ P (T, f ), para todo f ∈ C(X, R).
R
Demostración. Si µ ∈ M (X, T ) entonces f dµ ≤ P (T,Rf ) por el Principio Variacional.
Ahora, supongamos que µ es una medida finita signada y f dµ ≤ P (T, f ), para todo f ∈
C(X, R). Primero demostraremos que µ sólo toma valores no negativos. Supongamos ue f ≥ 0.
Si ε > 0 y n > 0 tenemos
Z Z
n(f + ε)dµ = − −n(f + ε)dµ
≥ −P (T, −n(f + ε))

≥ −[h(T ) + sup(−n(f + ε))] por Teorema 3.5, parte b
= −h(T ) + nı́nf(f + ε) > 0
R R
R f dµ ≥ 0. Luego µ es una
para n suficientemente grande. Por lo tanto (f + ε)dµ > 0 y ası́
medida. Ahora mostraremos que µ(X) = 1. Si n ∈ Z, entonces ndµ ≤ P (T, n) = h(T ) + n,
y ası́ µ(X) ≤ 1 + h(T )/n si n > 0, luego µ(X) ≤ 1, y µ(X) ≥ 1 + h(T )/n si n < 0, luego
µ(X) ≥ 1. Por loR tanto, µ(X) = 1. Finalmente, por demostrar, µ ∈ M (X, T ). Si n ∈ Z y
f ∈ C(X, R), n (f ◦ T − f )dµ ≤ P (T, n(f ◦ T − f )) = h(T ) por Teorema
R 3.5, parte g. Si
n ≥ 1, entonces dividiendo por n y haciendo tender n a ∞ tenemos (f R◦ T − f )dµ ≤ 0, y si
n ≤ −1, entonces
R R por n y haciendo tender n a −∞ tenemos (f ◦ T − f )dµ ≥ 0.
dividiendo
Por lo tanto, f ◦ T dµ = f dµ, para todo f ∈ C(X, R), ası́, µ ∈ M (X, T ).

Seminario

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Seminario

Încărcat de

Drepturi de autor:

Formate disponibile

Pontificia Universidad Católica de Valparaı́so

Facultad de Ciencias Básicas y Matemáticas

Seminario para optar al grado de Licenciado en Matemáticas.

Enzo Abraham Fuentes Manrı́quez.

Profesor Guı́a: Carlos Vásquez.

(*) Parcialmente financiado por proyecto Fondecyt 1110040.

3. Presión Topológica y su relación con Medidas Invariantes 39

Sea X un conjunto. Una σ-álgebra de subconjuntos de X es una colección A de subcon-

1.1. Particiones y sub-álgebras

Observación 1.1. 1. Nuestro interés va a estar puesto en particiones finitas, es decir,

2. Si ξ es una partición finita de (X, A, µ), entonces

Si C es una sub-σ-álgebra de A, entonces

Si n ≥ 0, tenemos las siguientes propiedades:

Ası́, la incertidumbre sobre el resultado de ξ dado Bj es

Por lo tanto, la incertidumbre sobre el resultado de ξ dado η es

a) H(p1 , . . . , pk ) ≥ 0, y H(p1 , . . . , pk ) = 0 si existe i tal que pi = 1.

b) Para cada k ≥ 1, H|4k es continua.

c) Para cada k ≥ 1, H|4k es simétrica.

e) H(ξ ∨ η) = H(ξ) − H(η/ξ)

f ) H((p1 , . . . , pk , 0)) = H((p1 , . . . , pk )).

Demostración. Consideremos la función U : N → R definida por U (k) = H(1/k, . . . , 1/k).

U (k) = H(1/k, . . . , 1/k, 0) ≤ H(1/(k + 1), . . . , 1/(k + 1)) = U (k + 1)

k 0 U (m) ≤ nU (k) ≤ (k 0 + 1)U (m)

por lo que tenemos

Definición 1.6. Sea B sub-σ-álgebra finita

Observación 1.3. 1. Si B = {X, ∅}, entonces H(B) = 0. En efecto,

3. H(B) ≥ 0. En efecto, como (X, A, µ) es espacio de probabilidad,

4. Si B $ C, entonces H(B) = H(C).

5. Si T : X → X preserva medida, entonces H(T −1 B) = H(B). En efecto,

es estrictamente convexa, i.e., si x, y ∈ [0, ∞) y α, β ≥ 0 tal que α + β = 1, entonces

i) Existe z ∈ (αx + βy, y) tal que

φ(y) − φ(αx + βy) φ(y) − φ(αx + βy) φ(y) − φ(αx + βy)

Por lo tanto, φ(y) − φ(αx + βy) = αφ0 (z)(y − x).

ii) Existe w ∈ (x, αx + βy) tal que

φ(αx + βy) − φ(x) φ(αx + βy) − φ(x) φ(αx + βy) − φ(x)

Por lo tanto, φ(αx + βy) − φ(x) = βφ0 (w)(y − x).

β(φ(y) − φ(αxβy)) = φ0 (z)αβ(x − y) = φ0 (w)αβ(x − y) = α(φ(αxβy) − φ(x)).

αφ(αx + βy) − αφ(x) < βφ(y) − β(αx + βy)

Aplicando la definición de φ tenemos

1.3. Entropı́a Condicional

omitiendo los j-elementos donde µ(Cj ) = 0.

Observación 1.4. 1. Si N = {∅, X}, entonces H(B/N ) = H(B), ya que

3. Si B $ D, entonces H(B/C) = H(D/C).

4. Si C $ D, entonces H(B/C) = H(B/D).

b) H(B ∨ C) = H(B) + H(C/B).

c) Si B ⊆ C, entonces H(B/D) ≤ H(C/D).

d) Si B ⊆ C, entonces H(B) ≤ H(C).

e) Si C ⊆ D, entonces H(B/C) ≥ H(B/D).

g) H(B ∨ C/D) ≤ H(B/D) + H(C/D).

h) H(B ∨ C) ≤ H(B) + H(C).

i) Si T preserva medida, entonces H(T −1 B/T −1 C) = H(B/C).

µ(Bi ∩ Cj ∩ Dk ) µ(Bi ∩ Cj ∩ Dk ) µ(Bi ∩ Dk )

= H(B/D) + H(C/B ∨ D).

b) Sea D = {X, ∅}, entonces

H(B ∨ C) = H(B ∨ C/D) = H(B/D) + H(C/B ∨ D) = H(B) + H(C/B).

c) Por a) tenemos que

H(C ∨ D) = H(B ∨ C/D) = H(B/D) + H(C/B ∨ D) ≥ H(B/D).

H(C) = H(C/D) ≥ H(B/D) = H(B).

µ(Dk ∩Cj ) µ(Bi ∩Dk )

Multiplicando por µ(Cj ) y haciendo la suma sobre i y j, finalmente tenemos

f) Sea C = {X, ∅}, ası́, C ⊆ D, y por e) tenemos H(B/D) ≤ H(B/C) = H(B).

h) Sea D = {X, ∅}, luego

H(B ∨ C) = H(B ∨ C/D) ≤ H(B/D) + H(C/D) = H(B) + H(C).

Teorema 1.6. Sea T : X → WX es una transformación