Sunteți pe pagina 1din 78

UNIVERSIDAD MAYOR DE SAN SIMÓN

FACULTAD DE CIENCIAS Y TECNOLOGÍA


CARRERA DE MATEMÁTICAS

HOMOLOGÍA PERSISTENTE

Proyecto de Grado, Presentado para optar al Diploma Académico de

Licenciado en Ingeniería Matemática

Presentado por: ROLANDO ESPINOZA LA FUENTE

Tutor: M.Sc. Gualberto Cupé Clemente

COCHABAMBA — BOLIVIA

MARZO 2015
Página dejada en blanco intencionalmente.
AGRADECIMIENTOS

Quiero expresar mi mayor agradecimiento a mi tutor, Lic. Gualberto Cupé, sus

enseñanzas, orientación y apoyo han sido sumamente importantes para la conclusión de

este trabajo.

Quiero agradecer a mis profesores, sin ellos mi educación en matemáticas no

hubiera sido posible. En particular, quiero mencionar a Lic. Luis Zegarra, Ing. Amilcar

Martinez y Lic. Carlos Gonzales, quienes me han brindado sus conocimientos y consejos

incontables veces, tanto dentro como fuera del aula.

Finalmente muchas gracias a mis padres, y en especial a Tatiana por su amor y

apoyo incondicional.

i
FICHA RESUMEN

La Topología Algebraica es una rama de las matemáticas dedicada a estudiar las

propiedades de espacios topológicos por medio de invariantes algebraicos, usualmente

grupos y anillos. Entre estos invariantes podemos destacar los Grupos de Homología

que, intuitivamente, miden los agujeros n-dimensionales de un espacio topológico. Por

ejemplo, H0 (X), H1 (X), H2 (X) (que denotan los grupos de homología del espacio X en

las dimensiones 0, 1 y 2) miden respectivamente el número de componentes conexas, el

número de agujeros y el número de cavidades del o “vacíos” espacio X.

La Homología Persistente es una herramienta algebraica para medir las caracterís-

ticas topológicas de formas y funciones a diferentes escalas o resoluciones. Ha mostrado

ser una herramienta muy útil en diversas áreas como biología, modelado geométrico,

análisis de redes y análisis de datos. En este trabajo damos una introducción teórica

abarcando: Complejos Simpliciales, Homología Simplicial y Homología Persistente, con

ejemplos aplicados al análisis de datos.

ii
Índice general

Agradecimientos ................................................................................................ i

Ficha Resumen .................................................................................................. ii

Índice................................................................................................................. iv

Lista de Figuras................................................................................................. v

Lista de Tablas .................................................................................................. vii

Introducción ...................................................................................................... 1

1. Complejos Simpliciales ................................................................................. 6

1.1. Preliminares....................................................................................... 6

1.2. Simpliciales ........................................................................................ 7

1.3. Complejos simpliciales ....................................................................... 10

1.3.1. Complejo simplicial ................................................................. 10

1.3.2. Complejo simplicial abstracto ................................................. 12

1.3.3. Realización geométrica ............................................................ 14

1.3.4. Lema del Nervio ...................................................................... 16

1.4. Construcción de complejos simpliciales ............................................. 18

1.4.1. Complejo de C̆ech ................................................................... 18

1.4.2. Complejo de Vietoris–Rips ...................................................... 19

2. Homología Simplicial.................................................................................... 22

2.1. Preliminares....................................................................................... 23

2.1.1. Espacios topológicos................................................................ 23

2.1.2. Homotopía............................................................................... 24

2.1.3. El Grupo Fundamental ........................................................... 25

iii
2.2. Complejos de Cadenas ....................................................................... 26

2.3. Ciclos y Fronteras .............................................................................. 29

2.4. Grupos de Homología ........................................................................ 31

3. Homología Persistente .................................................................................. 38

3.1. Filtraciones y Persistencia ................................................................. 39

3.2. Diagramas de persistencia ................................................................. 42

3.3. Espacio de Códigos de Barras............................................................ 44

3.4. Experimentación ................................................................................ 47

3.4.1. Homología del Toro ................................................................. 47

3.4.2. Cuarteto de Anscombe ............................................................ 52

3.4.3. Fisher’s Iris dataset ................................................................. 55

Conclusiones ...................................................................................................... 60

Anexos ............................................................................................................... 61

Anexo A. Código fuente de ejemplos ................................................................ 62

A.1. Homología del Toro ........................................................................... 62

A.2. Cuarteto de Anscombe ...................................................................... 63

A.3. Fisher’s Iris dataset ........................................................................... 63

Referencias......................................................................................................... 65

iv
Índice de figuras

Figura

1. Un espacio en diferentes coordenadas. ........................................................ 1

2. Un espacio con diferentes transformaciones. ............................................... 2

3. Un espacio y una representación combinatoria. .......................................... 2

4. Ejemplo de un espacio X y una muestra A de X. ...................................... 4

5. Una filtración de complejos de A y su respectivo código de barras. ........... 4

1.1. k-simpliciales básicos................................................................................... 8

1.2. Caras inmediatas de un 3-simplicial............................................................ 9

1.3. Ejemplo de un complejo simplicial (a) y un no complejo (b)...................... 11

1.4. Correspondencia entre simpliciales geométricos y simpliciales abstractos

en SK . ......................................................................................................... 13

1.5. Construcciones de nervio del espacio S1 como complejo simplicial. ............ 16

1.6. Ilustración del Lema del Nervio. ................................................................. 17

1.7. Complejo de C̆ech. ...................................................................................... 19

1.8. Complejo de Vietoris–Rips.......................................................................... 20

2.1. Tres espacios topológicamente diferentes. ................................................... 22

2.2. Frontera de un simplicial. ........................................................................... 28

2.3. La secuencia de complejos de cadena, ciclos y grupos de frontera conecta-

dos por homomorfismos. ............................................................................. 31

2.4. El espacio S1 y una representación como complejo simplicial. .................... 31

2.5. Un disco en R2 y una representación como complejo simplicial.................. 34

3.1. Un complejo filtrado y sus números de Betti asociados. ............................. 38

v
3.2. La clase γ nace en Ki y muere entrando en Kj . ......................................... 41

3.3. Un diagrama de persistencia con un solo par (ai , aj ).................................. 43

3.4. Una filtración y su respectivo código de barras. ......................................... 45

3.5. Una nube de puntos sobre la superficie del Toro. ....................................... 48

3.6. Código de barras correspondiente al grupo de homología H0 del Toro....... 49

3.7. Código de barras correspondiente al grupo de homología H1 del Toro....... 50

3.8. Código de barras correspondiente al grupo de homología H2 del Toro....... 51

3.9. Diagrama de persistencia de la nube de puntos. ......................................... 52

3.10. El Cuarteto de Anscombe ........................................................................... 53

3.11. Códigos de barras asociados al Cuarteto de Anscombe .............................. 54

3.12. Diagramas de persistencia asociados al Cuarteto de Anscombe ................. 55

3.13. Una flor de lirio........................................................................................... 56

3.14. Matriz de dispersión del dataset Iris........................................................... 56

3.15. Códigos de barras del dataset Iris............................................................... 58

3.16. Diagrama de persistencia del dataset Iris. .................................................. 59

vi
Índice de cuadros

Tabla

3.1. Medidas estadísticas para el Cuarteto de Anscombe. ................................. 53

vii
INTRODUCCIÓN

El Análisis Topológico de Datos (TDA1 , [32]) es un campo en desarrollo de la

matemática enfocada en desarrollar métodos para estudiar características cualitativas

de un conjuntos de datos; por ejemplo, ayuda a identificar: agrupamientos, ciclos, tallos,

estructura subyacente, etc. Esto nos permite describir características globales de un

espacio a partir de los datos locales; y la topología nos da una herramienta muy útil

para este propósito.

La Topología, de manera general, es una de las ramas de la matemática que estudia

las propiedades de las figuras geométricas. El enfoque del estudio de las figuras desde la

topología puede describirse en tres puntos:

Las propiedades de las figuras geométricas estudiadas por la topología son inde-

pendientes de la representación de la forma en cualquier sistema de coordenadas

(Figura 1).

Figura 1: Un espacio en diferentes coordenadas.

Las propiedades topológicas de la figura son invariantes por deformación, es decir,

no cambian si la figura es extendida o contraida (Figura 2).

1
Del inglés “Topological Data Analysis”.

1
Figura 2: Un espacio con diferentes transformaciones.

La topología permite construir representaciones compresas de las figuras, que

mantienen muchas características cualitativas (Figura 3).

6 2

5 3

Figura 3: Un espacio y una representación combinatoria.

La Topología Algebraica es una rama de las matemáticas que utiliza herramientas

del álgebra abstracta para estudiar espacios topológicos. La meta principal es encontrar

invariantes algebraicos para clasificar espacios topológicos.

En el Análisis Topológico de Datos, la premisa fundamental [14] es que los datos

tienen forma 2 , esta forma tiene significado, y este significado tiene un valor subyacente

dependendiendo del fenómeno que los datos representan. En matemáticas, la noción

de forma esta codificada por la noción de espacio métrico, un conjunto dotado de una

función de distancia que satisface tres simples axiomas. Esta noción abstracta nos
2
Utilizamos el término forma como característica de una figura geométrica.

2
permite no solo estudiar nociones ordinarias de las formas en dos y tres dimensiones,

sino tambien sus análogos en dimensiones mayores.

El enfoque utilizado en el Análisis Topológico de Datos muestra que la noción de

espacio métrico actúa como un principio de organización para un conjunto de datos

finitos, posiblemente muy grande dimensionalmente, y el método principal es el siguiente:

1. Reemplazar el conjunto de puntos de datos por una familia parametrizada de

complejos simpliciales [14, 32].

2. Analizar esta familia de complejos mediante herramientas de topología algebraica,

especificamente utilizando la teoría de homología simplicial y homología persistente

[20, 33].

3. Codificar la homología persistente de un conjunto de datos en una forma parame-

trizada de números de Betti, que es llamado diagrama de persistencia o código de

barras [22].

La homología es una poderosa herramienta que permite sacar conclusiones acerca

de las propiedades globales de los espacios y aplicaciones a partir de cálculos locales [4].

La homología persistente [19] es un método para calcular las características topológicas

de un espacio en diferentes resoluciones espaciales. Si las características detectadas so

persistentes a diferentes resoluciones es posible pensar que representen las características

verdaderas del espacio subyacente.

La homología persistente ha mostrado ser una herramienta muy útil en los siguientes

problemas: el problema de cobertura en redes de sensores [23, 27]; búsqueda óptima y

planificación de rutas en robótica [10, 9]; verificación experimental de sistemas caóticos

3
[23]; reconocimiento de patrones topológicos en nube de puntos de datos [13] y objectos

3D [28]; diversas aplicaciones en medicina y biología [29, 25, 6, 16].

X A

Figura 4: Ejemplo de un espacio X y una muestra A de X.

El presente trabajo aborda el siguiente problema: dado un conjunto finito A ⊂ Rn ,

llamado nube de puntos, muestra de un espacio topológico X ⊂ Rn , queremos estudiar

las características topológicas de X solo utilizando la información del conjunto A. Y,

a través de una exposición teórica y concisa, se formaliza el método de la homología

persistente para capturar las características topológicas a diferentes resoluciones del

conjunto A y poder resumirlas en un diagrama de persistencia y código de barras, como

se muestra en la Figura 5.

A1 A2 A3 A4 A5

⊂ ⊂ ⊂ ⊂

β0 =9,β1 =0 β0 =1,β1 =1 β0 =1,β1 =1 β0 =1,β1 =1 β0 =1,β1 =0

H0

H1
t0 t1 t2 t3 t4 t5

Figura 5: Una filtración de complejos de A y su respectivo código de barras.

4
A continuación describimos los capítulos que forman parte de este trabajo:

Capítulo 1. Se presentan los complejos simpliciales, que bajo ciertas condiciones

–Lema del Nervio– pueden representar un espacio topológico manteniendo sus caracterís-

ticas cualitativas. También se muestran algunas construcciones de complejos simpliciales

a partir de una nube de puntos. La bibliografía principal para este capítulo es [12], [2] y

[1].

Capítulo 2. Hacemos una introducción a la homología simplicial, una herramienta

de la topología algebraica que nos da información del número y clase de ciclos que

contiene un complejo simplicial. La bibliografía principal para este capítulo es [2], [4] y

[5].

Capítulo 3. Presentamos la homología persistente como método para extender

la homología simplicial a una secuencia de complejos encajonados y relacionamos sus

grupos de homología con el diagrama de persistencia. También damos algunos ejemplos

que ilustran su aplicación en el análisis de datos. La bibliografía principal para este

capítulo es [2], [14] y [13].

Conclusiones. Damos nuestras conclusiones principales de este trabajo como

también posibles direcciones para trabajos futuros.

Anexos. Se incluyen los programas elaborados en el lenguaje R, un entorno para

computación estadística3 , utilizados en los ejemplos del capítulo 3.

3
http://www.r-project.org

5
Capítulo 1

COMPLEJOS SIMPLICIALES

Una manera de representar un espacio topológico –finito– es utilizar una colección

de simpliciales que son pegados unos a otros de manera estructurada, tal colección

puede ser muy grande pero todos sus elementos son simples. Esto no es muy conveniente

para cálculos manuales pero cerca del ideal para implementaciones computacionales. En

este trabajo utilizamos los complejos simpliciales como la principal representación de la

topología de un espacio.

1.1. Preliminares

Un conjunto C ⊂ Rn se dice convexo si para todo par de puntos x, y ∈ C, el segmen-

to que los une { λx + (1 − λ)y : 0 ≤ λ ≤ 1 } está contenido en C. Sean x0 , . . . , xk ∈ Rn ,

decimos que y ∈ Rn es una combinación convexa de x0 , . . . , xk si existen λ0 , . . . , λk reales

no negativos tales que

k
X
z = λ0 x0 + λ1 x1 + · · · + λk xk , donde λi = 1.
i=0

La cápsula convexa de un conjunto X ⊂ Rn es el conjunto de todas las combina-

ciones convexas –finitas– de elementos de X. Además, la cápsula convexa de X es el

mínimo conjunto convexo que contiene a X.

Un conjunto de puntos { x0 , . . . , xk } ⊂ Rn se dice afínmente independientes si

6
CAPÍTULO 1. COMPLEJOS SIMPLICIALES

cada vez que se tiene una combinación lineal

k
X k
X
λi xi = 0, con λi = 0, λi ∈ R,
i=0 i=0

se verifica que λi = 0 para todo i = 0, 1, . . . , k. De lo contrario, decimos que los puntos

x0 , . . . , xk son afínmente dependientes.

Si los puntos x0 , . . . , xk son afínmente independientes, entonces todo elemento

de la cápsula convexa de { x0 , . . . , xk } se escribe de manera única como combinación

convexa de los xi .

Un espacio métrico un par (M, d) donde M es un conjunto y d es una función

de distancia d : M × M → R no negativa que satisface las siguientes propiedades para

cualesquiera x, y, z ∈ M :

(i) d(x, y) = 0 si y solamente si x = y,

(ii) d(x, y) = d(y, x),

(iii) d(x, y) ≤ d(x, z) + d(z, y).

1.2. Simpliciales

Un complejo es una colección de algunos elementos básicos que satisfacen ciertas

propiedades. En un complejo simplicial, estos objetos básicos son los simpliciales.

Definición 1.1 (simplicial). Un simplicial de dimensión k o k-simplicial σ es la cápsula

convexa de una colección de k + 1 puntos afínmente independientes en algún espacio

euclídeo Rn , con k ≤ n.

Si { x0 , . . . , xk } es un conjunto de k + 1 puntos afínmente independientes en

7
CAPÍTULO 1. COMPLEJOS SIMPLICIALES

0-simplicial 1-simplicial 2-simplicial 3-simplicial

Figura 1.1: k-simpliciales básicos.

Rn , llamaremos a su cápsula convexa el k-simplicial generado por { x0 , . . . , xk } y lo

notaremos por σ = hx0 , . . . , xk i. Los puntos x0 , . . . , xk se llaman vértices de σ.

Ejemplo 1.1. Un 0-simplicial hx0 i consiste en un único punto x0 . Un 1-simplicial

hx0 , x1 i es el segmento de Rn que une los puntos x0 y x1 . Un 2-simplicial hx0 , x1 , x2 i

consiste en el triángulo sólido de vértices x0 , x1 , x2 . Un 3-simplicial hx0 , x1 , x2 , x3 i es

el tetraedro sólido de vértices x0 , x1 , x2 , x3 . Y continuando así, de manera análoga, en

dimensiones mayores como se ilustra en la Figura 1.1.

Una consecuencia de la definición es que cualquier punto z ∈ σ = hx0 , . . . , xk i se

escribe como una combinación convexa z = λ0 x0 + · · · + λk xk donde los λi son únicos.

Llamamos a los λi las coordenadas baricéntricas de z en σ.

Proposición 1.2. Se cumple lo siguiente:

(i) Todo k-simplicial σ = hx0 , . . . , xk i es la unión de los segmentos que unen x0 con

todos los puntos del simplicial τ = hx1 , . . . , xk i.

(ii) Dado un simplicial σ, existe uno y sólo un conjunto afínmente independiente de

puntos que lo generan. Es decir, los vértices de un simplicial quedan unívocamente

determinados por el simplicial.

8
CAPÍTULO 1. COMPLEJOS SIMPLICIALES

Figura 1.2: Caras inmediatas de un 3-simplicial.

Demostración. Ambos incisos se demuestran utilizando la definición de cápsula convexa

y puntos afínmente independientes, respectivamente.

Dado un simplicial σ = hx0 , . . . , xk i, a todo subconjunto no vacío de σ se llama

una cara de σ. Las caras de σ distintas de σ mismo se llaman caras propias. Las caras

inmediatas de σ son las caras generadas por exactamente un vértice menos que σ, es

decir, k − 1.

Las caras de σ vienen dadas en todas las dimensiones, desde cero (vértices) hasta

k; se tiene que σ es una cara de sí mismo. De manera general, un k-simplicial tiene k + 1

caras inmediatas.

Ejemplo 1.2. Las caras inmediatas de un tetraedro solido (3-simplicial) son sus cuatro

caras triangulares (2-simpliciales) como se muestra en la Figura 1.2.

La unión de caras inmediatas de σ se llama borde o frontera de σ y se lo denota

σ̇. El interior de un simplicial es el conjunto de puntos que no están en el borde y se



lo denota σ. Notese que el borde de un simplicial son los puntos que tienen alguna

9
CAPÍTULO 1. COMPLEJOS SIMPLICIALES

coordenada baricéntrica nula, mientras el interior son los puntos que poseen todas sus

coordenadas baricéntricas no nulas.

1.3. Complejos simpliciales

Los poliedros son subconjuntos de Rn que pueden describirse y estudiarse en forma

combinatoria. Los complejos simpliciales son los objetos combinatorios que los describen,

que además son un tipo particular de espacios topológicos.

1.3.1. Complejo simplicial

Definición 1.3 (complejo simplicial). Un complejo simplicial –geométrico– K, es un

conjunto finito de simpliciales en un espacio euclídeo Rn que cumple las siguientes

propiedades:

(i) Si σ ∈ K y τ es una cara de σ, entonces τ ∈ K.

(ii) Si σ, τ ∈ K y σ ∩ τ 6= ∅, entonces σ ∩ τ es una cara de σ y τ .

Diremos que K es finito si consta de finitos simpliciales.

Remarca 1.4. En este trabajo trataremos exclusivamente con complejos simpliciales

finitos.

El siguiente resultado nos da una definición equivalente de un complejo simplicial

geométrico.

Proposición 1.5. Sea K un conjunto de simpliciales en Rn . Entonces K es un complejo

simplicial si y sólo si se cumplen las siguientes dos condiciones:

(i) Si σ ∈ K y τ es una cara de σ, entonces τ ∈ K.

◦ ◦
(ii) Para todo par σ, τ ∈ K, si σ 6= τ , entonces σ ∩ τ = ∅.

10
CAPÍTULO 1. COMPLEJOS SIMPLICIALES

(a) (b)

Figura 1.3: Ejemplo de un complejo simplicial (a) y un no complejo (b)

Definición 1.6 (espacio asociado). Dado un complejo simplicial –finito– K, se define

el espacio asociado a K, y se lo denota |K|, a la unión de los simpliciales que componen

a K. Es decir, |K| es un subconjunto de Rn .

Por el teorema anterior, se tiene que para todo elemento x ∈ |K|, existe un único

simplicial σ ∈ K tal que x ∈ σ. Por lo tanto, todo elemento de |K| se escribe en forma
Pk
única como combinación convexa x = i=0 ti xi tales que ti > 0 para todo i = 0, . . . , k y

{ x0 , . . . , xk } generan un simplicial en K.

Si L es una subcolección de simpliciales de un complejo simplicial K, tal que

L contiene todas las caras de sus elementos, entonces L es en sí mismo un complejo

simplicial. En este caso L se llama un subcomplejo de K.

Todo simplicial σ induce, junto con todas sus caras, un complejo simplicial que,

por abuso de notación, denotaremos también con σ. El conjunto de todas las caras

propias de un simplicial σ determina el complejo simplicial σ̇, el borde de σ.

11
CAPÍTULO 1. COMPLEJOS SIMPLICIALES

Notese que dos simpliciales de la misma dimensión son homeomorfos, mediante un

homeomorfismo que manda los vértices de uno en los vértices del otro y combinaciones

convexas en combinaciones convexas (que es llamado isomorfismo simplicial, para leer

más al respecto puede consultarse [12]).

Además, todo complejo simplicial K queda determinado, salvo un isomorfismo

simplicial, conociendo sus vértices y cuáles de estos vértices forman simpliciales entre sí.

Por esta razón, un complejo simplicial puede describirse y estudiarse completamente

en forma combinatoria. De ahí surge la definición de complejo simplicial abstracto que

damos a continuación.

1.3.2. Complejo simplicial abstracto

Definición 1.7 (complejo simplicial abstracto). Un complejo simplicial abstracto K es

un par (VK , SK ) donde VK es un conjunto finito de elementos, llamados vértices, y SK

es una colección de subconjuntos finitos no vacíos de VK , llamados símpliciales, con la

propiedad de que cada elemento de VK pertenece a algún elemento de SK y, si σ es un

elemento en SK , entonces todo subconjunto no vacío de σ también es un elemento de

SK .

De la definición se deduce que para todo vértice v ∈ VK , { v } ∈ SK . En particular,

el conjunto VK queda determinado por SK : son los elementos que forman los conjuntos

unitarios. Por estos motivos, identificaremos en general el complejo simplicial K con el

conjunto SK y los vértices con los simpliciales de un solo elemento.

Ejemplo 1.3. Para un complejo simplicial que representa un tetraedro sin el interior

12
CAPÍTULO 1. COMPLEJOS SIMPLICIALES

b b b

a a a c a c

{a} {a, b} {a, b, c} {a, b, c, d}

Figura 1.4: Correspondencia entre simpliciales geométricos y simpliciales abstractos en


SK .

con vértices a, b, c, d, el complejo simplicial abstracto es:

VK = { a, b, c, d }

SK = {{ a } , { b } , { c } , { d } ,

{ a, b } , { a, c } , { a, d } , { b, c } , { b, d } , { c, d } ,

{ a, b, c } , { a, b, d } , { a, c, d } , { b, c, d }}

La dimensión de un simplicial abstracto σ, al igual que un simplicial geométrico,

es uno menos que la cantidad de vértices que lo conforman. Esto es, si σ = { v0 , . . . , vn }

tiene n + 1 elementos, entonces dim σ = n, en cuyo caso diremos que σ es un n-simplicial

(y a veces escribiremos σ n cuando queramos recalcar este hecho). Notar que, en particular,

los 0-simpliciales se corresponden con los vértices.

Si σ, τ son dos simpliciales de un complejo simplicial abstracto K tales que σ ⊆ τ

entonces decimos que es cara de τ . Si además σ 6= τ , decimos que σ es cara propia de τ

y si dim σ = dim τ − 1, decimos que σ es cara inmediata de τ .

13
CAPÍTULO 1. COMPLEJOS SIMPLICIALES

1.3.3. Realización geométrica

A continuación relacionaremos las dos nociones de complejos simpliciales: la

primera que fue hecha más geométrica y la segunda versión, más abstracta. Veremos que

esencialmente son el misma objeto y a partir de ahí trabajaremos con los dos conceptos

indistintamente.

Un conjunto X ⊂ Rn se dice que está en posición general si cada subconjunto de

X de a lo sumo n + 1 puntos es afínmente independiente. Es decir, X están en posición

general si ninguna colección de r + 2 puntos de X está contenida en una variedad lineal

de dimensión r, para cada r = 1, 2, . . . , n − 1.

Ejemplo 1.4. El conjunto { (t, t2 , . . . , tn ) ∈ Rn : t ∈ R } está en posición general. En

particular, el gráfico de la función f : R → R dada por f (x) = x2 es un conjunto en

posición general en R2 (notar que no existen tres puntos contenidos en una recta).

Ahora bien, sabemos que los simpliciales quedan determinados por sus vértices

y viceversa. Por lo tanto un simplicial geométrico se corresponde con el conjunto de

sus vértices y, por lo tanto, se puede ver como un simplicial abstracto. Recíprocamente,

dado un simplicial abstracto, puede asociársele un simplicial geométrico en algún espacio

euclídeo, eligiendo puntos afínmente independientes y tomando su cápsula convexa. Por

supuesto que esta elección no es única, pero es única salvo un isomorfismo simplicial.

Más en general, si K es un complejo simplicial geométrico inserto en algún Rm ,

determina un complejo simplicial abstracto tomando los vértices de K como conjunto de

vértices del complejo abstracto. Recíprocamente,si K es complejo simplicial abstracto

–y finito– determina un complejo simplicial geométrico de la siguiente manera:

14
CAPÍTULO 1. COMPLEJOS SIMPLICIALES

Si n es la dimensión de K, elegimos un conjunto de puntos (uno por cada

vértice de K) en posición general en Rm , con m ≥ 2n + 1, y definimos

por cada simplicial abstracto de K el simplicial geométrico que se botiene

tomando la cápsula convexa de los puntos correspondientes del simplicial.

Este complejo geométrico (inserto en Rm ) se llama la realización geométrica de K.

De hecho, también denominamos realización geométrica de K al espacio asociado (visto

como subespacio métrico de Rm ) y lo seguimos denotando |K|.

Es importante remarcar la diferencia entre K y |K|. El primero es un complejo

simplicial (abstracto o geométrico), es decir una colección de simpliciales. El segundo es

la unión de esos simpliciales (visto como subespacio de Rm ). Al complejo simplicial K

se lo llama una triangulación de |K|.

Dos complejos simpliciales muy distintos K y L pueden dar lugar a la misma

realización como espacio, es decir |K| = |L|. Para más detalles sobre su estudio se puede

consultar [12, Sección 1.2].

Por estas construcciones, se identifican ambas definiciones de complejos simpliciales

como equivalentes y se trabaja con una u otra indistintamente.

Teorema 1.8. Un complejo simplicial (abstracto) K de dimensión n tiene una realiza-

ción geométrica en R2n+1 .

Además, |K| resulta compacto y, por lo tanto, cerrado en Rm dado que solamente

estamos considerando complejos simpliciales finitos. Más aún, si L es una cara de K

entonces |L| ⊆ |K| es cerrado.

15
CAPÍTULO 1. COMPLEJOS SIMPLICIALES

U U U
U
Nervio Nervio
U∩V V
V

W U U∩W W
U Nervio
V∩W
U∩V

V V

Figura 1.5: Construcciones de nervio del espacio S1 como complejo simplicial.

1.3.4. Lema del Nervio

Definición 1.9 (nervio). Sea F una colección finita de conjuntos. El nervio consiste en

todas las subcolecciones cuya intersección de conjuntos es no vacía,

n \ o
Nrv F = G ⊆ F : G 6= ∅ .

G 6= ∅ y H ⊆ G implica
T
El nervio es un complejo simplicial abstracto dado que

H 6= ∅. Podemos construir su realización geométrica en un espacio euclídeo, por lo


T

tanto tiene sentido hablar acerca de la topología o tipo de homotopía del nervio.

Su principal utilidad en nuestro estudio del nervio es la siguiente: Supongamos que

queremos representar algún espacio topológico X de manera combinatoria. Cubrimos X

por alguna colección de conjuntos F y luego construimos su nervio. Esperamos que el

16
CAPÍTULO 1. COMPLEJOS SIMPLICIALES

'

Figura 1.6: Ilustración del Lema del Nervio.

nervio represente fielmente el espacio original, y bajo ciertas condiciones esto se puede

garantizar. Recordemos que un espacio es contraíble si es homotopicamente equivalente

a un punto.

Teorema 1.10 (Lema del Nervio). Sea F una colección finita de conjuntos cerrados tal

que cada intersección entre sus elementos es vacía o contraíble. Entonces Nrv(F ) tiene
S
el mismo tipo de homotopía que F.

Demostración. Una demostración de este teorema puede verse en [3, Corolario 4G.3].

Remarca 1.11. Si F consiste en conjuntos convexos en un espacio Euclíeo, entonces la

hipótesis del Lema del Nervio se satisface.

La Figura 1.5 ilustra diferentes construcciones del nervio de S1 donde solo una de

ellas conserva el tipo de homotopía. La Figura 1.6 ilustra el Lema del Nervio aplicado a

un espacio arbitrario.

17
CAPÍTULO 1. COMPLEJOS SIMPLICIALES

1.4. Construcción de complejos simpliciales

En esta sección mostramos la construcción de algunos complejos simpliciales, a

partir de un conjunto finito de puntos, que son relevantes a nuestro estudio. En esta

sección consideramos un espacio métrico (M, d) y un subconjunto finito S ⊂ M , para

facilitar la visualización podemos suponer un espacio Euclideano.

Existen diversas construcciones de complejos con diferentes propiedades y han sido

creadas para ciertos tipos de aplicaciones específicas, para leer más al respecto puede

consultarse [2].

1.4.1. Complejo de C̆ech

El complejo de C̆ech es un complejo simplicial r-parametrizado, definido como el

nervio de la familia de r-bolas abiertas centradas en los puntos del conjunto.

Definición 1.12 (Complejo de C̆ech). Dado una colección de puntos S = { x0 , . . . , xk } ⊂

M , definimos el complejo de C̆ech de S de radio r como

( )
\
C̆echS (r) = σ⊆S: Bx (r) 6= ∅
x∈σ

donde Bx (r) es la bola abierta de radio r centrada en x.

Remarca 1.13. Dado que las bolas Bx (r) son todas convexas, satisface las condiciones

del Lema del Nervio, y por lo tanto C̆echS (r) tiene el mismo tipo de homotopía que la

unión de las r-bolas centradas en los puntos de S.

Dado dos radios r < r0 , se ve claramente la inclusión C̆echS (r) ⊆ C̆echS (r0 ). Por

lo tanto, si tomamos r de 0 a ∞, obtenemos una familia encajonada de complejos

18
CAPÍTULO 1. COMPLEJOS SIMPLICIALES

Figura 1.7: Complejo de C̆ech.

simpliciales, empezando por el conjunto de k + 1 vértices y terminando en el k + 1-

simplicial de todos los puntos de S.

Además, un conjunto de vértices σ ⊆ S forma un simplicial en C̆echS (r) si y solo

si el conjunto esta contenido en una bola de radio r.

Cabe recalcar que el complejo de C̆ech es muy grande en tamaño y dimensión

cuando r  0, lo cual es una desventaja computacionalmente. Pero se puede construir

complejos más pequeños que conserven el tipo de homotopía, para leer más al respecto

puede consultarse [2].

1.4.2. Complejo de Vietoris–Rips

El complejo de Vietoris–Rips de radio r de un conjunto S consiste en todos los

subconjuntos de S con diámetro no mayor a 2r.

19
CAPÍTULO 1. COMPLEJOS SIMPLICIALES

Figura 1.8: Complejo de Vietoris–Rips.

Definición 1.14 (Complejo de Vietoris–Rips). Dado un conjunto finito S y un número

fijo r ≥ 0, definimos el complejo de Vietoris–Rips de S y radio r como:

Vietoris–RipsS (r) = { σ ⊆ S : Bx (r) ∩ By (r) 6= ∅ para todo x, y ∈ σ }

Teorema 1.15 (Lema de Vietoris–Rips). Sea S un conjunto finito de puntos y r ≥ 0,

entonces


C̆echS (r) ⊆ Vietoris–RipsS (r) ⊆ C̆echS ( 2r).

Demostración. Consecuencia de la definición, puede consultarse [2, pág. 74].

Remarca 1.16. El Complejo de C̆ech satisface el Lema del Nervio mientras que el

20
CAPÍTULO 1. COMPLEJOS SIMPLICIALES

Complejo de Vietoris–Rips no.

Este complejo ha demostrado ser muy útil en diveras aplicaciones, específicamente

para modelar la topología de una red ad-hoc de comunicaciones inalámbricas, para más

detalles puede consultarse [26]. Para el estudio de otros complejos, como el de Delaunay,

Alpha o Witness, puede consultarse [2].

21
Capítulo 2

HOMOLOGÍA SIMPLICIAL

Consideremos tres espacios topológicos: un círculo, dos círculos uno al lado de otro

pero sin ningún contacto, y un círculo arriba de otro formando un ocho, como se muestra

en la Figura 2.1. Estos espacios pueden distinguirse comparando sus componentes

conexas (uno en el primer y tercer caso, dos en el segundo) y su número de agujeros

(uno en el primer caso, dos en el segundo y tercer caso). Los grupos de homología nos

permiten calcular y describir estas nociones intuitivas de manera matemática.

Figura 2.1: Tres espacios topológicamente diferentes.

Todo espacio topológico X tiene para cada entero k ≥ 0 un grupo de homología

asociado con él, y su rango es igual al número de agujeros k-dimensionales en X,

denotado por βk y llamado k-ésimo número de Betti,. En particular, β0 es el número

de componentes conectados, β1 el número de agujeros 1-dimensionales (círculos), β2 el

número de agujeros 2-dimensionales (esferas), y así sucesivamente.

La Homología es un formalismo matemático para hablar de manera cuantitativa y

22
CAPÍTULO 2. HOMOLOGÍA SIMPLICIAL

sin ambigüedad sobre como un espacio esta conectado. Es un invariante topológico muy

popular en topología computacional dado que es fácilmente computable. Los grupos de

homología se pueden ver como una algebraización de la primera capa de la geometría

de los complejos de celda 4 : como las celdas de n dimensiones se juntan con celdas de

dimensión n − 1 [Hatcher, 2002]. Nosotros definiremos la homología para complejos

simpliciales, pero la teoría puede extenderse a espacios topológicos arbitrarios.

2.1. Preliminares

2.1.1. Espacios topológicos

Los espacios métricos estan dotados de una métrica que define conjuntos abiertos,

vecindades, y continuidad. Sin una métrica, debemos prescribir una estructura suficiente

para extender estos conceptos. Intuitivamente, un espacio topológico es un conjunto de

puntos, donde cada uno conoce a sus vecinos.

Una topología sobre un conjunto X es un subconjunto T ⊆ 2X tal que satisface las

siguientes condiciones:

(i) ∅, X ∈ T .

(ii) Si S1 , S2 ∈ T , entonces S1 ∩ S2 ∈ T .

(iii) Si { Sj }j∈J es una familia de subconjuntos de T , entonces Sj ∈ T .


S
j∈J

Un conjunto S ∈ T se llama conjunto abierto y su complemento en X se llama

conjunto cerrado. El par X = (X, T ) se llama un espacio topológico. Un conjunto de

puntos puede ser dotado de diferentes topologías, pero vamos a abusar de la notación

escribiendo p ∈ X en lugar de p ∈ X.
4
También llamado Complejo Celular o CW-Complejo, del inglés Closure finite–Weak topology.

23
CAPÍTULO 2. HOMOLOGÍA SIMPLICIAL

Una función f : X → Y es continua si para cada abierto A en Y, f −1 (A) es un

abierto en X. Llamaremos una aplicación a una función continua. La cerradura A de A



es la intersección de todos los conjuntos cerrados que contienen a A. El interior A de A

es la unión de todos los abiertos contenidos en A. La frontera ∂A de A es ∂A = A − A.

Una vecindad de x ∈ X es cualquier conjunto S ∈ T tal que x ∈ S. Un subconjunto

A ⊆ X con la topología inducidad TA = { S ∩ A : S ∈ T } es un subespacio de X. Un

homeomorfismo f : X → Y es una función biyectiva tal que f y f −1 son continuas, en

tal caso, decimos que X es homeomorfo a Y, además decimos que X y Y tienen el mismo

tipo topológico y lo denotamos por X ≈ Y.

2.1.2. Homotopía

Una homotopía es una familia de aplicaciones ft : X → Y, para t ∈ [0, 1], tal que la

aplicación asociada F : X × [0, 1] → Y dada por F (x, t) = ft (x) es continua. Entonces,

f0 , f1 : X → Y se dicen homotópicos por la homotopía ft , denotado por f0 ' f1 . Una

aplicación f : X → Y es una equivalencia de homotopía si existe una aplicación g : Y → X,

tal que f ◦ g ' 1Y y g ◦ f ' 1X , donde 1X , 1Y son las aplicaciones identidad en los

espacios respectivos. Entonces, X y Y son homotopicamente equivalentes y tienen el

mismo tipo de homotopía, denotado por X ' Y.

La diferencia que dos espacios sean homeomorfos y que sean homotopicamente

equivalentes es que en la composición de las funciones f y g: En el primero deben ser

equivalentes a la aplicación identidad; en el último, solo tienen que ser homotópicos a la

aplicación identidad. Un espacio con el tipo de homotopía de un punto se dice contraíble

o homotopicamente nulo. La homotopía es un invariante topológico dado que X ≈ Y

24
CAPÍTULO 2. HOMOLOGÍA SIMPLICIAL

implica X ' Y.

Una deformación de retracción de un espacio X sobre un subespacio A es una

familia de aplicaciones ft : X → X, con t ∈ [0, 1], tal que f0 es la aplicación identidad,

f1 (X) = A y la restricción de ft a A, ft |A , es la aplicación identidad para todo t. La

familia ft debe ser continua en el sentido descrito anteriormente. Notese que f1 y la

inclusión ı : A → X da una equivalencia de homotopía entre X y A. Por ejemplo, un

cilindro no es homeomorfo a un círculo, pero si equivalente homotopicamente, dado que

podemos reducir el cilindro a un círculo por una deformación de retracción.

2.1.3. El Grupo Fundamental

La Topología Algebraica nos da invariantes que asocian estructuras algebracias

con espacios topológicos. El principal mecanismo es mediante functores 5 , que no solo

proveen imágenes algebraicas de espacios topológicos, sino tambien proveen imágenes de

aplicaciones entre espacios. Uno de los principales functores en Topología Algebraica es

el que asigna a un espacio su grupo fundamental, para más detalles puede consultarse

[3].

El Grupo Fundamental captura la estructura de ciclos homotópicos dentro un

espacio. Un camino en X es una aplicación continua f : [0, 1] → X. Un ciclo es un camino

f con f (0) = f (1), es decir, el ciclo comienza y termina en el mismo punto base. El

ciclo trivial nunca deja el punto base. La clase de equivalencia de un camino f bajo la

relación de equivalencia de homotopía se denota por [f ]. Un ciclo que es frontera de un

disco es fronterizo y dado que es contraíble, pertenece a la clase de equivalencia del ciclo

5
Funciones de un categoría en otra que lleva objetos a objetos y morfismos a morfismos de manera
que la composición de morfismos y las identidades se preservan.

25
CAPÍTULO 2. HOMOLOGÍA SIMPLICIAL

trivial. Caso contrario, el ciclo se dice no-fronterizo y pertenece a una clase diferente.

Dados dos caminos f, g : [0, 1] → X con f (1) = g(0), el camino producto f · g es

el camino que empieza en f y luego pasa por g. El grupo fundamental π1 (X, x0 ) de X

en un punto base x0 contiene las clases de homotopía de los ciclos en X con base en

x0 como sus elementos, a la clase de equivalencia del ciclo trivial como su elemento

identidad, a [f ][g] = [f · g] como su operación binaria. Para un espacio X conectado por

caminos, el punto base es irrelevante, asi que escribimos los grupos como π1 (X).

Claramente, cualquier ciclo en S2 es fronterizo, por lo tanto π1 (S2 ) ∼


= { 0 }, donde


= denota un isomorfismo de grupos y { 0 } es el grupo trivial. Para cualquier n ∈ Z,

podemos dar n vueltas al círculo, en sentido horario para enteros positivos y en sentido

contrahorario para enteros negativos. Entonces, intuitivamente tenemos π1 (S1 ) ∼


= Z. De

manera similar, tenemos dos ciclos no fronterizos que generan el grupo fundamental del

Toro, π1 (toro) ∼
= Z × Z, donde la superficie del toro es un grupo abeliano.

El grupo fundamental es el primero en una serie de grupos de homotopía πn (X)

que extienden la noción de ciclos a n-dimensionales ciclos. Estos grupos invariantes

son muy complicados y no son computables a partir de un complejo. Más aún, para

un espacio n-dimensional, solo un número finito de grupos de homotopía podrían ser

triviales, lo que nos da una descripción infinita pero no tratable computacionalmente.

Por otro lado, los grupos de homología son mucho más fáciles de computar.

2.2. Complejos de Cadenas

Dado un complejo simplicial { v0 , v1 , . . . , vn }, definimos un complejo simplicial

ordenado como una ordenación de los vértices y denotado por [v0 , v1 , . . . , vn ]. Sea π una

26
CAPÍTULO 2. HOMOLOGÍA SIMPLICIAL

(n + 1)-permutación, dos simpliciales [v0 , v1 , . . . , vn ] y [vπ(0) , vπ(1) , . . . , vπ(n) ] se dicen que

tienen la misma orientación si sign π = 1; si sign π = −1, entonces estos simpliciales

tienen orientaciones opuestas.

Definición 2.1 (p-cadena). Sea K un complejo simplicial y p una dimensión. Una

p-cadena es la suma formal6 de p-simpliciales en K. La notación estándar es c =


P
ai σ i ,

donde los σi son p-simpliciales y los ai son los coeficientes.

Remarca 2.2. Los coeficientes pueden ser en cualquier cuerpo, pero en nuestro caso

trataremos con coeficientes en Z que simplifica los resultados pero sin restringirnos

demasiado como el caso de Z2 . Para un estudio más profundo puede consultarse [3] o [5].

Dos p-cadenas pueden ser adicionadas componente por componente, como polino-

ai σ i y c 0 = bi σi entonces c + c0 =
P P P
mios. Especificamente si c = (ai + bi )σi .

Proposición 2.3. El conjunto de p-cadenas de un complejo K, con la operación de

adición definida anteriormente, forma un grupo abeliano. A este grupo le llamamos

grupo de p-cadenas denotado por (Cp , +), o simplemente Cp = Cp (K).

Remarca 2.4. Notese que Cp es un grupo abeliano libre, con base formada por los

p-simpliciales de K.

Entonces, para cada entero p tenemos un grupo de p-cadenas; para p menor a

cero y mayor a la dimensión del simplicial K, el grupo de p-cadenas es el grupo trivial.

La frontera –también llamado borde– de los p-simpliciales nos permite relacionar estos

grupos de p-cadenas.

Recordemos que la frontera de un p-simplicial σ es la suma de sus caras (p − 1)-

dimensionales, y la denotamos por ∂p σ.

6
Una suma formal es una combinación lineal de elementos en un grupo abeliano libre.

27
CAPÍTULO 2. HOMOLOGÍA SIMPLICIAL

Proposición 2.5. Denotando σ = [v0 , v1 , . . . , vp ] al simplicial generado por los vértices

vi , su frontera es
p
(−1)j [v0 , . . . , v̂j , . . . , vp ],
X
∂p σ =
j=0

donde el sombrero ˆ indica que vj es omitido.

Ejemplo 2.1. Si consideramos el simplicial [v0 , v1 , v2 ], entonces

∂2 [v0 , v1 , v2 ] = [v1 , v2 ] − [v0 , v2 ] + [v0 , v1 ].

como se ilustra en la Figura 2.2.

v1 v1
∂2

v0 v2 v0 v2

Figura 2.2: Frontera de un simplicial.

P
Definición 2.6 (frontera de una cadena). Dada una p-cadena, c = ai σi , definimos su

frontera como la suma de las fronteras de sus simpliciales,

X
∂p c = ai ∂p σi .

Corolario 2.7. Dada una p-cadena c, la aplicación c 7→ ∂p c es un homomorfismo.

El anterior corolario nos permite definir la aplicación frontera ∂p : Cp → Cp−1 que

transforma un p-cadena a una (p − 1)-cadena.

28
CAPÍTULO 2. HOMOLOGÍA SIMPLICIAL

Definición 2.8 (homomorfismo de frontera). Llamaremos a la aplicación ∂p como el

homomorfismo de frontera o aplicación frontera para cadenas.

Observemos que para cada dimensión p, existe un homomorfismo ∂p de Cp a Cp−1 ,

lo que nos permite construir la siguiente definición.

Definición 2.9 (complejo de cadenas). El complejo de cadenas es una secuencia de

grupos de cadena conectados por homomorfismos de frontera,

∂p+2 ∂p+1 ∂p ∂p−1


· · · −→ Cp+1 −→ Cp −→ Cp−1 −→ · · ·

Ignoraremos el índice del homomorfismo de frontera dado que esta implícito por

la dimensión de la cadena a la que se aplica.

2.3. Ciclos y Fronteras

Distinguiremos dos tipos particulares de cadenas y los usaremos para definir los

grupos de homología. Denotamos por K a un complejo simplicial cualquiera.

Definición 2.10 (p-ciclo). Un p-ciclo c es una p-cadena con frontera vacía, es decir,

∂c = 0. Y denotamos por Zp = Zp (K) al conjunto de p-ciclos de K.

Proposición 2.11. El conjunto Zp es un grupo y lo llamamos el grupo de p-ciclos.

Es decir, el grupo de p-ciclos es el núcleo de el p-ésima homomorfismo de frontera,

Zp = ker ∂p . Por ejemplo, para p = 0, la frontera de cada vértice es nula (C−1 = { 0 }),

por lo tanto, Z0 = ker ∂0 = C0 . Aunque, usualmente para p > 0 el grupo Zp no es todo

Cp .

Definición 2.12 (p-frontera). Una p-frontera c es una p-cadena que es una frontera

29
CAPÍTULO 2. HOMOLOGÍA SIMPLICIAL

de una (p + 1)-cadena, es decir, c = ∂d con d ∈ Cp+1 . Denotamos por Bp = Bp (K) al

conjunto de p-fronteras de K.

Proposición 2.13. El conjunto Bp en un grupo y lo llamamos grupo de p-fronteras.

Es decir, el grupo de p-fronteras es la imágen de el (p + 1)-ésimo homomorfismo de

frontera, Bp = Im ∂p+1 . Por ejemplo, para p = 0, cada 1-cadena consiste en un número

de aristas con dos extremos cada una. Tomando la frontera se cancelan por extremos

duplicados en pares, dejando un número par de vértices distintos.

Ahora, supongamos que el complejo esta conectado. Entonces para cualquier

número par de vértices, podemos encontrar caminos que en pares y podemos añadir

los caminos para obtener una 1-cadena con frontera dada por los vértices. Si K es

conectado implica que exactamente la mitad de los 0-ciclos son 0-fronteras. La propiedad

fundamental que hace funcionar a la homología es que la frontera de la frontera es

necesariamente 0.

Teorema 2.14 (Lema fundamental de la Homología). Para cada entero p y (p + 1)-

cadena d se tiene, ∂p ∂p+1 d = 0.

Demostración. Suficiente mostrar que ∂p ∂p+1 τ = 0 para un (p + 1)-simplicial τ . La

frontera ∂p+1 τ consiste en todas las p-caras de τ . Cada (p − 1)-cara de τ pertenece

exactamente a dos p-caras, entonces ∂p (∂p+1 τ ) = 0.

Corolario 2.15. Cada p-frontera es un p-ciclo, o equivalentemente, el grupo Bp es un

subgrupo de Zp .

30
CAPÍTULO 2. HOMOLOGÍA SIMPLICIAL

Figura 2.3: La secuencia de complejos de cadena, ciclos y grupos de frontera conectados


por homomorfismos.

2.4. Grupos de Homología

Dado que las fronteras forman subgrupos de los grupos de ciclos, podemos construir

el cociente particionando cada grupo de ciclos en clases de ciclos que difieren de otros

por sus fronteras. Esto nos lleva a la noción de grupos de homología y sus rangos, que

definiremos a continuación.

Definición 2.16 (grupo de homología). El p-ésimo grupo de homología Hp es el p-ésimo

grupo de ciclos módulo el p-ésimo grupo de fronteras, es decir, Hp = Zp /Bp . Y el p-ésimo

número de Betti es el rango del p-ésimo grupo de homología, es decir, βp = rango Hp .

Ejemplo 2.2. El espacio S1 (círculo) es homeomorfo al esqueleto de un triángulo de vér-

tices { v0 , v1 , v2 }, representado por el complejo de simpliciales { [v0 , v1 ], [v0 , v2 ], [v2 , v0 ] }

v2

v0 v1

Figura 2.4: El espacio S1 y una representación como complejo simplicial.

31
CAPÍTULO 2. HOMOLOGÍA SIMPLICIAL

Tenemos el siguiente complejo de cadenas

2 ∂ 1 0∂ ∂
C2 −→ C1 −→ C0 −→ {0}

donde

C2 = { 0 }

C1 = h[v0 , v1 ], [v1 , v2 ], [v2 , v0 ]i

C0 = hv0 , v1 , v2 i

Luego, queremos calcular H0 = Z0 /B0 donde

Z0 = Ker ∂0 = C0 = hv0 , v1 , v2 i

B0 = Im ∂1 = ∂1 (C1 ) = hv1 − v0 , v2 − v1 , v0 − v2 i

Notese que Z0 ≈ Z ⊕ Z ⊕ Z, por otro lado B0 ≈ Z ⊕ Z, dado que v0 − v2 = −(v1 − v0 ) −

(v2 − v1 ). Por lo tanto

H0 = Z0 /B0 ≈ Z ⊕ Z ⊕ Z/Z ⊕ Z = Z.

32
CAPÍTULO 2. HOMOLOGÍA SIMPLICIAL

Ahora calculamos H1 = Z1 /B1 , donde

Z1 = Ker ∂1 = { c ∈ C1 : ∂1 (c) = 0 }

B1 = Im ∂2 = { 0 }

Entonces, c ∈ Z1 si solo si

λ1 (v1 − v0 ) + λ2 (v2 − v1 ) + λ3 (v0 − v2 ) = 0

(−λ1 + λ3 )v0 + (λ1 − λ2 )v1 + (λ2 − λ3 )v2 = 0

de donde λ1 = λ2 = λ3 . Luego Z1 ≈ Z. Por lo tanto H1 ≈ Z.

Concluimos que

H0 ≈ Z, H1 ≈ Z, Hp = { 0 } , p > 1.

O equivalentemente

β0 = 1, β1 = 1, βp = 0, p > 1.

Ejemplo 2.3. El disco en R2 es homeomorfo al 2-simplicial [v0 , v1 , v2 ], entonces tenemos

el complejo de cadenas


3 2 ∂ 1 0 ∂ ∂
{ 0 } −→ C2 −→ C1 −→ C0 −→ {0}

33
CAPÍTULO 2. HOMOLOGÍA SIMPLICIAL

donde

C2 = h[v0 , v1 , v2 ]i

C1 = h[v0 , v1 ], [v1 , v2 ], [v2 , v0 ]i

C0 = hv0 , v1 , v2 i

v2

v0 v1

Figura 2.5: Un disco en R2 y una representación como complejo simplicial.

Luego, del anterior ejemplo tenemos que H0 ≈ Z. Dado que Im ∂2 ≈ Z, entonces

H1 = { 0 }. Finalmente, H2 = { 0 } por que Ker ∂2 = { 0 }.

Por lo tanto

β0 = 1, β1 = 0, β2 = 0.

Ejemplo 2.4. La esfera S2 se puede representar como un tetraedro de vértices { v0 , v1 , v2 , v3 }

sin el interior, es decir, un complejo abstracto (ordenado) dado por { [v0 , v1 , v2 ], [v1 , v3 , v2 ], [v0 , v2 , v3 ], [v0 ,

Con el complejo de cadenas correspondiente

3∂ 2 ∂1 0 ∂ ∂
{ 0 } −→ C2 −→ C1 −→ C0 −→ {0}

34
CAPÍTULO 2. HOMOLOGÍA SIMPLICIAL

donde

C2 = h[v0 , v1 , v2 ], [v1 , v3 , v2 ], [v0 , v2 , v3 ], [v0 , v3 , v1 ]i

C1 = h[v0 , v1 ], [v1 , v2 ], [v2 , v0 ], [v1 , v3 ], [v3 , v2 ], [v3 , v0 ]i

C0 = hv0 , v1 , v2 , v3 i

Luego

H3 = { 0 }

H2 = Ker ∂2 / Im ∂3 = Ker ∂2

H1 = Ker ∂1 / Im ∂2

H0 = C0 / Im ∂1

Suficiente estudiar ∂2 y ∂1 . Observemos que

∂[v0 , v1 , v2 ] = [v1 , v2 ] − [v0 , v2 ] + [v0 , v1 ]

∂[v1 , v3 , v2 ] = [v3 , v2 ] − [v1 , v2 ] + [v1 , v3 ]

∂[v0 , v2 , v3 ] = [v2 , v3 ] − [v0 , v3 ] + [v0 , v2 ]

∂[v0 , v3 , v1 ] = [v3 , v1 ] − [v0 , v1 ] + [v0 , v3 ]

35
CAPÍTULO 2. HOMOLOGÍA SIMPLICIAL

de donde obtenemos una matriz asociada a ∂2

 

 1 1 1 0 0 0

 
 
0 −1 0 1 1 0
 
 
A2 = 



 

 0 0 −1 0 −1 1 

 
 
 
−1 0 0 −1 0 −1

De la misma manera, obtenemos una matriz asociada a ∂1

 
−1 1 0 0
 
 
 
 0 −1 1 0
 
 
 
 
 1 0 −1 0
 
A1 =
 
 
 
 0

−1 0 1
 
 
 
 0
 0 1 −1

 
 
 
1 0 0 −1

Luego, haciendo cálculos y utilizando el teorema de dimensión del algebra lineal,

obtenemos que

dim Ker ∂2 = 1 dim Im ∂2 = 3

dim Ker ∂1 = 3 dim Im ∂1 = 3

36
CAPÍTULO 2. HOMOLOGÍA SIMPLICIAL

Entonces

H2 ≈ Z

H1 ≈ Z3 /Z3 = { 0 }

H0 ≈ Z4 /Z3 = Z

Por lo tanto

β0 = 1, β1 = 0, β2 = 1.

Observemos que el problema de calcular la dimensión de los grupos de homología

se ha reducido a calcular el rango de las matrices asociadas a las aplicaciones frontera, el

cual puede realizarse mediante el algoritmo de eliminación de Gauss. Para más detalles

sobre el cómputo de los grupos de homología puede consultarse [2] y [4].

37
Capítulo 3

HOMOLOGÍA PERSISTENTE

Dado una muestra de datos: ¿Cómo determinamos las propiedades homológicas

del espacio subyacente? La homología persistente nos da una respuesta: conectamos

gradualmente los puntos en el conjunto de datos y calculamos los grupos de homlogía

de toda la estructura despues de cada adición. La evolución en el tiempo de los agujeros

k-dimensionales de esta estructura creciente es capturada por los llamados intervalos

de Betti. Nos interesa los intervalos que persisten por largo tiempo, puesto que ellos

tienden a reflejar las verdaderas propiedades homológicas del objeto subyacente.

Sobre cuerpos, cada espacio Xj tiene un k-ésimo grupo de homología Hk (Xj ), un

espacio vectorial cuya dimensión βk (Xj ) contabiliza el número de atributos topológicos

en dimensión k. Viendo una filtración como un espacio en crecimiento, vemos que los

atributos topológicos aparecen y desparecen.

A1 A2 A3 A4 A5

⊂ ⊂ ⊂ ⊂

β0 =9,β1 =0 β0 =1,β1 =1 β0 =1,β1 =1 β0 =1,β1 =1 β0 =1,β1 =0

H0
Figura 3.1: Un complejo filtrado y sus números de Betti asociados.
H1
t0 t1 t2 t3 t4 t5

Por ejemplo, el complejo filtrado en la Figura 3.1 desarrolla un 1-ciclo en tiempo 2

que sigue presente hasta el tiempo 4. Si podemos identificar un atributo a través de la

filtración, podemos hablar sobre su tiempo de vida en la historia de crecimiento. Esta

es la intuición detrás de la teoría de homología persistente. Inicialmente, Edelsbrunner

38
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

et al [20] ha desarrollado el concepto para subcomplejos en S3 y coeficientes en Z2 . El

desarrollo teórico posterior ha extendido este concepto a espacios arbitrarios y coeficientes

en cuerpos [33].

3.1. Filtraciones y Persistencia

Consideramos un complejo simplicial K, y una función f : K → R. Requerimos

que f sea monótona, es decir, para σ, τ ∈ K, tenemos f (σ) ≤ f (τ ) siempre que σ sea

cara de τ .

La monotonocidad de f implica que el conjunto de nivel, K(a) = f −1 (−∞, a], es

un subcomplejo de K para cada a ∈ R. Sea m el número de simpliciales en K y n un

número de valores de f , entonces obtenemos n + 1 ≤ m + 1 diferentes subcomplejos que

los ordenamos de manera creciente que nos permite hacer la siguiente definición.

Definición 3.1 (filtración). Si a1 < a2 < · · · < an son valores de la función f del

complejo K, tomamos a0 = −∞ y denotamos Ki = K(ai ) para cada i = 0, 1, . . . , n.

Llamamos a esta secuencia creciente de complejos una filtración de f .

∅ = K0 ⊆ K1 ⊆ · · · ⊆ Kn−1 ⊆ Kn = K.

Intuitivamente, podemos pensar una filtración como una construcción de un

complejo añadiendo un simplicial cada vez. Más que la secuencia de complejos, estamos

interesados en la evolución topológica, expresada por la correspondiente secuencia de

grupos de homología asociados a cada complejo de la filtración.

Para cada i ≤ j tenemos una aplicación de inclusión natural del espacio subyacente

39
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

de Ki al de Kj :

∅ = K0 ,→ K1 ,→ · · · ,→ Kn−1 ,→ Kn = K.

Por lo tanto tenemos un homomorfismo inducido entre los grupos de homología

asociados a cada complejo en la filtración para cada dimensión p:

ϕ0,1
p ϕ1,2
p ϕn−2,n−1
p ϕn−1,n
p
∅ = Hp (K0 ) −→ Hp (K1 ) −→ · · · · · · −→ Hp (Kn−1 ) −→ Hp (Kn ) = Hp (K)

Asi tenemos que, cuando avanzamos de Ki−1 a Ki , obtenemos nuevas clases de

homología y perdemos algunas que se convierten en la clase de equivalencia trivial o se

juntan con otras clases. Luego agrupamos estas clases que nacen en o antes de un valor

dado y mueren despues de otro valor, las siguientes definiciónes nos permiten formalizar

esta idea.

Definición 3.2 (Grupos de homología persistente). Los p-ésimo grupos de homología

persistente son las imágenes de los homomorfismos inducidos por la inclusión, Hpi,j =

Im ϕi,j
p , para 0 ≤ i ≤ j ≤ n. Los correspondientes p-ésimo números de Betti persistentes

son los rangos de estos grupos, βpi,j = rango Hpi,j .

Remarca 3.3. Notese que Hpi,i = Hp (Ki ) y Hpi,j ⊆ Hp (Kj ).

Los grupos de homología consisten en las clases de homología de Ki que aún estan

presentes o “viven” en el grupo de homología de Kj , o formalmente,

Zp (Ki )
Hpi,j = .
Bp (Kj ) ∩ Zp (Ki )

Tenemos estos grupos para cada dimensión p y cada par de índices i ≤ j. Podemos

40
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

Figura 3.2: La clase γ nace en Ki y muere entrando en Kj .

ser más concretos acerca de las clases contabilizadas por los grupos de homología

persistente mediante las siguientes definiciones, ilustradas en la Figura 3.2.

Definición 3.4 (nacimiento y muerte de clases). Sea γ una clase en Hp (Ki ), decimos

/ Hpi−1,i . Si γ nace en Ki entonces muere entrando en Kj si se une


que nace en Ki si γ ∈

con una clase anterior avanzando de Kj−1 a Kj , es decir,

ϕi,j i−1,j
p (γ) ∈ Hp y ϕi,j−1
p / Hpi−1,j−1 .
(γ) ∈

Definición 3.5 (persistencia). Si γ nace en Ki y muere entrando en Kj entonces

llamamos a la diferencía, en el valor de la función, la persistencia de γ, definida como

pers(γ) = aj − ai . A la diferencia de los índices j − i llamamos el índice de persistencia.

Si γ nace en Ki pero nunca muere entonces su persistencia es infinito.

Notese que los nacimientos y muertes también pueden ser definidos como una

secuencia de espacios vectoriales que no necesariamente son grupos de homología. Todo

lo que necesitamos es una secuencia finita y homomorfismos de izquierda a derecha que,

para espacios vectoriales, son llamados como aplicaciones lineales.

41
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

3.2. Diagramas de persistencia

En esta sección introduciremos los diagramas de persistencia que nos permite

codificar la diferencia entre la homología dentro la filtración. Este herramienta nos

permite visualizar toda la información de los grupos de homología en la filtración.

Definición 3.6. Definimos µi,j


p el número de clases p-dimensionales nacidas en Ki y

que mueren entrando en Kj , es decir,

µi,j i,j−1
p = (βp − βpi,j ) − (βpi−1,j−1 − βpi−1,j ),

para todo i < j y todo p.

Definición 3.7 (diagrama de persistencia). Dibujando cada punto (ai , aj ) con multipli-

cidad µi,j
p , obtenemos el p-ésimo diagrama de persistencia de la filtración, denotado por

Dgmp (f ).

Notese que el diagrama de persistencia esta definido como un multiconjunto7 en


2
R . La Figura 3.3 ilustra la visualización de un diagrama de persistencia con una sola

clase de homología, donde ai representa el nacimiento de la clase y aj el fin de la clase.

Por construcción, todos los valores se representan encima la diagonal, y las clases más

cercanas a la diagonal son clases que estan presentes muy poco tiempo, en cambio las

clases más cercanas a la horizontal superior representan clases que persisten por un

mayor tiempo a través de la filtración.

El siguiente teorema nos dice que el diagrama codifica toda la información de

los grupos de homología persistente. Es decir, si encontramos una manera directa de


7
Es un conjunto donde cada miembro tiene asociado una multiplicidad.

42
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

(ai , aj )
aj

ai

Figura 3.3: Un diagrama de persistencia con un solo par (ai , aj ).

calcular el diagrama de persistencia entonces tenemos toda la información topológica.

Teorema 3.8 (Lema fundamental de la Homología Persistente). Sea ∅ = K0 ⊆ K1 ⊆

· · · ⊆ Kn = K una filtración. Para cada par de índices 0 ≤ k ≤ l ≤ n y cada dimensión

p, el p-ésimo número de Betti persistente es

βpk,l = βpk,n + µi,j


XX
p .
i≤k j>l

43
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

Demostración. Reemplazamos ui,j


p por su definición y desarrollamos las sumas:

µi,j (βpi,j−1 − βpi,j ) − (βpi−1,j−1 − βpi−1,j )


XX XX
p =
i≤k j>l i≤k j>l

(βpi,l − βpi,n ) − (βpi−1,l − βpi−1,n )


X
=
i≤k

(βpi,l − βpi−1,l ) − (βpi,n − βpi−1,n )


X
=
i≤k

= (βpk,l − βp0,l ) − (βpk,n − βp0,n )

Recordemos que βp0,j = 0 para todo j por que K0 = ∅ no tiene ninguna clase de

homología. Por lo tanto

µi,j k,l k,n


XX
p = βp − βp .
i≤k j>l

3.3. Espacio de Códigos de Barras

En la anterior sección hemos visto que podemos clasificar los grupos de persis-

tencia parametrizados utilizando pares de enteros (ai , aj ) los grupos de persistencia

parametrizado en N0 utilizando pares de enteros (ai , aj ). Si pensamos en estos pares

como intervales semi-abiertos [ai , aj ), esta descripción coincide con la de los grupos

parametrizados en R.

Definición 3.9 (código de barras). Un código de barras es un conjunto finito de

intervalos acotados por abajo.

Entonces, podemos asociar un código de barras a una filtración a través de su

diagrama de persistencia, en otras palabras, el código de barras es una visualización

44
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

alternativa del diagrama de persistencia. Los intervalos del código de barras también

son llamados intervalos de Betti, la Figura 3.4 ilustra el código de barras asociado a

una filtración.

A1 A2 A3 A4 A5

⊂ ⊂ ⊂ ⊂

β0 =9,β1 =0 β0 =1,β1 =1 β0 =1,β1 =1 β0 =1,β1 =1 β0 =1,β1 =0

H0

H1
t0 t1 t2 t3 t4 t5

Figura 3.4: Una filtración y su respectivo código de barras.

Intuitivamente, los intervalos denotan el tiempo de vida de ciclos no triviales en

un complejo en crecimiento. El extremo izquierdo significa el nacimiento de un nuevo

atributo topológico, y el extremo derecho establece su muerte. Mientras más largo

el intervalo, más importante es el atributo topológico, dado que persiste en ser una

característica del complejo.

Si consideramos todo el conjunto de códigos de barras, podemos definir un espacio

métrico asociando una métrica o quasi-métrica8 . Para este cometido, asumimos que X

y Y son dos códigos de barras, y escribimos Bij(X, Y ) para la colección de todas las

biyecciones de X en Y . Para un máximo de una cantidad numerable de elementos no

diagonales del código de barras, tales biyecciones pueden emparejar cada elemento no

diagonal con algún elemento posiblemente diagonal, y par todos los elementos de la
8
Una función no negativa que satisface los axiomas de una métrica con posible excepción de la
simetría.

45
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

diagonal con elementos infinitesimalmente cercanos a la diagonal.

A continuación definimos algunas métricas para este espacio de código de barras.

Definición 3.10 (distancia “bottleneck”). La distancia de cuello de botella, denotada

por dB (X, Y ), se define como

dB (X, Y ) = ı́nf sup kx − γ(x)k∞ .


γ∈Bij(X,Y ) x∈X

Definición 3.11 (distancia de Hausdorff). La distancia de Hausdorff, denotada por

dH (X, Y ), esta definida en los multiconjuntos X, Y en R2 por

( )
dH (X, Y ) = máx sup ı́nf kx − yk∞ , sup ı́nf ky − xk∞
x∈X y∈Y y∈Y x∈X

Definición 3.12 (distancia de Wasserstein). La distancia de Wasserstein, denotada

por dpW (X, Y ), esta definida como

!1/p
dpW γ(x)kp∞
X
= ı́nf kx −
γ∈Bij(X,Y )
x∈X

El espacio de código de barras ha sido considerado un objeto de análisis interesante

llegando a estudiar, por ejemplo, la estabilidad de convergencia de códigos de barras[17]

como también estadística[11] y probabilidad[24]. Para profundizar sobre el tema puede

consultarse [15], las métricas anteriores han sidos propuestas en los trabajos [17, 18].

46
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

3.4. Experimentación

En esta sección utilizaremes la biblioteca pHom [30] en el lenguaje de programación

R [31] para generar los códigos de barras y diagramas de persistencia de diferentes nubes

de puntos.

El cómputo de la homología persistente se realiza mediante una modificación

del algoritmo de eliminación de Gauss, para más detalles sobre la implementación y

cuestiones algoritmicas puede consultarse [33] o [2].

3.4.1. Homología del Toro

En esta sección calculamos el código de barras y diagrama de persistencia de una

nube de puntos que se encuentran uniformemente distribuidos sobre la superficie del

Toro en R3 , como se muestra en la Figura 3.5.

El valor máximo del parámetro utilizado es 3,9, este valor es determinado expe-

rimentalmente dependiendo del comportamiento de los datos. De manera general, si

utilizamos parámetros mayores el resultado final es un complejo simplicial de un solo

componente conectado y sin ciclos.

47
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE



●●● ●●●●●●●●
● ●●●●●●●●
●●●
● ● ●
● ●● ● ●
●● ●●●●●


●●
● ●



● ●

●● ●●
●● ●●
● ●●● ●●●●●
● ● ●●● ●●●●
●●
●●●

●●
●●●●● ● ● ● ●● ●●

●● ●● ● ●
● ●● ● ● ● ●
●●● ● ● ● ● ●● ● ●● ●●●● ●●
● ●●●●●
●●● ●●
●●

●●
● ● ●
●● ● ●● ●● ● ● ● ● ● ●●●● ●● ● ● ●●
● ●●
● ●
●● ● ●● ● ● ● ● ●
●● ●●
● ●

● ● ●●
●●● ●●●● ●●

● ●●● ●●● ● ● ● ● ● ● ● ● ●●●●●●
● ●


●●●●●● ● ●● ● ●● ● ● ● ●●● ●●●●
● ● ● ● ● ●● ●
● ●
●●●●● ●●●● ● ●● ● ● ● ●
● ● ● ● ● ● ● ●● ● ●
●●● ●
●● ●● ●● ●●●●●
● ●
● ● ● ●
●●●
●● ●

●●●●●
● ● ●

● ●● ●● ● ● ●● ●
●● ● ●● ●●●●

●●●
●● ●

●●

●● ● ● ●● ● ● ●●

●●●●●
●● ●●●● ● ● ● ● ●
● ● ● ●● ●
●●

● ● ●● ●●●● ●
●●● ● ● ● ● ● ●
● ●
●●
● ●●● ●●●● ●●●
● ● ● ● ●
●● ● ●● ● ● ● ● ●
●●●
● ●●●

●●●●
●●
● ●●
●●●●●● ●●●
● ●

●● ●●●
● ●●●●
● ●●● ●●●● ●●●
● ● ●
●●●● ● ● ●● ● ●● ● ●
●●

● ●●
● ● ●● ●● ●


●●




● ●
●●
●●●
● ●●

● ●
● ●●● ●●
● ● ● ●
● ●
● ●● ● ●●
● ●
●●
● ● ● ● ● ●●●
●●●● ● ● ●● ● ● ● ●●●

● ●
●●●

●● ●● ●●
● ● ●●●●● ● ● ● ● ●●●● ●● ● ● ●
● ●●● ●
● ●
● ● ● ● ● ●
● ●● ● ●● ●● ● ●●●●● ●● ●● ● ● ● ●● ● ●
10
●● ● ● ● ● ●

●● ● ●● ● ● ●● ●
●●●●● ● ● ●●●●●● ●
● ● ●
● ●● ●
● ●● ● ● ● ●

●●●● ● ● ● ● ●● ●●

●●●
●●●●●●

●● ●●
● ●●
●● ● ●
● ●● ● ●
●●
● ● ● ●●●
●●●●●●●●●● ●●● ●●
●●● ●●● ● ● ● ●●

●● ● ●●
●● ● ● ●●●●●●●● ●● ● ●●
● ● ●●● ●●● ● 40

y
● ●
● ● ● ●● ●●● ●
● ●●● ● ●●● ●● ● ● ● ● ●●●● ● ● ● ●

● ● ●● ● ●● ● ● ● ●●●● ●●● ●● ●●● ●● ● ●●● ● ● ●●●●
●●
● ●●● ● ●● ● ● ●● ●●●●
●● ●●● ●
●●●● ●●●●●●● ●●●
●● ●●●●●
●●
●●●●
●● ●●

30
●●● ●● ●● ●● ●●● ●● ● ●●● ●● ● ●● ●
5

● ● ●●●
● ● ● ● ● ●●


●●●●
●● ●●●●●●● ●●●● ● ●●

●●
●●
●● ● ●●
●●● ●●
●●●
●●●●


● ● ●●●● ●●●● ●●
●● ● ●●

● ●● ●
●● ●●

● ●



●●●●● ●


●● ●
● ● ●●● ●
●●●●


●●●

● ●●●●●●● ●● ●
●● 20
● ● ●
● ●
● ●● ●●● ●

●●● ●
●●● ●
●● ● ● ● ● ● ● ● ● ● ● ●●●●●● ●●●

●●●●● ●● ● ● ● ●
● ●● ●●●●
● ●●●
●●
●●●●●●● ●● ●● ● ●● ●●
●●●●● ●
● ● ●●● ● ●● ● ●
● ● ●● ● ●● ●●●● ●●●●● ●●●● 10

●●
●●●●● ● ●● ● ●● ●●●●●● ●●●
0

●● ● ●
● ●●● ● ●● ●●●● ●● ●●● ● ● ● ●● ●●● ●●●●● ●●
z

● ●● ●●
●● ●●● ●●●

●●● ●●
● ●● ● ● ●
●● ● ●
●● ● ● ● ●
● ● ●● ●● ● ●● ● ●● ●● ● 0
●● ●●●●● ●●● ● ● ●●●● ● ● ● ●● ●●●●● ●●●●
●●●● ●●●
● ●
●●●●● ●● ● ● ● ● ● ●●
●●● ● ● ● ●●●● ●●● −10

●●
● ●●●●● ●●●●● ●●● ●●●● ●● ● ● ● ● ● ●●●●●●●
−5


●●●●●● ● ● ● ● ●● ● ●
●●

● ● ● ● ● ● ● ●
●●● ●●●●● ●●●●
● ●●●●●● ●● ● ● ●
●● ● ●
● ● ●
● −20
● ●● ●●●● ●● ● ● ●
● ●
● ●
−30
−10

−40
−40 −30 −20 −10 0 10 20 30 40

Figura 3.5: Una nube de puntos sobre la superficie del Toro.

En código de barras para el grupo de homología H0 , mostrado en la Figura 3.6,

permite observa que los puntos se conectan rápidamente unos con otros formando un

solo componente conexo. Esto se da por que los puntos estan distribuidos uniformemente,

si utilizamos una distribución de puntos no-uniforme obtendriamos otro resultado.

48
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

H0

0.00 0.78 1.56 2.34 3.12 3.90

Figura 3.6: Código de barras correspondiente al grupo de homología H0 del Toro.

Para el grupo de homología H1 , el código de barras mostrado en la Figura 3.7

representa los 1-ciclos que se van formando a medida que el parámetro incrementa de 0

a 3,9. Diferentes 1-ciclos se van formando hasta quedar dos 1-ciclos casi hasta el final.

Lo que se puede interpretar como el 1-ciclo que representa el círculo menor y transversal

del toro se “cierra” (o muere) al aproximarse al parámetro final de 3,9. Si continuamos

extendiendo el parámetro con un valor mayor a 3,9 no quedaría ningún 1-ciclo, y de

manera general, ningún n-ciclo.

49
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

H1

0.00 0.78 1.56 2.34 3.12 3.90

Figura 3.7: Código de barras correspondiente al grupo de homología H1 del Toro.

El siguiente código de barras del grupo de homología H2 (Figura 3.8) representan

los 2-ciclos o “vacíos” encerrados por la superficie del toro. En este caso tenemos un

2-ciclo que nace aproximadamente en 1,6 y persiste hasta 3,9.

50
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

H2

0.00 0.78 1.56 2.34 3.12 3.90

Figura 3.8: Código de barras correspondiente al grupo de homología H2 del Toro.

El diagrama de persistencia resume los códigos de barras en un solo gráfico

codificando toda la información de los grupos de homología. Se puede ver en la Figura 3.9

las clases que persisten de los grupos de homología.

51
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

Persistence Diagram

4

3
Interval End

2
1

● 0
1

● 2


0

0 1 2 3 4

Interval Start

Figura 3.9: Diagrama de persistencia de la nube de puntos.

Se verifica que el resultado experimental coincide con el resultado teórico ya

conocido para la homología del toro:

β0 = 1, β1 = 2, β2 = 1.

3.4.2. Cuarteto de Anscombe

El Cuarteto de Anscombe[8] son 4 conjuntos de datos que casi tienen las mismas

propiedades estadísticas, pero que difieren considerablemente cuando son graficadas

como se muestra en la Tabla 3.1 y la Figura 3.10.

En este caso solo se manejan 2 dimensiones, por lo cual no es difícil graficar y

visualizar que forma tienen los datos. Pero en mayores dimensiones (n  4) ya no es

52
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

Cuadro 3.1: Medidas estadísticas para el Cuarteto de Anscombe.


Propiedad Valor
Media de x en cada caso 9
Varianza de x en cada caso 11
Media de y en cada caso 7,50
Varianza de y en cada caso 4,122 o 4,127
Correlación entre x y y en cada caso 0,816
Línea de regresión en cada caso y = 3,00 + 0,500x

posible visualizar los datos completamente se tiene que recurrir a proyecciones en 2 o 3

dimensiones lo cual nos puede llevar a perder información y sacar conclusiones erróneas.

dataset = I dataset = II
14

12

10

8
y

2
dataset = III dataset = IV
14

12

10

8
y

2
2 4 6 8 10 12 14 16 18 20 2 4 6 8 10 12 14 16 18 20
x x

Figura 3.10: El Cuarteto de Anscombe

Aplicando la homología persistente, obtenemos los códigos de barras (Figura 3.11) y

diagramas de persistencia (Figura 3.12) asociados a cada conjunto de datos del Cuarteto

53
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

de Anscombe. Y las características topológicas de los cuatro conjuntos son distintas.

Dataset I − H0 Dataset I − H1

0.0 2.4 4.8 7.2 9.6 12.0 0.0 2.4 4.8 7.2 9.6 12.0

Dataset II − H0

0.0 2.4 4.8 7.2 9.6 12.0

Dataset III − H0

0.0 2.4 4.8 7.2 9.6 12.0

Dataset IV − H0

0.0 2.4 4.8 7.2 9.6 12.0

Figura 3.11: Códigos de barras asociados al Cuarteto de Anscombe

54
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

Dataset I Dataset II

12

12
● ●
Interval End

Interval End
8

8
6

6
4

4



2

2
● ●

● ● 0 ●
● ● 0
● ●
1 1
0

0
0 2 4 6 8 10 12 0 2 4 6 8 10 12

Interval Start Interval Start

Dataset III Dataset IV


12

12
● ●

Interval End

Interval End
8

8
6


4


2

● ● 0 ●
● 0


1 ● 1
0

0 2 4 6 8 10 12 0 2 4 6 8 10 12

Interval Start Interval Start

Figura 3.12: Diagramas de persistencia asociados al Cuarteto de Anscombe

En este caso podemos ver que la topología no captura las propiedades geométricas

de los datos (curvatura, ángulos, etc), por lo que es necesario aplicar técnicas adicionales

para poder capturar estas propiedades geométricas mediante la homología persistente.

Los trabajos de Carlsson [13] y Singh [28] tratan este problema.

3.4.3. Fisher’s Iris dataset

55
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

El Conjunto de Datos de Lirios de Fisher[21,

7] es un conjunto de datos multivariado muy citado

en la literatura sobre técnicas de análisis discrimina-

torio, clasificación y clustering; donde el objetivo es

construir un modelo para identificar las diferentes

especies.
Figura 3.13: Una flor de lirio.
Consiste en 50 muestras de cada clase de Lirio

(Iris setosa, Iris virginica, Iris versicolor). Con cuatro características medidas de cada

muestra: el largo y ancho del sépalo y pétalo, en centímetros.

Figura 3.14: Matriz de dispersión del dataset Iris.

56
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

Aquí aplicamos la homología persistente a un conjunto de datos más real que los

anteriores. Las figuras 3.14, 3.15 y 3.16 muestran el gráfico de dispersión, código de

barras y diagrama de persistencia, respectivamente, de este conjunto de datos.

En este caso no tenemos nada directo que concluir del resultado, más allá de que

el conjunto de datos tiene dos componentes conexos. Lo que tendríamos que hacer es

analizar los datos que formas estos componentes conexos, o incluso cuando forman 3 o 4

componentes conexos para poder decidir si comparten alguna propiedad interesante.

Así tambien analizar los datos que forman los ciclos que var apareciendo eventual-

mente. Es muy posible que no podamos encontrar nada significativo y que necesitemos

aplicar y complementar con otras técnicas para obtener resultados más concluyentes.

57
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

H0 Barcode for Iris Data

0.00 0.34 0.68 1.02 1.36 1.70

H1 Barcode for Iris Data

0.00 0.34 0.68 1.02 1.36 1.70

Figura 3.15: Códigos de barras del dataset Iris.

58
CAPÍTULO 3. HOMOLOGÍA PERSISTENTE

Persistence Diagram of Iris Data


1.5 ●
Interval End

1.0






0.5









● 0
1
0.0

0.0 0.5 1.0 1.5

Interval Start

Figura 3.16: Diagrama de persistencia del dataset Iris.

59
CONCLUSIONES

En este trabajo hemos visto la fundamentación teórica de la homología persistente y

su aplicación a algunos conjuntos de datos donde no siempre se pueden sacar conclusiones

directas del código de barras y diagrama de persistencia.

De manera general, cuando se aplica la homología persistente en el análisis topoló-

gico de datos, seguimos los siguientes pasos:

1. Obtenemos los datos a analizar, usualmente en formato de matrix numérica;

2. le asociamos una estructura topológica a través de una métrica y una función

parametrizada para generar una filtración de complejos simpliciales;

3. estudiamos las propiedades topológicas a través del código y diagrama de persis-

tencia calculados mediante homología persistente;

4. interpretamos estas propiedades topológicas, por ejemplo:

¿Qué significa tener agujeros de dimensión 2 en nuestros datos?

¿Hay diferencias topológicas entre diferentes espacios?

¿Cómo interpretamos las modificaciones de las propiedades en el tiempo con

nuestro conjunto de datos?

El método es mayormente heurístico y la interpretación depende de los datos que estemos

analizando y de nuestro conocimiento del dominio del problema.

Además, hemos podido observar que en un conjunto de datos reales, la homología

persistente no siempre nos da conclusiones significativas, y se ve necesario complementar

con técnicas adicionales (de análisis estadístico, reconocimiento de patrones, aprendizaje

automático, etc).

60
Anexos

61
Anexo A

CÓDIGO FUENTE DE EJEMPLOS

A.1. Homología del Toro

1 library ( phom )
library ( scatterplot3d )
3
N <- 20
5 R <- 25
r <- 10
7 sd <- 1

9 ts <- seq (0 ,2 * pi , pi / N )
ps <- seq (0 ,2 * pi , pi / N )
11
x <-y <-z <-c ()
13 for ( t in ts ) for ( p in ps ) {
x <- c (x , R * cos ( t ) + r * cos ( p ) * cos ( t ) )
15 y <- c (y , R * sin ( t ) + r * cos ( p ) * sin ( t ) )
z <- c (z , r * sin ( p ) )
17 }

19 pdf ( " 01 - torus - sample . pdf " , width =7 , height =5)


scatterplot3d (x ,y , z )
21 dev . off ()

23 max _ dim <- 2


max _ f <- 3.9
25
intervals <- pHom ( cbind (x ,y , z ) , max _ dim , max _f , mode = " lw " )
27
pdf ( " 01 - torus - barcode - h0 . pdf " , width =8 , height =5)
29 pl ot Ba rc od eD ia gr am ( intervals , 0 , max _f , title = " H0 " )
dev . off ()
31
pdf ( " 01 - torus - barcode - h1 . pdf " , width =8 , height =5)
33 pl ot Ba rc od eD ia gr am ( intervals , 1 , max _f , title = " H1 " )
dev . off ()
35
pdf ( " 01 - torus - barcode - h2 . pdf " , width =8 , height =5)
37 pl ot Ba rc od eD ia gr am ( intervals , 2 , max _f , title = " H2 " )
dev . off ()
39
pdf ( " 01 - torus - pdiagram . pdf " , width =8 , height =5)
41 p l o t P e r s i s t e n c e D i a g r a m ( intervals , max _ dim , max _ f )
dev . off ()

62
ANEXO A. CÓDIGO FUENTE DE EJEMPLOS

A.2. Cuarteto de Anscombe

library ( phom )
2

max _ dim <- 1


4 max _ f <- 12

6 int1 <- pHom ( as . matrix ( anscombe [ , c (1 ,5) ]) , max _ dim , max _ f )


int2 <- pHom ( as . matrix ( anscombe [ , c (2 ,6) ]) , max _ dim , max _ f )
8 int3 <- pHom ( as . matrix ( anscombe [ , c (3 ,7) ]) , max _ dim , max _ f )
int4 <- pHom ( as . matrix ( anscombe [ , c (4 ,8) ]) , max _ dim , max _ f )
10
pdf ( " 02 - anscombe - barcodes . pdf " , width =8 , height =10)
12
par ( mfrow = c (4 , 2) )
14

pl ot Ba rc od eD ia gr am ( int1 , 0 , max _f , title = " Dataset I - H0 " )


16 pl ot Ba rc od eD ia gr am ( int1 , 1 , max _f , title = " Dataset I - H1 " )

18 pl ot Ba rc od eD ia gr am ( int2 , 0 , max _f , title = " Dataset II - H0 " )


# pl ot Ba rc od eD ia gr am ( int2 , 1 , max _f , title =" H1 - Dataset II ")
20 plot . new ()

22 pl ot Ba rc od eD ia gr am ( int3 , 0 , max _f , title = " Dataset III - H0 " )


# pl ot Ba rc od eD ia gr am ( int3 , 1 , max _f , title =" H1 - Dataset III ")
24 plot . new ()

26 pl ot Ba rc od eD ia gr am ( int4 , 0 , max _f , title = " Dataset IV - H0 " )


# pl ot Ba rc od eD ia gr am ( int4 , 1 , max _f , title =" H1 - Dataset IV ")
28
dev . off ()
30

32 pdf ( " 02 - anscombe - diagrams . pdf " , width =6 , height =6)

34 par ( mfrow = c (2 , 2) )
p l o t P e r s i s t e n c e D i a g r a m ( int1 , max _ dim , max _f , title = " Dataset I")
36 p l o t P e r s i s t e n c e D i a g r a m ( int2 , max _ dim , max _f , title = " Dataset II " )
p l o t P e r s i s t e n c e D i a g r a m ( int3 , max _ dim , max _f , title = " Dataset III " )
38 p l o t P e r s i s t e n c e D i a g r a m ( int4 , max _ dim , max _f , title = " Dataset IV " )

40 dev . off ()

A.3. Fisher’s Iris dataset

library ( phom )
2

# solo hay resultados para p <= 1


4 max _ dim <- 1
max _ f <- 1.7

63
ANEXO A. CÓDIGO FUENTE DE EJEMPLOS

data <- as . matrix ( iris [ , -5])


8 intervals <- pHom ( data , max _ dim , max _f , mode = " lw " , metric = " euclidean " )

10 pdf ( " 03 - iris - barcodes . pdf " , width =8 , height =8)


par ( mfrow = c (2 ,1) )
12 pl ot Ba rc od eD ia gr am ( intervals , 0 , max _f , title = " H0 Barcode for Iris
Data " )
pl ot Ba rc od eD ia gr am ( intervals , 1 , max _f , title = " H1 Barcode for Iris
Data " )
14 # pl ot Ba rc od eD ia gr am ( intervals , 2 , max _f , title =" H2 Barcode for Iris
Data ")
# pl ot Ba rc od eD ia gr am ( intervals , 3 , max _f , title =" H2 Barcode for Iris
Data ")
16 dev . off ()

18 pdf ( " 03 - iris - diagram . pdf " , width =6 , height =4)


p l o t P e r s i s t e n c e D i a g r a m ( intervals , max _ dim , max _f , title = " Persistence
Diagram of Iris Data " )
20 dev . off ()

64
REFERENCIAS

Libros

[1] Martin D. Crossley. Essential Topology. Undergraduate Mathematics Series. Sprin-

ger, 2005.

[2] H. Edelsbrunner y J. L. Harer. Computational Topology: An Introduction. American

Mathematical Society, 2009.

[3] A. Hatcher. Algebraic Topology. Cambridge University Press, 2002. u r l: http:

//www.math.cornell.edu/~hatcher/AT/ATpage.html.

[4] Tomasz Kaczynski, Konstantin Mischaikow y Marian Mrozek. Computational

homology. Vol. 157. Applied Mathematical Sciences. Springer, 2004.

[5] V. V. Prasolov. Elements of Homology Theory. Graduate Studies in Mathematics.

American Mathematics Society, 2007.

Artículos

[6] A. Adcock, D. Rubin y G. Carlsson. “Classification of Hepatic Lesions using the

Matching Metric”. En: CoRR abs/1210.0866 (2012). eprint: http://arxiv.org/

abs/1210.0866.

[7] Edgar Anderson. “The species problem in Iris”. En: Annals of the Missouri

Botanical Garden (1936), págs. 457-509.

[8] Francis J Anscombe. “Graphs in statistical analysis”. En: The American Statisti-

cian 27.1 (1973), págs. 17-21.

65
ANEXO A. CÓDIGO FUENTE DE EJEMPLOS

[9] S. Bhattacharya, R. Ghrist y V. Kumar. “Persistent Homology for Path Planning

in Uncertain Environments”. En: (2014). u r l: http://www.math.upenn.edu/

~ghrist/preprints/persistence_planning.pdf.

[10] S. Bhattacharya y col. “Invariants for homology classes with application to optimal

search and planning problem in robotics”. En: Annals of Mathematics and Artificial

Intelligence 67.3-4 (2013), págs. 251-281. u r l: http://arxiv.org/pdf/1208.

0573.

[11] Peter Bubenik y col. “Statistical topology via Morse theory, persistence and

nonparametric estimation”. En: Algebr. Methods Stat. Probab. II 516 (2010),

pág. 75. u r l: http://arxiv.org/pdf/0908.3668.

[12] Nicolás Capitelli y Gabriel Minian. Notas de Topología Combinatoria. Unión

Matemática Argentina, Reunión Anual 2009. 2009. u r l: http://mate.dm.uba.

ar/~gminian/notastopcomb.pdf.

[13] G. Carlsson. “Topological pattern recognition for point cloud data”. En: Acta

Numerica 23 (2014), págs. 289-368. u r l: http://math.stanford.edu/~gunnar/

actanumericathree.pdf.

[14] G. Carlsson. “Topology and Data”. En: (2008). u r l: http://comptop.stanford.

edu/preprints/topologyAndData.pdf.

[15] Gunnar Carlsson y col. “Persistence barcodes for shapes”. En: Proceedings of the

2004 Eurographics/ACM SIGGRAPH symposium on Geometry processing. ACM.

2004, págs. 124-135. u r l: http://mii.stanford.edu/research/comptop/

preprints/barcode4.pdf.

66
ANEXO A. CÓDIGO FUENTE DE EJEMPLOS

[16] Joseph Minhow Chan, Gunnar Carlsson y Raul Rabadan. “Topology of viral

evolution”. En: Proceedings of the National Academy of Sciences 110.46 (2013),

págs. 18566-18571. u r l: http://www.pnas.org/content/110/46/18566.long.

[17] David Cohen-Steiner, Herbert Edelsbrunner y John Harer. “Stability of persistence

diagrams”. En: Discrete & Computational Geometry 37.1 (2007), págs. 103-120.

u r l: http://www.cs.duke.edu/~edels/Papers/2007-J-01-StabilityPersistenceDiagram

pdf.

[18] David Cohen-Steiner y col. “Lipschitz functions have L p-stable persistence”. En:

Foundations of computational mathematics 10.2 (2010), págs. 127-139. u r l: http:

//www.researchgate.net/publication/225338121_Lipschitz_Functions_

Have_Lp-Stable_Persistence/file/9fcfd50b684251d3ae.pdf.

[19] Herbert Edelsbrunner y John Harer. “Persistent homology-a survey”. En: Con-

temporary mathematics 453 (2008), págs. 257-282. u r l: http://pub.ist.ac.

at/~edels/Papers/2008-B-02-PersistentHomology.pdf.

[20] Herbert Edelsbrunner, David Letscher y Afra Zomorodian. “Topological per-

sistence and simplification”. En: Discrete and Computational Geometry 28.4

(2002), págs. 511-533. u r l: http://www.math.uchicago.edu/~shmuel/AAT-

readings/Data%20Analysis%20/Edelsbrunner-Letscher-Zomordian.pdf.

[21] Ronald A Fisher. “The use of multiple measurements in taxonomic problems”. En:

Annals of eugenics 7.2 (1936), págs. 179-188.

[22] R. Ghrist. “Barcodes: the persistent topology of data”. En: Bulletin of the American

Mathematical Society 45.1 (2008), págs. 61-75. u r l: http://www.ams.org/bull/

2008-45-01/S0273-0979-07-01191-3/S0273-0979-07-01191-3.pdf.

67
ANEXO A. CÓDIGO FUENTE DE EJEMPLOS

[23] R. Ghrist y A. Muhammad. “Coverage and hole-detection in sensor networks via

homology”. En: Proceedings of the 4th international symposium on Information

processing in sensor networks. IEEE Press. 2005, pág. 34. u r l: http://hans.

math.upenn.edu/~ghrist/preprints/ipsn2005.pdf.

[24] Yuriy Mileyko, Sayan Mukherjee y John Harer. “Probability measures on the

space of persistence diagrams”. En: Inverse Problems 27.12 (2011), pág. 124007.

u r l: http://ftp.isds.duke.edu/WorkingPapers/11-06.pdf.

[25] M. Nicolau, A. J. Levine y G. Carlsson. “Topology based data analysis identifies

a subgroup of breast cancers with a unique mutational profile and excellent

survival”. En: Proceedings of the National Academy of Sciences 108.17 (2011),

págs. 7265-7270. d o i: 10.1073/pnas.1102826108. eprint: http://www.pnas.

org/content/108/17/7265.full.pdf+html.

[26] V. de Silva y R. Ghrist. “Coordinate-free coverage in sensor networks with contro-

lled boundaries via homology”. En: International Journal of Robotics Research 25

(dic. de 2006), págs. 1205-1222. u r l: http://pages.pomona.edu/~vds04747/

public/papers/dSG_coverage3_cb.pdf.

[27] V. de Silva y R. Ghrist. “Coverage in sensor networks via persistent homology”.

En: Algebraic & Geometric Topology 7 (2007), págs. 339-358. u r l: http://pages.

pomona.edu/~vds04747/public/papers/dSG_coverage2_ph.pdf.

[28] G. Singh, F. Mémoli y G. Carlsson. “Topological Methods for the Analysis of

High Dimensional Data Sets and 3D Object Recognition”. En: (2007). u r l:

http://comptop.stanford.edu/u/preprints/mapperPBG.pdf.

68
ANEXO A. CÓDIGO FUENTE DE EJEMPLOS

[29] G. Singh y col. “Topological analysis of population activity in visual cortex”. En:

Journal of vision 8.8 (2008), pág. 11. u r l: http://www.journalofvision.org/

content/8/8/11.

[30] Andrew Tausz. phom: Persistent Homology in R. Version 1.0.3. 2011. u r l: http:

//cran.r-project.org/package=phom.

[31] R Core Team y col. “R: A language and environment for statistical computing”.

En: (2012). u r l: http://cran.case.edu/web/packages/dplR/vignettes/

timeseries-dplR.pdf.

[32] A. Zomorodian. “Topological Data Analysis”. En: Advances in Applied and Compu-

tational Topology. Providence, RI: American Mathematical Society, 2012. u r l:

http://www.cs.dartmouth.edu/~afra/papers/ams12/tda.pdf.

[33] A. Zomorodian y G. Carlsson. “Computing Persistent Homology”. En: Discrete &

Computational Geometry 33.2 (2005), págs. 249-274. d o i: doi:10.1007/s00454-

004-1146-y. u r l: http://www.cs.dartmouth.edu/~afra/papers/socg04/

persistence.pdf.

69

S-ar putea să vă placă și