Topologia aplicada a la ciencia de datos · Homologia persistente Datos Vectores 2Rn De nicion...

Preview:

Citation preview

Topologia aplicada a la ciencia de datos

Luis Alexandher V.G.

FES Acatlan

November 14, 2018

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 1 / 26

Topologia

Definicion

Rama de las matematicas que estudia las propiedades cualitativas de losespacios topologicos

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 2 / 26

Clasico ejemplo

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 3 / 26

Topologia algebraica

Definicion

Forma de relacionar la topologia con el algebra

Componentes conexas

”Pedazos”

Agujeros

Nos interesa estudiar agujeros de los espacios topologicos (dimension0,1,2)

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 4 / 26

Homologia persistente

Datos

Vectores ∈ Rn

Definicion (homologia persistente)

Medir las caracteristicas topologicas de nuestros datos por medio de unmetodo algebraico (detectar los agujeros)

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 5 / 26

Complejo simplicial

A nuestros vectores (datos) les asociaremos un espacio topologico llamadocomplejo simplicial

Definicion (complejo simplicial)

Es un tipo particular de espacio topolgico construido mediante el pegadode puntos, segmentos de linea, triangulos, tetraedros

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 6 / 26

Complejo simplicial

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 7 / 26

De datos a complejos simpliciales

1.- Cada punto (dato) sera el centro de un circulo de radio r2.- Cuando dos circulos se intersectan se dibuja una linea que une a cadapunto3.- Las lineas son las aristas y los puntos nuestros vertices.

Asi hemos formado nuestro complejo simplicial

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 8 / 26

Ejemplo

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 9 / 26

Ejemplo

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 10 / 26

Ejemplo

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 11 / 26

Ejemplo

Para una r ”chica”

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 12 / 26

Ejemplo

Para una r muy grande

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 13 / 26

Todas las r posibles

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 14 / 26

”Vida” de agujeros

ESTO ES LA HOMOLOGIA PERSISTENTE

Persistencia de los agujeros. ”Nace” en r1 y muere en r2, es decir, ”vive”un tiempo (r1, r2)

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 15 / 26

Homologia persistente: Nos interesan los agujeros que mas PERSISTEN

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 16 / 26

Codigo de barras asociado

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 17 / 26

Diagrama de persistencia

Diagrama de persistencia (arriba) y codigo de barras asociado (abajo)

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 18 / 26

En nuestro diagrama vemos que un agujero persiste y el espacio topologicomas simple que tiene un agujero es el circulo.

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 19 / 26

Un algoritmo

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 20 / 26

Como curiosidad

Definicion: Sea T un conjunto ordenado. Un modulo de persistencia Vsobre T es una familia indexada de transformaciones lineales deΛ−modulos {Vs |s ∈ T} y una familia doblemente indexada detransformaciones lineales {v ts : Vs → Vt |s ≤ t} tales que v tr ◦ v rs = v tscuando s ≤ r ≤ t. Ademas v tt = idVt .

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 21 / 26

Otros ejemplos

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 22 / 26

En R3

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 23 / 26

En R3

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 24 / 26

Referencias

[1] Un rol para la curva de Betti en problemas de ciencia de datos, RfaelJose Gonzalez de Gouveia, Tesis para obtener el grado de maestro enciencias.[2] Analisis topologico de datos: Robusticidad y analisis de sensibilidad dealgoritmos, Jesus Manuel Perez Angulo, Tesis para obtener el grado demaestro en ciencias.[3] Barcodes: The persistent topology of data, Robert Ghrist[4] Aspectos computacionales del ”Analisis topologico de datos”, FranciscoValiente Castro

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 25 / 26

FIN

Luis Alexandher V.G. (UNAM) Estadistica y ciencia de datos November 14, 2018 26 / 26