13
Explorando Big Data y Ciencia de Datos con GPUs @abxda

Explorando Big Data y Ciencia de Datos con GPUs

Embed Size (px)

Citation preview

Page 1: Explorando Big Data y Ciencia de Datos con GPUs

Explorando Big Data y Ciencia de Datos con GPUs

@abxda

Page 2: Explorando Big Data y Ciencia de Datos con GPUs

4 mil en Aguascalientes y 18 mil en todo México

Page 3: Explorando Big Data y Ciencia de Datos con GPUs

En 2013 iniciamos la exploración

http://es.slideshare.net/acoronadoiruegas/qu-es-big-data @abxda

Page 4: Explorando Big Data y Ciencia de Datos con GPUs

%Acceso a Internet, %Pc, %Telefono Celular, %Automovil @abxda

Estratificación de 1.2 M de Manzanas (2013)

En la misma Pc de 4 Procesadores:(2013)

Software Tiempo Manzanas

Big Data 8 Seg. 1’221,180

Tradicional (R)

8 Seg. 2,666

https://spark.apache.org/

Page 5: Explorando Big Data y Ciencia de Datos con GPUs

Proyectos de Big Data y Ciencia de Datos

@abxda

Page 6: Explorando Big Data y Ciencia de Datos con GPUs

¿Qué clase de #BigData es esta?

@abxda

Page 7: Explorando Big Data y Ciencia de Datos con GPUs

Internet de las Personas

Internet de las Cosas

Sensores

{ json }

< xml >

c,s,v

Redes Sociales

Internet de las Ideas

Crowdsourcing

Sistemas de Archivos Distribuidos

Computo Paralelo y Concurrente

Programación Funcional

Razonamiento Algebraico

Estadística

Análisis MultivariadoMachine Learning

Análisis de Interacción Espacial

{ json }

< xml >

c,s,v

{ json }

< xml >

c,s,v

Bases de Datos NoSQL

Visualización

Panorama Tecnológico a 2015

Infraestructura de Cómputo

Page 8: Explorando Big Data y Ciencia de Datos con GPUs

Apache ImpalaInternet de las Personas

Internet de las Cosas

Sensores

{ json }

< xml >

c,s,v

Redes Sociales

Internet de las Ideas

Crowdsourcing

Sistemas de Archivos Distribuidos

Computo Paralelo y Concurrente

Programación Funcional

Razonamiento Algebraico

Estadística

Análisis MultivariadoMachine Learning

Análisis de Interacción Espacial

{ json }

< xml >

c,s,v

{ json }

< xml >

c,s,v

Bases de Datos NoSQL

Visualización

Panorama Tecnológico a 2016

Infraestructura de Cómputo

Amazon g2.2xlarge

BIDMatBIDMach

DataframesSQL

PG-StromSQL on GPU

Page 9: Explorando Big Data y Ciencia de Datos con GPUs

PG-Strom

• Sql on GPU

100,000,000 Records

https://wiki.postgresql.org/wiki/PGStrom#PG-Strom

@abxda

Page 10: Explorando Big Data y Ciencia de Datos con GPUs

http://bid2.berkeley.edu/bid-data-project/

• Machine Learning on GPU & Scala

@abxda

Page 11: Explorando Big Data y Ciencia de Datos con GPUs

http://deeplearning4j.org/

@abxda

Page 12: Explorando Big Data y Ciencia de Datos con GPUs

Apache Spark + Deep Learning

@abxda

Page 13: Explorando Big Data y Ciencia de Datos con GPUs

@abxda

[email protected]