19
WEBINAR Información no estructurada Por Jackson Garcés – Científico de datos Carlos Marín – Socio director Julio 19 de 2016

Webinar: "Datos no Estructurados" en TIBCO Spotfire

  • Upload
    it-nova

  • View
    181

  • Download
    3

Embed Size (px)

Citation preview

Page 1: Webinar: "Datos no Estructurados" en TIBCO Spotfire

WEBINAR

Información no estructurada

Por

Jackson Garcés – Científico de datos

Carlos Marín – Socio director

Julio 19 de 2016

Page 2: Webinar: "Datos no Estructurados" en TIBCO Spotfire

Resolvemos sus

preguntas de negocio

Acerca de IT-NOVA

Somos una empresa de servicios profesionales de consultoría enfocada en lograr que la tecnología apoye y potencialice los procesos de negocio de nuestros clientes, orientándonos en su satisfacción a través de servicios de calidad para enfrentar y resolver los retos a nivel operativo y estratégico de las organizaciones. Nuestro portafolio de productos y servicios se enfoca en:

AnalíticaInteligencia

de negocios

Integramos la estrategia de su compañía

Page 3: Webinar: "Datos no Estructurados" en TIBCO Spotfire

Acerca de TIBCO

Casa Matriz en Palo Alto

Más de 10,000 clientes

Oficinas en más de 30 países

$1B anual en ingresos

Más de 3.500 empleados

Una comunidad de 500 mil personas

1M de visitas web mensualmente

500 empleados

Page 4: Webinar: "Datos no Estructurados" en TIBCO Spotfire

Servicios Financieros Educación

Servicios

Consumo masivo

Manufactura

Presencia en Latinoamérica

Page 5: Webinar: "Datos no Estructurados" en TIBCO Spotfire

Sector Público Sector energético Telecom / Media

Sector Salud

Presencia en Latinoamérica

Page 6: Webinar: "Datos no Estructurados" en TIBCO Spotfire

La misión de TIBCO Analytics

Page 7: Webinar: "Datos no Estructurados" en TIBCO Spotfire

Spotfire –Evolución de la analítica

Page 8: Webinar: "Datos no Estructurados" en TIBCO Spotfire

Información no Estructurada

“Lo que los datos nos enseñan”

Page 9: Webinar: "Datos no Estructurados" en TIBCO Spotfire

¿Qué son “DATOS no Estructurados”?

Son aquellos datos que no se enmarcan dentro de un modelo de datos predefinido (como las tablas) y usualmente están compuestos por

texto pesado. Sin embargo, existen otros tipos de datos no

estructurados como:

Imágenes satelitalesArchivos de audioArchivos de videoSeñales IoTRedes socialesDatos móvilesPáginas WEB

Page 10: Webinar: "Datos no Estructurados" en TIBCO Spotfire

¿Por qué son importantes los “DATOS no Estructurados”?

Los datos no estructurados, son de lejos, los de mayor peso en la ecuación de la analítica y la

información. Se dice que un 80% de la información producida es no

estructurada y a su vez suele ser la que más se relaciona con las personas, de ahí su

valor.

Sin embargo, la brecha analítica y de almacenamiento es grande aunque se ha ido estrechando con las nuevas tecnologí as.

Page 11: Webinar: "Datos no Estructurados" en TIBCO Spotfire

Datos no Estructurados y BIG DATA

Es el Big Data el encargado de reducir la brecha en la capacidad de almacenamiento y análisis. El

objetivo es transformar datos no estructurados a datos

estructurados.

El ecosistema Hadoop es tal vez el entorno más conocido o del que más

se habla, pero no es la única herramienta que permite almacenar,

analizar o procesar Big Data.

Datos estructurados

Datos no estructurados

Datos hiper estructurados

Page 12: Webinar: "Datos no Estructurados" en TIBCO Spotfire

Almacenamiento

Herramientas para DATOS NO ESTRUCTURADOS

En general las herramientas para "tratar y almacenar" datos no estructurados son conocidas como herramientas NoSQL; las diferencias entre los diferentes desarrollos

se basa en tres requerimientos fundamentales:

Consistencia: cada cliente siempre tiene la misma vista de datos.Disponibilidad: todos los clientes siempre pueden leer y escribir datos.Tolerancia a la partición: el sistema debe trabajar bien a través de redes fí sicas.

Tomado de: http://blog.flux7.com/blogs/nosql/cap-theorem-why-does-it-matter

Page 13: Webinar: "Datos no Estructurados" en TIBCO Spotfire

Almacenamiento

Herramientas para DATOS NO ESTRUCTURADOS

Por ejemplo en los (RDBMS) son del tipo CA, es decir consistentes y con disponibilidad tienen problemas de

replicación (paralelismo).

En otra "arista" están las tipo CP tienen problemas de disponibilidad pero son consistentes a través de sistemas

distribuidos, aquí están herramientas como HBase, MongoDB, Terrastore, Redis entre otras.

Por último, se tiene as tipo AP con alta disponibilidad y tolerables a un entorno de partición como Cassandra,

SimpleDB, Dynamo entre otras

DataScientist
Lina, dejar solo los logos de los que se hablan aquì:https://community.tibco.com/wiki/tibco-spotfirer-data-access, no tienen que se todos
Page 14: Webinar: "Datos no Estructurados" en TIBCO Spotfire

Analítica

Herramientas para DATOS NO ESTRUCTURADOS

Cuando los datos han sido capturados surge la incógnita de ¿cómo los analizo?, ¿cómo les

agrego valor?, ¿cómo los visualizo?.

Las teorías tienen que ver con los desarrollos que se han hecho desde la academi a, y las herramientas son los programas y software

donde han sido implementados para uso final. Teorías•Text Minnig•Procesamiento lenguaje natural•Geomática•Análisis de redes•Web Scrapping

Page 15: Webinar: "Datos no Estructurados" en TIBCO Spotfire

¿ Cómo los datos no estructurados pueden generar valor en mi negocio?

•La aerolíneas aplican el análisis de sentimientos para establecer cómo se sienten sus clientes respecto a las demoras, la comida, el tratamiento del personal. Los tuits positivos ayudan a determinar comportamientos exitosos.

•Las Compañías financieras dotan a los analistas de una ventaja al proporcionarles información de las compañías y las personas involucradas. Con esto se busca detectar cambios en los comportamientos y cómo estos pueden impactar el mercado.

•Entidades de salud, procesan sus historias clínicas para encontrar correlaciones entre diagnósticos.

DataScientist
Agregar gràfica o foto
Page 16: Webinar: "Datos no Estructurados" en TIBCO Spotfire

¿ Por qué Tibco Spotfire es la mejor elección para manejar sus datos no estructurados?

Spotfire permite conectarse a múltiples fuentes de datos, entre ellas, la gran mayoría de plataformas NoSQL.

Spotfire integra la capacidad analítica de R, Matlab y/o SAS con la potencia de visualización de Tibco.

Con Spotfire se pueden obtener nuevas reglas de negocio a partir de información no estructurada.

Spotfire tiene desarrollo nativo para conexiones y analítica en ecosistemas Big Data.

Spotfire es escalable.

Page 17: Webinar: "Datos no Estructurados" en TIBCO Spotfire

DEMOSTRACIÓN

Análisis de audio (Servicio al cliente)

TextMinning

Page 18: Webinar: "Datos no Estructurados" en TIBCO Spotfire

Sesión de Preguntas

Page 19: Webinar: "Datos no Estructurados" en TIBCO Spotfire

Contáctenos

Colombia: + 57 4 448 71 41 / + 57 1 482 44 40 México: 01 8000 990 343 - Chile: + 56 2 293 80 533

www-it-nova.co

Carlos Maríncarlos.marin@it-

nova.coTel 57 3156483049

John [email protected] 57 3167412231

it-nova @it_nova itnovaco it_nova