10
1 Data no Estructurada Recuperación de datos no estructurados Curso:

Curso - dmc.pe · decisiones. En este contexto, desde hace algunos años se vienen desarrollando nuevos algoritmos y técnicas inteligentes para el análisis de los datos no estructurados

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 2: Curso - dmc.pe · decisiones. En este contexto, desde hace algunos años se vienen desarrollando nuevos algoritmos y técnicas inteligentes para el análisis de los datos no estructurados

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

2

En la actualidad la tecnología juega un papel muy importante en el día a día de las personas y se ha convertido en una herramienta sumamente importante para las empresas en la toma de decisiones. Por un lado, las personas generamos cada vez más grandes volúmenes de información a través, por ejemplo, de las redes sociales (Facebook, Twitter, LinkedIn, etc.); por otro lado, las empresas necesitan de nuevas herramientas inteligentes que sean capaces de procesar toda esta información y producir datos relevantes para la toma de decisiones. En este contexto, desde hace algunos años se vienen desarrollando nuevos algoritmos y técnicas inteligentes para el análisis de los datos no estructurados.

Este curso se desarrolla de manera teórica-práctica y abarca las principales técnicas de análisis de datos no estructurados, desde su recolección, pasando por el tratamiento de datos no estructurados, hasta la aplicación de técnicas de machine learning para generar conocimiento a partir de estos datos.

Presentación

9 Especialistas, analistas, jefes de proyecto, personal de instituciones involucrados en el diseño, desarrollo de modelos predictivos y que interactúan con datos no estructurados.

9 Profesionales de áreas de inteligencia comercial, inteligencia de clientes, business intelligence, etc. 9 Personal de bancos, financieras, cajas municipales, Edpymes, cajas rurales, cooperativas, etc. 9 Administradores de riesgos y especialistas en modelos, público en general.

Dirigido a:

Conocimientos básicos de machine learning, estadística, base de datos y programación básica. Para la aplicación del curso se utilizará la herramienta Python, por lo cual se debe tener conocimientos prácticos de la misma.

Pre-requisitos:

Page 3: Curso - dmc.pe · decisiones. En este contexto, desde hace algunos años se vienen desarrollando nuevos algoritmos y técnicas inteligentes para el análisis de los datos no estructurados

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

3

Metodología

Objetivos

Nuestra metodología es Learning by Doing. El aprendizaje que proponemos se basa en la práctica y el desarrollo de casos reales. El analítico aprende mejor en la práctica y solucionando casos, los cuales son tomados de las experiencias del medio local e internacional.

Para eso, se dispone de lo siguientes herramientas:• Base de datos de prueba para aplicar lo aprendido.• Casos de aplicación, situaciones reales con aplicación en el mercado peruano e

internacional.• Material didáctico con el desarrollo del curso.• Una PC por participante.

9 Entender qué son datos estructurados y datos no estructurados. 9 Comprender los aspectos más importantes de la recuperación de datos no

Estructurados. 9 Manejar la representación vectorial de ratos no estructurados. 9 Aplicar las técnicas de clustering y clasificación para el análisis de datos no

estructurados.

Page 4: Curso - dmc.pe · decisiones. En este contexto, desde hace algunos años se vienen desarrollando nuevos algoritmos y técnicas inteligentes para el análisis de los datos no estructurados

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

4

Beneficios 9 Certificado de Especialización. 9 Pertenecer a la comunidad más grande de profesionales de business analytics. 9 Plana docente compuesta por líderes del sector, especializados en herramientas y temas a

desarrollar. 9 Descuentos en programas complementarios. 9 Laboratorios de cómputo. 9 Material didáctico con el desarrollo del curso. 9 Acceso a bibliografía especializada. 9 Acceso a la bolsa de trabajo especializada de DMC.

• Rentabilidad única en el mercado laboral.• Desarrollo de pensamiento crítico y analítico.• Serás un profesional muy valorado en la actualidad.

Las empresas actuales están buscando profesionales que se diferencien en la gestión.Las ventajas competitivas que obtienes al estar en constante capacitación son muchas,entre las que destacamos:

Page 5: Curso - dmc.pe · decisiones. En este contexto, desde hace algunos años se vienen desarrollando nuevos algoritmos y técnicas inteligentes para el análisis de los datos no estructurados

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

5

Syllabus

I. Preliminares: -Objetivos:• Entender qué son datos estructurados y datos no estructurados.• Conocer cuáles son las principales fuentes de información. -Temario:• Introducción a datos no estructurados.• Base de datos no estructuradas.• Fuentes de Información de datos no estructurados.

II. Recuperación de datos no estructurados: -Objetivos:• Identificar las principales técnicas para recuperar información.• Entender el funcionamiento de las técnicas de scraping. -Temario:• Principales técnicas de recuperación de datos no estructurados.• Web scraping (horizontal/vertical).• Scraping en redes sociales.• Programación para la recuperación de datos no estructurados.

III. Representación vectorial de datos no estructurados (text mining) I: -Objetivos:• Conocer cómo encontrar padrones en datos no

estructurados.• Entender las principales técnicas de limpieza de datos. -Temario:• Text mining.• Limpieza de datos (regular expression).• TF-IDF.• Programación para extraer características de datos textuales.

IV. Representación vectorial de datos no estructurados (text mining) II: -Objetivos:• Conocer cuáles son las técnicas de machine learning para representar datos.• Entender el funcionamiento de word2vec. -Temario:• Machine learning en la representación de datos no estructurados.• Word2Vec.• Programación.

V. Clustering de datos no estructurados: -Objetivos:• Entender las técnicas de clustering para el análisis de datos no estructurados.• Distinguir problemas de machine learning. -Temario:• Métodos no supervisados en machine learning.

Page 6: Curso - dmc.pe · decisiones. En este contexto, desde hace algunos años se vienen desarrollando nuevos algoritmos y técnicas inteligentes para el análisis de los datos no estructurados

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

6

InstructorIng. Dennis Barreda

Más de 7 años de experiencia como científico de datos en sectores de banca y telefonía. Bch. en Ciencias de la Computación, con fuertes habilidades de programación. Alta adaptabilidad a diferentes idiomas, conocimientos en C ++, C #

.Net, Visual Basic .Net, R y actualmente desarrolla en Python. Disfruta trabajando con datos, haciendo modelos predictivos, leyendo sobre el estado del arte del aprendizaje automático.

• K-means.• Clustering de datos no estructurados.• Aplicaciones (segmentación inteligente).

VI. Clasificación de datos no estructurados: -Objetivos:• Entender las técnicas de clasificación para el análisis de datos no estructurados.• Entender el algoritmo KNN y SVM. -Temario:• Métodos supervisados en machine learning.• Algoritmos: KNN - support vector machines (SVM).• Clasificación de datos no estructurados.• Aplicaciones (análisis de sentimientos).

Page 7: Curso - dmc.pe · decisiones. En este contexto, desde hace algunos años se vienen desarrollando nuevos algoritmos y técnicas inteligentes para el análisis de los datos no estructurados

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

7

Medios de pago

1. Depósito en las cuentas BBVA o BCP:

N° Cuenta de Ahorros: 0011-0177-02-00180473

N° Cuenta de Corriente: 193-2251181-0-01

3. Oficina DMC

2. Pago Online:

Dirección: Calle Río de la Plata 167, Of. 203. San Isidro. Lima - Perú.

Horario de atención:De lunes a viernes de 9:00 a.m. a 7:00 p.m. y sábados de 9:00 a.m. a 4:00 p.m.

Razón Social

R.U.C

J&J Data Mining Consulting S.A.C

20520972740

Page 8: Curso - dmc.pe · decisiones. En este contexto, desde hace algunos años se vienen desarrollando nuevos algoritmos y técnicas inteligentes para el análisis de los datos no estructurados

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

8

CertificadoCertificación otorgada a nombre de DMC Perú, empresa de capacitación en herramientas analíticas del Perú.

9 Certificado de especialización

¿Cómo obtengo mi certificado de especialización?

Al finalizar el curso el capacitador evaluará a los participantes con un caso aplicativo: 9 La nota mínima requerida es (14) catorce. 9 Asistencia mínima del 80% en todo el curvso.

Page 9: Curso - dmc.pe · decisiones. En este contexto, desde hace algunos años se vienen desarrollando nuevos algoritmos y técnicas inteligentes para el análisis de los datos no estructurados

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

9

DMC PerúDMC es una empresa pionera dedicada a la extracción de conocimiento desde grandes bases de datos, con más de 8 años experiencia en la capacitación de temas de Minería de Datos, Scoring de Riesgo Crediticio, Business Intelligence, Técnicas de segmentación, Business Analytics y Big Data. DMC es la única empresa peruana reconocida como uno de los referentes de capacitación en temas de Big Data.

Algunas empresas que confiaron en nosotros:

Page 10: Curso - dmc.pe · decisiones. En este contexto, desde hace algunos años se vienen desarrollando nuevos algoritmos y técnicas inteligentes para el análisis de los datos no estructurados

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

10

Contacto

Email: [email protected] / [email protected]: www.dmc.peTeléfono: (511) 253-5066Móvil: 995900126 / 975491764 Dirección: Calle Río de la Plata 16, Of. 203. San Isidro. Lima - Perú.De lunes a viernes de 9:00 a.m. a 7:00 p.m. y sábados de 9:00 a.m. a 4:00 p.m.