Curso: Guía de contenidos Aplicaciones específicas Data

Preview:

Citation preview

Introducción a Modeler• Metodología CRISP-DM• Exploración del software

Extracción y carga de datos• Lectura de datos en formato Statistics, Excel, archivos de texto y bases de datos• Exploración de datos hacia archivos planos delimitados, de ancho fijo, Excel y bases de datos

Calidad de datos• Definición de tipos y medidas• Valores nulos• Valores atípicos y extremos• Tratamiento de casos

Manipulación de datos• Cálculo de variables• Variables agregadas• Reestructuración de datos• Operaciones con fechas, cadenas y números• Creación de intervalos• Estructuras de control• Operaciones secuenciales• Casos duplicados• Histograma y distribución• Caché de nodos• SQL Pushback

Parámetros de flujos• Configuración de parámetros• Aplicación de parámetros

Curso: Guía de contenidos

Aplicaciones específicas

Data Mining: Manipulación y Modelos

Encapsulamiento de procesos• Tipos de supernodos• Supernodos con parámetros

Automatización• Ejecución batch desatendida• Encriptación de contraseñas• Scripting de flujos con Python• Ejemplos de integración con R

Preparación de datos• Selección de casos• Transformaciones de datos• Variables predictoras y objetivo• Creación de particiones• Selección de predictores• Roles de variables

Algoritmos analíticos• K-medias• Árbol de decisión CHAID• Regresión logística

Medidas de evaluación• Gráficos de ganancia y ROC• Evaluación por KS y Gini• Estabilidad de la población

Carga horaria 20 horas

BeSmart ArgentinaMontañeses 2180 4° piso • Buenos Aires

(+54 11) 4784 2001 • cursos@besmart.com.ar

BeSmart ChileMardoqueo Fernández 207 • Providencia • Santiago

(+56 2) 2415 3478 • cursos@besmart.cl

Recommended