20
Introducción a Weka Colección de algoritmos y herramientas de machine learning para minería de datos. Christian Fernando Ariza Porras http://www.christian- ariza.net [email protected].

Introducción a weka

Embed Size (px)

DESCRIPTION

Pequeña introducción al laboratorio de Weka, para el curso BigData Analytics de la Universidad de los Andes, usando un ejemplo de clasificación de texto.

Citation preview

Page 1: Introducción a weka

Introducción a Weka

Colección de algoritmos y herramientas de machine learning para minería de datos.

Christian Fernando Ariza Porrashttp://[email protected]@cronosnull

Page 2: Introducción a weka

Descarga:

http://www.cs.waikato.ac.nz/ml/weka/index.html

Page 3: Introducción a weka

Interfaz de usuario

Page 4: Introducción a weka

Explorer

Page 5: Introducción a weka

Experimenter

Page 6: Introducción a weka

Knowledge Flow

Page 7: Introducción a weka

Command Line Interface

Page 8: Introducción a weka

CLASIFICACIÓN DE TEXTOEjemplo práctico

Page 9: Introducción a weka

Cargar los datos

• Antes de poder entrenar el clasificado necesitamos llevar los datos a un formato adecuado.

• Utilizamos la pestaña preprocess de la interfaz experimenter.

• Weka admite formatos y fuentes variadas.

Page 10: Introducción a weka

Importar un directorio

• Cada subdirectorio corresponde a una categoría.

• Cada archivo corresponde a una instancia.

Page 11: Introducción a weka

Importar un directorio

• Cada subdirectorio corresponde a una categoría.

• Cada archivo corresponde a una instancia.

Page 12: Introducción a weka

Transformar los datos

Page 13: Introducción a weka

Transformar los datos: Filtros

Page 14: Introducción a weka

Transformar los datos: Filtros

Page 15: Introducción a weka

Transformar los datos: Filtros

Page 16: Introducción a weka

Entrenar y validar un clasificador

Page 17: Introducción a weka

Entrenar y validar un clasificador

Page 18: Introducción a weka

Cross Validation

• Técnica para estimar el desempeño de un predictor en un data set independiente.

Imagen tomada de: http://chrisjmccormick.wordpress.com/2013/07/31/k-fold-cross-validation-with-matlab-code/

Page 19: Introducción a weka

Precision y Recall

• True positive (TP)• False positive (FP)• True Negative (TN)• False Negative (FN)

• Precision: TP/(TP+FP)

• Recall: TP/(TP+FN)

Page 20: Introducción a weka

Usar el modelo entrenado en una aplicación externa.