12
ÁRBOLES DE CLASIFICACIÓN WEKA 3.6.0

ARBOLES DE CLASIFICACION

Embed Size (px)

Citation preview

Page 1: ARBOLES DE CLASIFICACION

ÁRBOLES DE CLASIFICACIÓN

WEKA 3.6.0

Page 2: ARBOLES DE CLASIFICACION

Weka 3.6.0

Esta herramienta de software libre trabaja sobre una plataforma Java, por lo cual requiere el jre para funcionar correctamente.

Principales características o funcionalidades: Gran aporte a la minería de datos ya que permite

analizar los datos fácilmente, mostrando de una manera muy gráfica la correlación existente entre ellos.

Algoritmos y árboles entre otras técnicas utilizadas en inteligencia artificial para clasificación de datos.

Page 3: ARBOLES DE CLASIFICACION

Árboles de Clasificación

En este caso se presenta un ejemplo de la utilidad de Weka en el tema de árboles de clasificación, donde dado un conjunto de datos de entrenamiento se podrá predecir y asignar una clase específica a un nuevo registro.

El entorno del problema es el siguiente:

Se debe predecir cuál es la medicina o fármaco ideal para administrar a nuevos pacientes, cuyo historial clínico presenta las siguientes variables:

Page 4: ARBOLES DE CLASIFICACION

Edad (Age) Sexo (Sex) Tensión Sanguínea (BP) Nivel de colesterol (Cholesterol) Nivel de sodio en la sangre (Na) Nivel de potasio en la sangre (K)

Para los cuales se presentan cinco posibles medicinas: DrugA, DrugB, DrugC, DrugX, DrugY

Una vez conocido el problema, en la herramienta haremos lo siguiente:

1. Se escoge la opción Explorer en la primera ventana que aparece al abrir el programa.

2. Bajo la etiqueta Preprocess, hacer clic en el botón Open File… y escoger un archivo de tipo *.arff

Árboles de Clasificación

Page 5: ARBOLES DE CLASIFICACION

Árboles de Clasificación

3. Se visualiza una tabla con las variables y sus atributos respectivos. Se presenta además la opción para eliminar variables antes de la clasificación.

Page 6: ARBOLES DE CLASIFICACION

4. Nos ubicamos en la pestaña Classify y escogemos uno de los clasificadores mostrados, en este caso se utiliza el algoritmo J48

Árboles de Clasificación

Page 7: ARBOLES DE CLASIFICACION

5. Se muestra un informe como resumen de la clasificación generada según los datos de entrenamiento.

Árboles de Clasificación

Page 8: ARBOLES DE CLASIFICACION

En la pestaña Visualize se

puede observar una matriz de

correspondencia entre variables, lo cual nos permitirá

analizar la relación de

dependencia existente entre

ellas.

Árboles de Clasificación

Page 9: ARBOLES DE CLASIFICACION

En este ejemplo se observa a detalle la relación entre la edad de los pacientes y la medicina administrada a cada uno de ellos.

Árboles de Clasificación

Page 10: ARBOLES DE CLASIFICACION

Finalmente se escoge la opción visualizar el árbol desde la lista de resultados

Árboles de Clasificación

Page 11: ARBOLES DE CLASIFICACION

Conclusiones

Según los resultados mostrados gráficamente en la figura anterior se puede analizar una secuencia de reglas que permitirán decidir rápidamente el fármaco a administrar a cada paciente según el diagnóstico presentado.

La organización jerárquica de las variables ayudan también a ahorrar tiempo con preguntas innecesarias al paciente según los resultados que vaya presentando por cada variable.

Page 12: ARBOLES DE CLASIFICACION

UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA

Escuela de Ciencias de la ComputaciónInteligencia Artificial Avanzada

María Gabriela Vivanco [email protected]