13
BENÉMERITA UNIVERSIDAD AUTÓNOMA DE PUEBLA VICERRECTORÍA DE DOCENCIA DIRECCIÓN GENERAL DE EDUCACIÓN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIÓN Programa de Asignatura: “Minería de Datos” 1 Programa Educativo (PE): Ingeniería en Ciencias de la Computación Área: Tecnología Programa de Asignatura: Minería de Datos Código: CCOM-606 Créditos: 5 Fecha: Julio de 2009

MINERIA DE DATOS ING - secreacademica.cs.buap.mx · modelos, técnicas y herramientas de la fase de Minería de Datos. 5.3. Específicos: Que el alumno sea capaz de. 1. Situar los

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: MINERIA DE DATOS ING - secreacademica.cs.buap.mx · modelos, técnicas y herramientas de la fase de Minería de Datos. 5.3. Específicos: Que el alumno sea capaz de. 1. Situar los

BENÉMERITA UNIVERSIDAD AUTÓNOMA DE PUEBLA VICERRECTORÍA DE DOCENCIA

DIRECCIÓN GENERAL DE EDUCACIÓN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIÓN

Programa de Asignatura: “Minería de Datos”

1

Programa Educativo (PE):

Ingeniería en Ciencias de la Computación

Área: Tecnología

Programa de Asignatura: Minería de Datos

Código: CCOM-606

Créditos: 5

Fecha: Julio de 2009

Page 2: MINERIA DE DATOS ING - secreacademica.cs.buap.mx · modelos, técnicas y herramientas de la fase de Minería de Datos. 5.3. Específicos: Que el alumno sea capaz de. 1. Situar los

BENÉMERITA UNIVERSIDAD AUTÓNOMA DE PUEBLA VICERRECTORÍA DE DOCENCIA

DIRECCIÓN GENERAL DE EDUCACIÓN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIÓN

Programa de Asignatura: “Minería de Datos”

2

1. DATOS GENERALES Nivel Educativo: Licenciatura Nombre del Programa Educativo: Licenciatura en Ciencias de la Computación Modalidad Académica: Mixta Nombre de la Asignatura: Minería de Datos Ubicación: Nivel Formativo Correlación: Asignaturas Precedentes: Bases de Datos Asignaturas Consecuentes: Sin Consecuente

Conocimientos, habilidades, actitudes y valores previos:

Conocimientos: Bases de Datos, Probabilidad y Estadística. Habilidades: Abstraer, Modelar, Experimentar, Interpretar resultados, Correlacionar y aplicar conocimientos previos. Actitudes y valores previos: Actitud favorable para el trabajo multidisciplinario y en equipo, tolerancia para realizar pruebas no siempre exitosas. De respeto y empatía con las personas.

2. CARGA HORARIA DEL ESTUDIANTE

Concepto Horas por periodo Numero de créditos

Horas teoría y práctica 80 5

Horas de práctica profesional crítica

Horas de trabajo independiente

Total 80 5

Page 3: MINERIA DE DATOS ING - secreacademica.cs.buap.mx · modelos, técnicas y herramientas de la fase de Minería de Datos. 5.3. Específicos: Que el alumno sea capaz de. 1. Situar los

BENÉMERITA UNIVERSIDAD AUTÓNOMA DE PUEBLA VICERRECTORÍA DE DOCENCIA

DIRECCIÓN GENERAL DE EDUCACIÓN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIÓN

Programa de Asignatura: “Minería de Datos”

3

3. REVISIONES Y ACTUALIZACIONES

Autores:

Ma. del Rocío Boone Rojas (Coord. Responsable de Prog. de Asignatura) María J. Somodevilla García. Marco Antonio Soriano Ulloa David E. Pinto Avendaño.

Fecha de diseño: Julio 16, 2009 Fecha de la última actualización: Julio 16, 2009

Revisores:

ACADEMIA DEL ÁREA DE BASES DE DATOS E ING. DE SOFTWARE: AMBROSIO VÁZQUEZ ALMA DELIA BOONE ROJAS MARIA DEL ROCIO DE LA ROSA FLORES RAFAEL MARÍN DORADO GUILLERMO MOLINA GARCIA MARÍA DEL CONSUELO PÉREZ DE CELIS HERRERO MARÍA DE LA CONCEPCIÓN PINTO AVENDAÑO DAVID SOMODEVILLA  GARCÍA MARÍA JOSEFA SORIANO ULLOA MARCO ANTONIO

Sinopsis de la revisión y/o actualización

Esta asignatura fue creada por la necesidad de incorporar un campo de investigación emergente de las Ciencias de la Computación, que permitirá al alumno conocer los modelos, técnicas y herramientas para la extracción de conocimiento de los datos, útil para el análisis y toma de decisiones.

4. PERFIL DESEABLE DEL PROFESOR (A) PARA IMPARTIR LA ASIGNATURA: Disciplina Profesional: Ciencias de la Computación.

Nivel Académico: Maestría

Experiencia Docente: 6 años

Experiencia Profesional: 5 años

Page 4: MINERIA DE DATOS ING - secreacademica.cs.buap.mx · modelos, técnicas y herramientas de la fase de Minería de Datos. 5.3. Específicos: Que el alumno sea capaz de. 1. Situar los

BENÉMERITA UNIVERSIDAD AUTÓNOMA DE PUEBLA VICERRECTORÍA DE DOCENCIA

DIRECCIÓN GENERAL DE EDUCACIÓN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIÓN

Programa de Asignatura: “Minería de Datos”

4

5. OBJETIVOS: 5.1 Educacional: El estudiante resolverá problemas con un enfoque metodológico, utilizando técnicas y herramientas computacionales.

5.2. General: Que el alumno sea capaz de resolver problemas que involucren un proceso de Extracción de Conocimiento. En particular, que utilice

modelos, técnicas y herramientas de la fase de Minería de Datos.

5.3. Específicos: Que el alumno sea capaz de.

1. Situar los antecedentes, el concepto de Minería de Datos, Problemas, tipos de datos y modelos a los que se aplica, su relación con otras

disciplinas y ámbitos de aplicación.

2. Identificar las nociones básicas de cada una de las fases del proceso de Descubrimiento de Conocimiento en Bases de Datos

(Knowledge Discovery from Databases, KDD).

3. Identificar y aplicar metodologías y técnicas asociadas a la primera fase del KDD, llamada de integración y recopilación, y realizar algunas

consideraciones sobre las fases de limpieza y transformación y de exploración y selección de datos.

4. Identificar y aplicar las principales técnicas para resolver problemas de Minería de datos, así como la forma de expresar su resultado.

5. Conocer las características y experimentar las facilidades básicas de alguna herramienta para la Minería de Datos.

6. Analizar alguna aplicación de la Minería de Datos e identificar cada una de las fases del proceso de KDD asociado a la aplicación.

6. MAPA CONCEPTUAL DE LA ASIGNATURA:

Page 5: MINERIA DE DATOS ING - secreacademica.cs.buap.mx · modelos, técnicas y herramientas de la fase de Minería de Datos. 5.3. Específicos: Que el alumno sea capaz de. 1. Situar los

BENÉMERITA UNIVERSIDAD AUTÓNOMA DE PUEBLA VICERRECTORÍA DE DOCENCIA

DIRECCIÓN GENERAL DE EDUCACIÓN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIÓN

Programa de Asignatura: “Minería de Datos”

5

Page 6: MINERIA DE DATOS ING - secreacademica.cs.buap.mx · modelos, técnicas y herramientas de la fase de Minería de Datos. 5.3. Específicos: Que el alumno sea capaz de. 1. Situar los

BENÉMERITA UNIVERSIDAD AUTÓNOMA DE PUEBLA VICERRECTORÍA DE DOCENCIA

DIRECCIÓN GENERAL DE EDUCACIÓN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIÓN

Programa de Asignatura: “Minería de Datos”

6

7. CONTENIDO

Unidad Objetivo Específico

Contenido Temático/Actividades

de aprendizaje

Bibliografía

Básica Complementaria

1. Introducción.

Conocer los antecedentes, el concepto de Minería de Datos, Problemas, tipos de datos y modelos a los que se aplica, su relación con otras disciplinas y sus ámbitos de aplicación.

1.1 Antecedentes y el Concepto de Minería de Datos. 1.2 Ejemplos de problemas de aplicación. 1.3 Tipos de Datos. 1.3.1 Estructurados. 1.3.2 Complejos o Heterogéneos. 1.4 Tipos de Modelos. 1.5 La minería de datos y el KDD. 1.6 Relación con otras Disciplinas. 1.7 Ámbitos de Aplicación.

José Hernández Orallo, M.José Ramírez Quintana, César Ferri Ramírez, Introducción a la Minería de Datos, Editorial Pearson, ISBN: 84 205 4091 9, 2004 Ian Witten and Eibe Frank, Data Mining: Practical Machine Learning Tools and Techniques, 2nd Edition, Morgan Kaufmann, ISBN 0120884070, 2005.

Jiawei Han, Micheline Kamber, Data Mining : Concepts and Techniques, 2nd edition, Morgan Kaufmann, ISBN 1558609016, 2006. K. Cios, W. Pedrycz, R. Swiniarski, L. Kurgan, Data Mining: A Knowledge Discovery Approach, Springer, ISBN: 978-0-387-33333-5, 2007.

2. El Proceso de KDD.

Proporcionar las nociones básicas de cada una de las fases del proceso de Descubrimiento de Conocimiento en Bases de Datos (Knowledge Discovery from Databases, KDD).

3.1 Las Fases del Proceso de Extracción de Conocimiento. 3.2 Fase de Integración y Recopilación. 3.3 Fase de Selección, Limpieza y Transformación. 3.4 Fase de Minería de Datos.

José Hernández Orallo, M. José Ramírez Quintana, César Ferri Ramírez, Introducción a la Minería de Datos, Editorial Pearson, ISBN: 84 205 4091 9, 2004 Ian Witten and Eibe Frank, Data Mining:

Jiawei Han, Micheline Kamber, Data Mining: Concepts and Techniques, 2nd edition, Morgan Kaufmann, ISBN 1558609016, 2006. K. Cios, W. Pedrycz, R. Swiniarski, L. Kurgan, Data Mining: A

Page 7: MINERIA DE DATOS ING - secreacademica.cs.buap.mx · modelos, técnicas y herramientas de la fase de Minería de Datos. 5.3. Específicos: Que el alumno sea capaz de. 1. Situar los

BENÉMERITA UNIVERSIDAD AUTÓNOMA DE PUEBLA VICERRECTORÍA DE DOCENCIA

DIRECCIÓN GENERAL DE EDUCACIÓN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIÓN

Programa de Asignatura: “Minería de Datos”

7

Unidad Objetivo Contenido Bibliografía 3.5 Fase de Evaluación

e Interpretación. 3.6 Fase de Difusión, Uso y Monitorización.

Practical Machine Learning Tools and Techniques, 2nd Edition, Morgan Kaufmann, ISBN 0120884070, 2005.

Knowledge Discovery Approach, Springer, ISBN: 978-0-387-33333-5, 2007.

3. Preparación de Datos.

Estudiar e identificar las metodologías y técnicas asociadas a la primera fase del KDD, llamada de integración y recopilación, y realizar algunas consideraciones sobre las fases de limpieza y transformación y de exploración y selección de datos.

Antecedentes de las bodegas de datos. OLTP y OLAP. Arquitecturas de las bodegas de datos. Implementación, Operación y Mantenimiento de una bodega de datos. Consideraciones sobre la fase de limpieza y transformación. Valores anómalos, valores faltantes. Consideraciones sobre la fase de exploración y selección.

José Hernández Orallo, M. José Ramírez Quintana, César Ferri Ramírez, Introducción a la Minería de Datos, Editorial Pearson, ISBN: 84 205 4091 9, 2004 Ian Witten and Eibe Frank, Data Mining: Practical Machine Learning Tools and Techniques, 2nd Edition, Morgan Kaufmann, ISBN 0120884070, 2005.

Jiawei Han, Micheline Kamber, Data Mining: Concepts and Techniques, 2nd edition, Morgan Kaufmann, ISBN 1558609016, 2006. K. Cios, W. Pedrycz, R. Swiniarski, L. Kurgan, Data Mining: A Knowledge Discovery Approach, Springer, ISBN: 978-0-387-33333-5, 2007.

4. Técnicas de

Minería de Datos.

Identificar técnicas representativas para realizar tareas que permiten la generación de modelos predictivos y/o descriptivos.

4.1 Reglas de Asociación. A priori. 4.2 Árboles de Decisión. 4.3 Naive Bayes 4.4 Regresión Lineal y Logarítmica. 4.5 Agrupamiento. K-means. 4.6 Redes Neuronales.

José Hernández Orallo, M. José Ramírez Quintana, César Ferri Ramírez, Introducción a la Minería de Datos, Editorial Pearson, ISBN: 84 205 4091 9, 2004 Ian Witten and Eibe Frank, Data Mining: Practical Machine

Jiawei Han, Micheline Kamber, Data Mining: Concepts and Techniques, 2nd edition, Morgan Kaufmann, ISBN 1558609016, 2006. K. Cios, W. Pedrycz, R. Swiniarski, L. Kurgan, Data Mining: A Knowledge Discovery

Page 8: MINERIA DE DATOS ING - secreacademica.cs.buap.mx · modelos, técnicas y herramientas de la fase de Minería de Datos. 5.3. Específicos: Que el alumno sea capaz de. 1. Situar los

BENÉMERITA UNIVERSIDAD AUTÓNOMA DE PUEBLA VICERRECTORÍA DE DOCENCIA

DIRECCIÓN GENERAL DE EDUCACIÓN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIÓN

Programa de Asignatura: “Minería de Datos”

8

Unidad Objetivo Contenido Bibliografía

5. Herramientas.

Conocer las características y experimentar las facilidades de alguna herramienta para la Minería de Datos. Caso de Estudio: Weka.

5.1 Entorno de Trabajo de Weka. 5.2 Archivos arff. 5.3 Explorer. 5.4 Ejemplos.

Learning Tools and Techniques, 2nd Edition, Morgan Kaufmann, ISBN 0120884070, 2005. José Hernández Orallo, M. José Ramírez Quintana, César Ferri Ramírez, Introducción a la Minería de Datos, Editorial Pearson, ISBN: 84 205 4091 9, 2004 Ian Witten and Eibe Frank, Data Mining: Practical Machine Learning Tools and Techniques, 2nd Edition, Morgan Kaufmann, ISBN 0120884070, 2005.

Approach, Springer, ISBN: 978-0-387-33333-5, 2007. Jiawei Han, Micheline Kamber, Data Mining: Concepts and Techniques, 2nd edition, Morgan Kaufmann, ISBN 1558609016, 2006. K. Cios, W. Pedrycz, R. Swiniarski, L. Kurgan, Data Mining: A Knowledge Discovery Approach, Springer, ISBN: 978-0-387-33333-5, 2007.

6. Aplicaciones.

Presentar y analizar una aplicación de Minería de Datos, en donde se revise cada una de sus fases del KDD.

1.1 Planteamiento del Problema. 1.2 Revisión de las fases del KDD para el problema planteado.

José Hernández Orallo, M. José Ramírez Quintana, César Ferri Ramírez, Introducción a la Minería de Datos, Editorial Pearson, ISBN: 84 205 4091 9, 2004 Ian Witten and Eibe Frank, Data Mining: Practical Machine Learning Tools and Techniques, 2nd

Jiawei Han, Micheline Kamber, Data Mining: Concepts and Techniques, 2nd edition, Morgan Kaufmann, ISBN 1558609016, 2006. K. Cios, W. Pedrycz, R. Swiniarski, L. Kurgan, Data Mining: A Knowledge Discovery Approach, Springer, ISBN: 978-0-387-

Page 9: MINERIA DE DATOS ING - secreacademica.cs.buap.mx · modelos, técnicas y herramientas de la fase de Minería de Datos. 5.3. Específicos: Que el alumno sea capaz de. 1. Situar los

BENÉMERITA UNIVERSIDAD AUTÓNOMA DE PUEBLA VICERRECTORÍA DE DOCENCIA

DIRECCIÓN GENERAL DE EDUCACIÓN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIÓN

Programa de Asignatura: “Minería de Datos”

9

Unidad Objetivo Contenido Bibliografía Edition, Morgan Kaufmann, ISBN 0120884070, 2005.

33333-5, 2007.

Page 10: MINERIA DE DATOS ING - secreacademica.cs.buap.mx · modelos, técnicas y herramientas de la fase de Minería de Datos. 5.3. Específicos: Que el alumno sea capaz de. 1. Situar los

BENÉMERITA UNIVERSIDAD AUTÓNOMA DE PUEBLA VICERRECTORÍA DE DOCENCIA

DIRECCIÓN GENERAL DE EDUCACIÓN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIÓN

Programa de Asignatura: “Minería de Datos”

10

8. CONTRIBUCIÓN DEL PROGRAMA DE ASIGNATURA AL PERFIL DE EGRESO

Unidad Perfil de egreso

Conocimientos Habilidades Actitudes y valores

1. Introducción.

De los antecedentes, el concepto de Minería de Datos, Problemas, tipos de datos y modelos a los que se aplica, su relación con otras disciplinas y ámbitos de aplicación.

Para identificar los antecedentes, el concepto de Minería de Datos, Problemas, tipos de datos y modelos a los que se aplica, su relación con otras disciplinas y ámbitos de aplicación.

Estará preparado para trabajar en equipo, emprender, liderar proyectos e incidir en la transformación sustentable de la realidad.

Será un profesional responsable, solidario, crítico, ético y comprometido con la sociedad y con el medio ambiente.

2. El Proceso de KDD.

De las nociones básicas de cada una de las fases del proceso de Descubrimiento de Conocimiento en Bases de Datos (Knowledge Discovery from Databases, KDD).

Para identificar cada una de las fases del proceso de KDD en la resolución de problemas.

Estará preparado para trabajar en equipo, emprender, liderar proyectos e incidir en la transformación sustentable de la realidad.

Será un profesional responsable, solidario, crítico, ético y comprometido con la sociedad y con el medio ambiente.

3. Preparación de Datos.

De las metodologías y técnicas asociadas a la primera fase del KDD, llamada de integración y recopilación, y realizar algunas consideraciones sobre las

Para identificar y aplicar las metodologías y técnicas necesarias para la preparación de los datos para la posible aplicación de una

Estará preparado para trabajar en equipo, emprender, liderar proyectos e incidir en la transformación

Page 11: MINERIA DE DATOS ING - secreacademica.cs.buap.mx · modelos, técnicas y herramientas de la fase de Minería de Datos. 5.3. Específicos: Que el alumno sea capaz de. 1. Situar los

BENÉMERITA UNIVERSIDAD AUTÓNOMA DE PUEBLA VICERRECTORÍA DE DOCENCIA

DIRECCIÓN GENERAL DE EDUCACIÓN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIÓN

Programa de Asignatura: “Minería de Datos”

11

Unidad Perfil de egreso

Conocimientos Habilidades Actitudes y valores fases de limpieza y transformación y de exploración y selección de datos para la posible aplicación de una técnica de Minería de Datos.

técnica de Minería de Datos. sustentable de la realidad.

Será un profesional responsable, solidario, crítico, ético y comprometido con la sociedad y con el medio ambiente.

4. Técnicas de Minería de Datos.

De las principales técnicas para resolver problemas de Minería de datos, así como la forma de expresar su resultado.

Para aplicar las técnicas de Minería de Datos más apropiadas en la resolución de problemas.

Estará preparado para trabajar en equipo, emprender, liderar proyectos e incidir en la transformación sustentable de la realidad.

Será un profesional responsable, solidario, crítico, ético y comprometido con la sociedad y con el medio ambiente.

5. Herramientas.

De las características y las facilidades básicas de alguna herramienta para la Minería de Datos.

Para manejar una herramienta de Minería de Datos como apoyo a la resolución de problemas.

Estará preparado para trabajar en equipo, emprender, liderar proyectos e incidir en la transformación sustentable de la realidad.

Será un profesional responsable, solidario, crítico, ético y comprometido con la sociedad y con el medio ambiente.

6. Aplicaciones.

De al menos una aplicación de la Minería de Datos y de cada una de las fases del proceso de KDD asociado a la misma.

Para interactuar con usuarios y especialistas de diversas áreas de conocimiento,

Estará preparado para trabajar en equipo, emprender, liderar proyectos

Page 12: MINERIA DE DATOS ING - secreacademica.cs.buap.mx · modelos, técnicas y herramientas de la fase de Minería de Datos. 5.3. Específicos: Que el alumno sea capaz de. 1. Situar los

BENÉMERITA UNIVERSIDAD AUTÓNOMA DE PUEBLA VICERRECTORÍA DE DOCENCIA

DIRECCIÓN GENERAL DE EDUCACIÓN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIÓN

Programa de Asignatura: “Minería de Datos”

12

Unidad Perfil de egreso

Conocimientos Habilidades Actitudes y valores entender sus necesidades y

proponer soluciones basadas en la aplicación de las metodologías y técnicas asociadas al proceso de KDD.

e incidir en la transformación sustentable de la realidad.

Será un profesional responsable, solidario, crítico, ético y comprometido con la sociedad y con el medio ambiente.

Page 13: MINERIA DE DATOS ING - secreacademica.cs.buap.mx · modelos, técnicas y herramientas de la fase de Minería de Datos. 5.3. Específicos: Que el alumno sea capaz de. 1. Situar los

BENÉMERITA UNIVERSIDAD AUTÓNOMA DE PUEBLA VICERRECTORÍA DE DOCENCIA

DIRECCIÓN GENERAL DE EDUCACIÓN SUPERIOR FACULTAD DE CIENCIAS DE LA COMPUTACIÓN

Programa de Asignatura: “Minería de Datos”

13

9. ORIENTACIÓN DIDÁCTICO-PEDAGÓGICA. Estrategias a-e Técnicas a-e Recursos didácticos

Estrategias de aprendizaje: Lectura y comprensión, Reflexión, Comparación, Resumen.

Estrategias de enseñanza: ABP, Aprendizaje activo, Aprendizaje cooperativo, Aprendizaje colaborativo, Basado en el

descubrimiento. Ambientes de aprendizaje:

Aula, Laboratorio, Simuladores.

Actividades y experiencias de aprendizaje:

Visita a diversos ámbitos de aplicación.

Técnicas grupales, de debate, del diálogo, de problemas, de estudio de casos, comparación, síntesis, lluvia de ideas, analogías, portafolio, exposición.

Materiales: Proyectores, TICs,

Plumón y pizarrón,

10. CRITERIOS DE EVALUACIÓN

Criterios Porcentaje Exámenes Parciales 30 Proyectos 40 Prácticas 20 Ejercicios 10

Total 100

11. REQUISITOS DE ACREDITACIÓN

El promedio de las calificaciones de los exámenes aplicados deberá ser igual o mayor que 6. Los proyectos son obligatorios. 80% mínimo de asistencia.