16
UNIVERSIDAD POLITECNICA DE TLAXCALA PROFESOR: DR. PEDRO AARÓN HERNÁNDEZ AVALOS MATERIA: MINERÍA DE DATOS CUATRIMESTRE: OCTAVO ALUMNO: EDUARDO PALMA GONZÁLEZ

Técnicas mineria de datos

  • Upload
    lalopg

  • View
    83

  • Download
    0

Embed Size (px)

Citation preview

UNIVERSIDAD POLITECNICA DE

TLAXCALA

PROFESOR: DR. PEDRO AARÓN HERNÁNDEZ AVALOS

MATERIA: MINERÍA DE DATOS

CUATRIMESTRE: OCTAVO

ALUMNO: EDUARDO PALMA GONZÁLEZ

MINERÍA DE DATOS

Minería de datos es el conjunto de técnicas y

tecnologías que permiten explorar grandes

bases de datos, que intenta descubrir

patrones en grandes volúmenes de

conjuntos de datos.

MÉTODOS QUE UTILIZA DATAMINING

Inteligencia artificial

Aprendizaje automático

Estadística

Sistemas de bases de datos.

ETAPAS

Determinación de los objetivos. Trata de ladelimitación de los objetivos que el clientedesea bajo la orientación del especialista enminería de datos.

Preprocesamiento de los datos. Se refiere ala selección, la limpieza, el enriquecimiento, lareducción y la transformación de las bases dedatos. Esta etapa consume generalmentealrededor del setenta por ciento del tiempototal de un proyecto de minería de datos.

Determinación del modelo. Se comienzarealizando unos análisis estadísticos de los datos, ydespués se lleva a cabo una visualización gráficade los mismos para tener una primeraaproximación. Según los objetivos planteados y latarea que debe llevarse a cabo, pueden utilizarsealgoritmos desarrollados en diferentes áreas de laInteligencia Artificial.

Análisis de los resultados. Verifica si losresultados obtenidos son coherentes y los cotejacon los obtenidos por los análisis estadísticos y devisualización gráfica. El cliente determina si sonnovedosos y si le aportan un nuevo conocimientoque le permita considerar sus decisiones.

LAS TÉCNICAS

+ Redes Neuronales.

+ Regresión Lineal.

+ Árboles de Decisión.

+ Modelos Estadísticos.

+ Reglas de Asociación.

REDES NEURONALES

Es un paradigma de aprendizaje y

procesamiento automático. Trata de un

sistema de interconexión de neuronas que

colaboran entre sí para producir un estímulo

de salida.

ÁRBOL DE DECISIÓN

Son representaciones

gráficas y analíticas de

datos ya establecidos

mediante una base de datos.

Ayuda en la toma de

decisiones, desde un punto

de vista probabilístico,

con el fin de obtener la opción

que mejor convenga.

REGRESIÓN LINEAL

Es la más utilizada para formar relaciones

entre datos.

Rápida y eficaz pero insuficiente en

espacios multidimensionales donde

puedan relacionarse más de 2 variables.

MARKET BASKET ANALYSIS

Permite detectar que productos se

adquieren conjuntamente, permite

incorporar variables técnicas que ayudan

en la interpretación.

TÉCNICAS DE CLUSTERING

Son técnicas que parten de una medida de

proximidad entre individuos y a partir de

ahí, buscar los grupos de individuos más

parecidos entre sí, según una serie de

variables mesuradas.

REDES BAYESIANAS

Consiste en representar todos los posibles

sucesos en que estamos interesados

mediante un grafo de probabilidades

condicionales de transición entre sucesos.

MODELOS LINEALES GENERALIZADOS

Son modelos que permiten tratar diferentes

tipos de variables de respuesta, por

ejemplo la preferencia entre productos

concurrentes en el mercado.

PREVISIÓN LOCAL

La idea de base es que individuos

parecidos tendrán comportamientos

similares respecto de una cierta variable de

respuesta.

REFERENCIAS

http://tecnicasmd.blogspot.mx/2015/04/tecnic

as-de-mineria-de-datos.html

http://es.slideshare.net/jorgeklz1/apriori-

algoritmo-reglas-de-asociacion-datamining-

mineria-datos-soporte-confianza

http://www.dynamics.unam.edu/DinamicaNo

Lineal/Articulos/MineriaRedesNVacunas.pdf