21

taller de informatica data minig

Embed Size (px)

DESCRIPTION

manejo de la informaciòn para toma deciciòn negocio

Citation preview

Page 1: taller de informatica data minig
Page 2: taller de informatica data minig

Conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos con

el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el

comportamiento de los datos en un determinado contexto.

De forma general, los datos son la materia prima bruta

En el momento que el usuario les atribuye algún significado especial pasan a

convertirse en información.

Page 3: taller de informatica data minig

EN EL PROCESO COMÚN SE DAN 4 ETAPAS:

•Determinación de los objetivos

•Pre procesamiento de los datos

•Determinación del modelo

•Análisis de los resultados

Las bases de la minería de datos se encuentra en la inteligencia artificial yen el análisis estadístico.

COMO:

Mediante los modelos extraídos, se aborda la solución a problemas depredicción, clasificación y segmentación.

Page 4: taller de informatica data minig

EL PROCESOPasos Generales:

Selección del conjunto de datos,

Análisis de las propiedades de los datos,

Transformación del conjunto de datos de entrada, (se realizará de diversas

formas en función del análisis previo)

Seleccionar y aplicar la técnica de minería de datos, se construye el

modelo predictivo, de clasificación o segmentación.

Extracción de conocimiento, mediante una técnica de minería de datos, se

obtiene un modelo de conocimiento.

Interpretación y evaluación de datos, obtenido el modelo, se debe proceder

a su validación comprobando que las conclusiones que arroja son válidas y

suficientemente satisfactorias.

Page 6: taller de informatica data minig

Negocios:

En lugar de contactar con el cliente de forma indiscriminada a través de un centro de

llamadas o enviando cartas, sólo se contactará con aquellos que se perciba que

tienen una mayor probabilidad de responder positivamente a una determinada oferta

o promoción.

Las empresas que emplean minería de datos ven rápidamente el retorno de la

inversión. Pero también reconocen que el número de modelos predictivos

desarrollados puede crecer muy rápidamente.

Hábitos de compra en supermercados :

El ejemplo clásico de aplicación de la minería de datos tiene que ver con la detección

de hábitos de compra en supermercados. Un estudio muy citado detectó que los

viernes había una cantidad inusualmente elevada de clientes que adquirían a la vez

pañales y cerveza.

Page 7: taller de informatica data minig

Patrones de fuga:

La banca, las telecomunicaciones, etc. — existe un comprensible interés en detectarcuanto antes aquellos clientes que puedan estar pensando en prescindir suscontratos para, posiblemente, pasarse a la competencia.

A estos clientes —y en función de su valor— se les podrían hacer ofertaspersonalizadas, ofrecer promociones especiales, etc., con el objetivo último deretenerlos. La minería de datos ayuda a determinar qué clientes son los más proclivesa darse de baja estudiando sus patrones de comportamiento y comparándolos conmuestras de clientes que, efectivamente, se dieron de baja en el pasado.

Page 8: taller de informatica data minig

Recursos humanos: Utilizado en la identificación de lascaracterísticas de sus empleados de mayor éxito. Además, lepermite mejorar el margen de beneficios o compartir objetivos; yen la mejora de las decisiones operativas, tales como desarrollo deplanes de producción o gestión de mano de obra.

Page 11: taller de informatica data minig

Empresas e instituciones han creado y alimentan bases de datos

especialmente diseñadas para proyectos de minería de datos en las que

centralizan información potencialmente útil de todas sus áreas de negocio.

Si ninguno de los modelos alcanza los resultados esperados,debe alterarse alguno de los pasos anteriores para generarnuevos modelos. Se podrá repetir cuantas veces se considerenecesario hasta obtener un modelo válido.

Page 12: taller de informatica data minig

Posee varias fases necesarias que son, esencialmente:

•Comprensión del negocio y del problema que se quiere resolver.

•Determinación, obtención y limpieza de los datos necesarios.

•Creación de modelos matemáticos.

•Validación, comunicación, etc. de los resultados obtenidos.

•Integración, si procede, de los resultados en un sistema transaccional o similar.

TÉCNICAS :

Las técnicas más representativas son:Redes neuronales.- Son un paradigma de aprendizaje y procesamientoautomático inspirado en la forma en que funciona el sistema nervioso de losanimales. Se trata de un sistema de interconexión de neuronas en una red quecolabora para producir un estímulo de salida. Algunos ejemplos de redneuronal son: El Perceptrón.El Perceptrón multicapa. Los MapasAutoorganizados, también conocidos como redes de Kohonen.

Page 13: taller de informatica data minig

Regresión lineal.- Es la más utilizada paraformar relaciones entre datos. Rápida yeficaz pero insuficiente en espaciosmultidimensionales donde puedanrelacionarse más de 2 variables.

Page 14: taller de informatica data minig

Árboles de decisión:

Un árbol de decisión es un modelo de predicción utilizado en el ámbito de la

inteligencia artificial, dada

una base de datos se construyen estos diagramas de construcciones lógicas,

muy similares a los sistemas de predicción basados en reglas, que sirven

para representar y categorizar una serie de condiciones que suceden de

forma sucesiva, para la resolución de un problema. Ejemplos: Algoritmo

ID3.. Algoritmo C4.5

Page 16: taller de informatica data minig

Suscita cierta polémica el definir las fronteras existentes entre la minería

de datos y disciplinas análogas, como pueden serlo la estadística, la

inteligencia artificial, etc.

Hay quienes sostienen que la minería de datos no es sino estadística

envuelta en una jerga de negocios que la conviertan en un producto

vendible. Otros, en cambio, encuentran en ella una serie de problemas

y métodos específicos que la hacen distinta de otras disciplinas.

Page 18: taller de informatica data minig

En 1948 Claude Shannon publicó un trabajo llamado “Una TeoríaMatemática de la Comunicación”. Posteriormente esta pasó allamarse Teoría de la información y sentó las bases de lacomunicación y la codificación de la información. Shannon propusouna manera de medir la cantidad de información a ser expresadaen bits.En 1999 Dorian Pyle publicó un libro llamado “Data Preparation forData Mining” en el que propone una manera de usar la Teoría de laInformación para analizar datos.

En este nuevo enfoque, una base de datos es un canal quetransmite información. Por un lado está el mundo real quecaptura datos generados por el negocio. Por el otro estántodas las situaciones y problemas importantes del negocio.Y la información fluye desde el mundo real y a través de losdatos, hasta la problemática del negocio.

Page 19: taller de informatica data minig

CASOS PRÁCTICOS:Los datos contienen un 65% de la información necesaria para predecir qué

cliente rescindirán sus contratos. De esta manera, si el modelo final escapaz de hacer predicciones con un 60% de acierto, se puede asegurar quela herramienta que generó el modelo hizo un buen trabajo capturando lainformación disponible. Ahora, si el modelo hubiese tenido un porcentaje deaciertos de solo el 10%, por ejemplo, entonces intentar otros modelos oincluso con otras herramientas podría valer la pena.

Page 20: taller de informatica data minig

Proporciona un gran poder de procesamiento de información.

Permite una mayor flexibilidad y rapidez en el acceso a la información.

Facilita la toma de decisiones en los negocios.

Las empresas obtienen un aumento de la productividad.

Proporciona una comunicación fiable entre todos los departamentos de la empresa.

Mejora las relaciones con los proveedores y los clientes.

Permite conocer qué está pasando en el negocio, es decir, estar siempre enterado de los buenos ymalos resultados.

Transforma los datos en información y la información en conocimiento.

Permite hacer planes de forma más efectiva.

Reduce los tiempos de respuesta y los costes de operación

Page 21: taller de informatica data minig

Muchas gracias

Virgilio Nieves, Orlando Latorre, William C,Parada, Myriam CabreraFebrero, 21 de 2011

Grupo No. 3