DATA MINING
Mª José Ramírez (DMIP)
27-07-2011
Índice• Presentación• Líneas de Investigación DMIP• Negociación basada en Minería de
Datos
Presentación• DMIP (Data Mining and Inductive
Programming)– Explorar diferentes técnicas y aplicaciones
del aprendizaje automático y la minería de datos.
• Tareas: clasificación, regresión, agrupamiento• Métodos: árboles de decisión, métodos basados
en distancias
– Miembros (José Hernández, Cèsar Ferri, Vicent Estruch, Mª José Ramírez, Antonio Bella, Fernando Martínez, Javier Insa)
Líneas de investigación Aplicaciones
LINEAS DE INVESTIGACIÓN
Background
Líneas de Investigación• Combinación de
modelos/multiclasificadores.
• Aprendizaje sensible al contexto y evaluación de modelos (análisis ROC).
ROC curve
0,0
0,2
0,4
0,6
0,8
1,0
0,0 0,3 0,6 1,0
False Positive Ratio
True
Pos
itive
Rat
io
Líneas de Investigación• Comprensibilidad de los modelos
– Aprendizaje desde datos estructurados: marco de generalización basado en distancias.
– Agrupamiento conceptual basado en distancias.
Líneas de Investigación• Evaluación de capacidades cognitivas de agentes
inteligentes y de interacción social en sistemas multiagente.
NEGOCIACIÓN BASADA EN MINERÍA DE DATOS
Negociación basada en MD• Motivación: Problemas de clasificación en el
que uno o mas atributos(atributos negociables) pueden modificarse durante la aplicación del modelo.
• Ejemplos• Compra-venta: precio• Concesión de créditos: cantidad solicitada,
duración del crédito• Venta al pormenor: tiempo de entrega, precio,
garantía
Negociación basada en MD• Solución: usar los atributos negociables en el
aprendizaje• PASO I:Invertir el problema y aprender un modelo
para predecir el valor del atributo negociable (considerando fijos el resto de atributos).
• Ejemplos• Compra-venta: calcular el precio al que un artículo
puede venderse • Concesión de créditos: calcular la cantidad que el
banco concederá a un cliente que solicita un crédito
• Venta al pormenor: el periodo de garantía que se puede ofrecer para que el artículo sea vendido.
Negociación basada en MD• PASO II: Usar el valor predicho para el atributo
negociable para derivar un modelo probabilístico para el problema inicial
• Ejemplos• Compra-venta: calcular la probabilidad de venta de
un artículo en función del precio• Concesión de créditos: calcular la probabilidad de
concesión de un crédito en función de la cantidad solicitada
• Venta al pormenor: calcular la probabilidad de venta de un producto en función del periodo de garantía.
Negociación basada en MD• Aplicación: datos de una agencia
inmobiliaria.• Objetivo: maximizar el beneficio esperado
Negociación basada en MD• Estrategias de negociación
– Máximo beneficio esperado:
Negociación basada en MD• Estrategias de negociación
– Mejor beneficio esperado local (BLEP)
Negociación basada en MD• Estrategias de negociación
– Optimización por máximo global