Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Teoría:Aprendizaje Supervisado
Sistemas Inteligentes1
1Universidad Nacional de San Luis, Argentina
Carrera: Ingeniería en InformáticaCarrera: Ingeniería en Computación (Optativa)
Departamento de InformáticaAño 2019
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Resumen
1 Introducción
2 Aprendizaje automático (supervisado)
3 Aprendizaje de una hipótesis: esquema general
4 Evaluación de una hipótesis
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Repaso: Tipos de aprendizaje
De acuerdo a la retroalimentación:
Aprendizaje supervisado: experiencia es un conjunto deejemplos 〈x , f (x)〉, de la función f a ser aproximada.Aprendizaje por refuerzos: experiencia son secuenciasde tri-uplas 〈s,a, r〉, donde a es la acción tomada por elagente en el estado s, y r es la evaluación numéricarecibida desde el ambiente por la realización de estaacción.Aprendizaje no supervisado: no existe unaretroalimentación explícita desde el ambiente.
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Retroalimentación en Aprendizaje Automático: supervisado
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Tareas que se abordan con aprendizaje supervisado
Clasificación (o discriminación) (múltiples clases, únicaetiqueta)
Aprendizaje de conceptos (clasificación binaria)
Categorización (múltiples clases, múltiples etiquetas)Regresión (predicción numérica)
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Retroalimentación en Aprendizaje Automático: no-supervisado
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Tareas que se abordan con aprendizaje no-supervisado
ClusteringAprendizaje de reglas de asociaciónTécnicas no supervisadas de reducción dedimensionalidad mediante transformación del espacio decaracterísticas
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Retroalimentación en Aprendizaje Automático: refuerzo
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Ejemplo: aprendiendo los juegos de Atari
Deep Reinforcement Learning
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Aprendizaje automático (supervisado)
Idea intuitiva: intentar reproducir un proceso de clasificacióncorrecto/ideal (clasificadorideal ),
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Aprendizaje automático (supervisado)
Idea intuitiva: ... que para cada entrada (el objeto que se quiereclasificar) o
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Aprendizaje automático (supervisado)
Idea intuitiva: ... que para cada entrada (el objeto que se quiereclasificar) o, genera una salida c (la clase de o)
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Aprendizaje automático (supervisado)
Idea intuitiva: ... usando ejemplos 〈o, c〉 del comportamiento declasificadorideal ,
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Aprendizaje automático (supervisado)
Idea intuitiva: ... usando ejemplos 〈o, c〉 del comportamiento declasificadorideal , para entrenar otro clasificador (modelo)
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Aprendizaje automático (supervisado)
Idea intuitiva: ... cuyos comportamientos sean tan parecidoscomo sea posible.
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Aprendizaje automático (supervisado)
Puntos claves:las salidas (clasificaciones) de clasificadorideal y modelodeberían coincidir respecto a los ejemplos deentrenamiento pero (y más importante), ....deberían coincidir sobre casos (objetos) no presentes enel conjunto de entrenamiento (generalizar)Este proceso, en matemática, se conoce comoaproximación de una función
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Aprendizaje de un clasificador (supervisado)
Idea: aproximar la función ideal de clasificación:
f : O 7→ C
con un conjunto de entrenamiento E , de ejemplos 〈o, c〉, talque o ∈ O es un objeto, y c ∈ C es la categoría que f asigna ao.
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Aprendizaje de un clasificador (+ formal)
DadosUna función de clasificación o clasificación objetivodesconocida:
f : O → C
Un conjunto de entrenamiento E , tal que cada ejemplo esuna instancia rotulada con una de las posibles clases,〈o, f (o)〉 donde o ∈ O y f (o) ∈ C
Tarea: estimar f , es decir, encontrar una función:
h : O 7→ C
denominada hipótesis clasificadora o clasificador, tal queh(o) = f (o) para todo o ∈ O.
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Ejemplo (curso Udacity)
Suponga los siguientes datos:
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Ejemplo (curso Udacity)
Que valor de salida corresponde al valor de entrada 38?:
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Ejemplo (curso Udacity)
La función (desconocida) corresponde a la conversión degrados Celsius a Fahrenheit:
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Ejemplo (curso Udacity)
El enfoque tradicional (programación)
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Ejemplo (curso Udacity)
El enfoque de aprendizaje automático
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Ejemplo (curso Udacity)
El enfoque de (aprendizaje automático)
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Ejemplo (curso Udacity)
Comparación de los enfoques
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Ejemplo (curso Udacity)
Es factible lograr este objetivo?
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Ejemplo (curso Udacity)
Observemos lo siguiente:
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Ejemplo (curso Udacity)
... y los pesos aprendidos:
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Ejemplo (curso Udacity)
Enfoques supervisados considerados (regresión vsclasificación):
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Ejemplo (curso Udacity)
Tabla comparativa (regresión vs clasificación):
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Aprendizaje de una hipótesis: esquema general
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
La entrada del proceso: el conjunto de entrenamiento
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Ejemplo: Problema del tiempo
Conjunto de Entrenamiento
Ej. AtributosEstado Temp Humedad Viento JT
e1 soleado caluroso alta falso noe2 soleado caluroso alta verdadero noe3 nublado caluroso alta falso sie4 lluvioso templado alta falso sie5 lluvioso fresco normal falso sie6 lluvioso fresco normal verdadero noe7 nublado fresco normal verdadero sie8 soleado templado alta falso noe9 soleado fresco normal falso si
e10 lluvioso templado normal falso sie11 soleado templado normal verdadero sie12 nublado templado alta verdadero sie13 nublado caluroso normal falso sie14 lluvioso templado alta verdadero no
e1 = 〈~x , f (~x)〉
e1 = 〈〈soleado, caluroso,alta, falso〉,no〉
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Aprendizaje de una hipótesis: esquema general
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
La salida del proceso: el clasificador
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Un clasificador muy simple: k -NN
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Otro clasificador muy usado: redes neuronales (NN)
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Un clasificador con conocimiento explícito: árboles de decisión
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Aprendizaje de una hipótesis: esquema general
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
El proceso de aprendizaje: búsqueda en un espacio de hipótesis
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Generalización como búsqueda
Una de las decisiones fundamentales en el AA es ellenguaje de representación utilizado para describir elconcepto a aprender.Las “sentencias” de este lenguaje determinan el espaciode hipótesis que el algoritmo de aprendizaje deberárecorrer para encontrar una que sea consistente con losdatos de entrenamiento.La representación de las hipótesis puede ser de lo másvariada:
Una combinación lineal de n características
h(x) = w0 + w1x1 + w2x2 + . . .+ wnxn
Árboles de decisión.Redes Neuronales.
En cada caso, los algoritmos buscan en espacios debúsqueda completamente distintos.
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Sesgos inductivos
Para poder generalizar más allá de los ejemplos deentrenamiento, todo sistema de aprendizaje inductivoutiliza alguna forma de sesgo (bias).Tipos de sesgo:
Sesgo de lenguaje: es el que se produce al elegir ellenguaje para expresar los conceptos.Sesgo de búsqueda: es el que determina el orden en elcual las hipótesis del espacio de búsqueda sonconsideradas.Sesgo para evitar el “sobre-ajuste”: es el que buscadescripciones de conceptos más simples (por ejemplo, lapoda de árboles de decisión).
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Búsqueda en el espacio de hipótesis en ID3
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Búsqueda en el espacio de hipótesis en NN
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Evaluación de una hipótesis
Alternativas para la evaluación de una hipótesis (clasificador):
El conjunto E se usa para entrenamiento y evaluaciónSeparar la evidencia en un conjunto de entrenamiento y unconjunto de test (prueba).Validación cruzada
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Entrenamiento y evaluación sobre el mismo conjunto
Problemas:sobreajuste (overfitting)subajuste (underfitting)
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Entrenamiento y evaluación sobre conjuntos separados
Permite detectar el sobreajuste cuando la hipótesis arrojaresultados mucho mejores para el conjunto de entrenamientoque el de test. Problemas:
Resultados muy dependientes de la particiónEscasez de datos
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Evaluación mediante validación cruzada (cross validation)
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Medidas de evaluación de clasificadores
Un método usual para medir las bondades de un clasificador,es considerar la exactitud (accuracy) del modelo, que mideesencialmente el porcentaje de aciertos de la hipótesisaprendida.
Esta medida se obtiene fácilmente a partir de la matriz deconfusión.
Si se deben categorizar objetos en n clases, corresponderáuna matriz de confusión M de n × n.
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Matriz de confusión
Cada componente Mi,j es el número de casos en que lahipótesis h predijo el valor i y el valor real era j .Ejemplo: Identificación de Autoría
Real (f (x))Borges Cortázar Arlt
Estimado (h(x)) Borges 71 3 1Cortázar 8 7 1
Arlt 4 2 3
La exactitud se calcula dividiendo el número de casos en ladiagonal (aciertos) por el número total de casos testeados:
accT (h) =71 + 7 + 3
71 + 3 + 1 + 8 + 7 + 1 + 4 + 2 + 3=
81100
= 0,81
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Otras medidas de evaluación
Precisión (precision) y alcance (recall)
Real (f (x))Borges Cortázar Arlt
Estimado (h(x)) Borges 71 3 1Cortázar 8 7 1
Arlt 4 2 3
πBorges =71
71 + 3 + 1= 0,947
ρBorges =71
71 + 8 + 4= 0,855
Introducción Aprendizaje automático (supervisado) Aprendizaje de una hipótesis: esquema general Evaluación de una hipótesis
Combinando π y ρ
Rara vez precision y recall son consideradas en formaaisladaAlternativas: medidas combinadas como la “F -measure”(medida F ):
F =2πρπ + ρ
La medida previa es un caso particular (F1) de la funciónFβ:
Fβ =(β2 + 1)πρβ2π + ρ
para algún 0 ≤ β ≤ +∞Usualmente β = 1 (igual peso a π y ρ)