42
Sistemas Expertos de Primera Generación (II) Tareas basadas en conocimiento: clasificación

Sistemas Expertos de Primera Generación (II)calonso/IAI/Tema12SistemasExpertos...Los problemas que se puedan solucionar sin necesidad de construir nuevas soluciones, sino eligiendo

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Sistemas Expertos de Primera Generación (II)

Tareas basadas en conocimiento: clasificación

2

Contenidos

1. Tipología de tareas: tareas genéricas de Clancey

2. Modelos y métodos de clasificación simbólica

1. Clasificación simple2. Clasificación jerárquica

3. Modelos y métodos de diagnosis1. Árboles de fallos

3

Tipología de tareas

Rango limitado de tipos de tareasSe limita a tareas que hacen un uso intensivo del conocimiento

Objeto de estudio de las ciencias cognitivas/psicología Existen numerosas propuestasPropuesta de Clancey: tipología basada en la noción de sistema

4

Noción de “Sistema”

Término abstracto que describe aquello sobre lo que se aplica una tarea

diagnosis médica: cuerpo humanodiagnosis técnica: artefacto o dispositivoconfiguración ascensores: ascensor a configurar

No necesita existir (aún)

5

Tareas analíticas/sintéticas

Tareas analíticasEl sistema ya existeEntrada: datos sobre el sistemaSalida: alguna caracterización del sistema

Tareas sintéticasEl sistema aún no existeEntrada: requisitos del sistema a construirSalida: descripción del sistema

Subdivisión adicionalEn función del tipo de problema

6

Tareas genéricas de Clancey

Tareas que hacen uso intensivo del conocimiento

Tarea Analítica

clasificación

evaluación

Tarea Sintética

diagnosis

monitorización

predicción

modelado

planificación

scheduling

asignacióndiseño

configuración

7

Tareas Analíticas

Tipo de tarea

Entrada Salida Conocimiento Características

Análisis Observaciones del sistema

Caracterización del sistema

Modelo del sistema Se proporciona la descripción del sistema

Clasifi-cación

Propiedades de objetos

Clase Asociación características-clases

Conjunto de clases predefinidas

Diagnosis Síntomas, quejas

Categoría de fallo

Modelo de comportamiento

Distintos tipos de salidas: cadena causal, estado, componente

Evaluación Descripción caso

Clase de decisión

Criterios, normas Se realiza en un instante temporal

Monito-rización

Datos del sistema

Clase de discrepancia

Comportamiento normal del sistema

Se realiza repetidamente

Predicción Datos del sistema

Estado del sistema

Modelo de comportamiento

Proporciona una descripción del sistema en el futuro

8

Clasificación

La tarea de clasificación se caracteriza por seleccionar una clase

entre un conjunto finito –y habitualmente pequeño–de posibles clasesconociendo las características de las clases y las del objeto a clasificar

Ejemplosla clasificación taxonómica de seres vivos en familias y especies clasificación de objetos celestes a partir de imágenes de satélites

9

Interés clasificación

Rango:Los problemas que se puedan solucionar sin

necesidad de construir nuevas soluciones, sino eligiendo una entre un catálogo de posibles soluciones ya conocidas, son susceptibles de ser abordadas como una tarea de clasificación.

Sencilleztanto los modelos de clasificación como los

métodos que los utilizan son conceptualmente simples

10

Modelos y métodos de clasificación

Clasificación simpleModelo conceptualmente sencilloIlustra naturaleza de la tarea

Clasificación jerárquica

11

Clasificación simple

Un modelo de clasificación por recubrimiento es una quíntupla <D, S, C+, C-, OBS>, siendo:

D, Espacio de Datos, un conjunto finito de datos {D1, D2,... ...,Dk}.S, Espacio de Soluciones, un conjunto finito de soluciones {S1, S2,... ...Sm} o candidatos.C+, C-, son Relaciones de Recubrimiento, C+⊂SxD, C-⊂SxD, con C+∩ C- =∅.OBS el conjunto de valores que toman los datos Dide D.

12

Datos, observaciones y soluciones

Los elementos de D representan las observaciones que podemos realizar directamente sobre el sistema

valores en el conjunto {0, 1, ?} indicando su ausencia, su presencia o la no disponibilidad de la observación.

Ejemplo, Si Di representa el síntoma “fiebre” y observamos que el paciente no tiene fiebre, en el conjunto OBS tendremos Di=0.

Los elementos de S, candidatos, representan posibles soluciones del problema, por ejemplo bronquitis o asma

13

Ejemplo SM

D = {A=3, B=2, C=2, D=3, X=6, Y=6, F=12}OBS={1, 1, 1, 1, ?, ?, 0}S= {M1, M2, A1}

M1

M2

A1

X

Y

A

B

D

C F [10]

[3]

[2]

[2]

[3]

14

Relaciones de recubrimiento (I)

Elementos de C+ y C-

pares (Sj, Di) que representan condiciones necesarias para la consistencia de una solución con un conjunto de observaciones

C+ y C- definen un patrón de observaciones necesarias para la consistencia de un candidato con los datos

15

Relaciones de recubrimiento (II)

Para cada par (Sj, Di) solo puede darse uno de los siguientes casos:

(Sj, Di) ∈ C+. Sj es consistente con la observación Di =1

si Di =0, Sj no puede ser solución.

(Sj, Di) ∈ C-. Sj es consistente con la observación Di =0

si Di =1, Sj no puede ser solución.

(Sj, Di)∉C+, (Sj, Di)∉C-. Di es irrelevante para la solución Sj; (En cualquier otro caso, el dato Di es relevante para la solución Sj)

16

Consistencia

Un candidato, Sj, es consistente con un conjunto de observaciones OBS si y sólo si Sj es consistente con todas las observaciones disponibles; en caso contrario, Sj es inconsistente.

17

Explicación

Un candidato, Sj, es una explicaciónde OBS si y sólo si Sj es consistente con las observaciones de todos sus datos relevantes.

18

Solución

El modelo de recubrimiento secuencial proporciona de forma explicita un mecanismo para rechazar candidatos

los candidatos inconsistentes pueden eliminarse del conjunto de posibles soluciones

Solución del problema de clasificacióncriterios adicionales, que pueden depender del dominio de aplicación

19

Representación gráfica

1

1

0

0

0

D1

D2

D3

D4

D5

OBS-1

1

1

0

?

1

OBS-2

e

r

r

r

r

CAN-1

e

r

c

e

c

CAN-2

S1

S2

S3

S4

S5

Elementos de C+

Elementos de C-

e: explicaciónc: consistenter: rechazado

20

Solución problema de clasificación por recubrimiento

Candidatos simples, compuestosSimples: elementos de S

Mutuamente excluyentes: un único elemento de SNo mutuamente excluyentes: un subconjunto de S

Compuestos: combinación elementos de SExplosión combinatoriaPosibles soluciones: 2|S|

21

Solución problema de clasificación por recubrimiento

Criterio de inclusiónConsistencia

se incluyen todas las clases consistentes con algún dato observado.

Conservadorase incluyen todas las soluciones consistentes, aunque no se disponga de ninguna de sus observaciones relevantes.

Explicaciónsolo se incluyen las soluciones que son explicaciones.

Completala solución ha de explicar todas las observaciones.

Por eliminaciónsólo se acepta una solución cuando todas las demás han sido rechazadas.

22

Solución problema de clasificación por recubrimiento

Preferencia de candidatosEvidencia

preferir las soluciones consistentes con más datos.

Minimalidaddefinir la solución como los subconjuntos minimales de las soluciones compuestas.

Ponderaciónutilizar alguna función adicional para priorizar las hipótesis. Por ejemplo, probabilidad a priori, a posteriori o alguna medida de certeza.

23

Ejemplo SM

1

1

1

1

?

A=3

B=2

C=2

D=3

X=6

OBS-1

1

1

1

1

1

OBS-2

c

c

c

CAN-1

r

c

c

CAN-2

M1

M2

A1

Y=6

F=12

?

0

?

0

M1

M2

A1

X

Y

A

B

D

C F [10]

[3]

[2]

[2]

[3]

24

Soluciones

OBS-2Criterio inclusión: consistencia

M2, A1

Candidatos simples, no excluyentes: {M2, A1}Candidatos compuestos: {M2, A1, [M2, A1]}Candidatos compuestos, minimales: {M2, A1} ([M2, A1] también es solución, pero no se representa)

25

Clasificación simple mediante generación y prueba exhaustivas

El método se basa en tres suposiciones:Todas las observaciones necesarias están disponibles al principio del proceso.El espacio de soluciones, S, es suficientemente pequeño para poder considerar cada candidato individualmente.Candidatos simples, no excluyentes

26

Método degeneración y prueba exhaustivas

1. Soluciones ← ∅ 2. Obtener OBS 3. Para cada Candidato ∈ S hacer 4. Si Prueba(Candidato) Entonces Soluciones ← Soluciones ∪ Candidato 5. Fin Si 6. Fin Para 7. Devolver(Soluciones)

el procedimiento prueba rechaza los candidatos no consistentes con las observaciones actuales

Ejercicio: ejemplo SM, OBS-3=<1, 1, 1, 1, 1, 0, 0>.

27

Clasificación simple mediante generación guiada por datos

Mejora de la eficacia computacional generación y prueba exhaustivas

Utilizar conjunto reducido de observaciones para generar los candidatosProbar la consistencia de los candidatos con las observaciones restantes

Introducir procedimientosMonitor

Obtiene el valor de un conjunto reducido de observaciones (OBSdistinguidas)para las que existen candidatos consistentes.

Este conjunto de candidatos es mucho menor que el conjunto de posibles soluciones.

GenerarCandidatosGenera eficientemente las soluciones que son consistentes con OBSdistinguidas

28

Clasificación simple mediante generación guiada por datos

El método se basa en las siguientes suposiciones:

Disponemos de procedimientos eficientes Monitor y GenerarCandidatosTodas las observaciones necesarias están disponibles al principio del proceso.Candidatos simples, no excluyentes.

29

Método de generación guiada por datos

1. Soluciones ← ∅ 2. OBSdistinguidas ← Monitor( ) 3. Si OBSdistinguidas ≠ ∅ Entonces 4. Obtener OBS 5. Candidatos ← GenerarCandidatos(OBSdistinguidas) 6. Para cada Candidato ∈ Candidatos hacer 7. Si Prueba(Candidato) Entonces Soluciones ← Soluciones ∪

Candidato 8. Fin Si 9. Fin Para 10. Fin Si 11. Devolver(Soluciones)

30

Ejemplo SM

D={A=3, B=2, C=2, D=3, X=6, Y=6, F=12}.Se observan, A=[3], B=[2], C=[2], D=[3], X=[6], Y=[5], F=[10] que corresponden a OBS-3=<1, 1, 1, 1, 1, 0, 0>. Monitor devuelve las observaciones de X, Y, F: <1, 0, 0>GenerarCandidatos devuelve {M2, A1}Prueba rechaza A1Solución: {M2}

31

SM, guiado por datos

A=3

B=2

C=2

D=3

X=6

OBS-3

1

Monitor

r

c

c

GenerarCandicados CAN-3

M1

M2

A1

Y=6

F=12

0

0

1

1

1

1

1

0

0

r

c

r

32

Clasificación jerárquica

También clasificación heurísticaVariante clasificación simple

Modelo de recubrimientoJerarquía de abstracción de datosJerarquía de refinamiento de soluciones

33

Jerarquía de abstracción de datos

Abstracción Cualitativa“recuento leucocitario de 2500” se abstrae a “recuento leucocitario bajo”

Abstracción por Definición“recuento leucocitario bajo” se abstrae a “Leucopenia”, pues así se define la Leucopenia

Abstracción por Generalización“Leucopenia” se abstrae a “Inmunodepresión”, pues la Leucopenia es un tipo de inmunodepresión

OtrasCombinar dos sensores en un único dato…

34

Jerarquía de refinamiento de soluciones

Dotar al espacio de soluciones de estructura

Manipular clases de soluciones, que se van refinando

El modelo de recubrimiento no cambia:Se hace explícita la jerarquía implícita en el modelo de recubrimientoAñadiendo, si es necesario, clases abstractas

35

Modelo gráfico clasificación jerárquica

AD5

AD4

R1

D1

D2

D3

Datos sin procesar

S1

Datos Abstractos

Soluciones Abstractas

R2 R3 R4

AD1

AD2 AD3 S2

D4

R7

S3

S4

S5

S6

S7

D5

D6

D7

R8 R5

AD6

R6

Espacio de datos Espacio de soluciones

Soluciones Refinadas

36

Ejemplo

OBS:<1, ?, ?, ?, ?, ?, ?> Consistente con todas las clases: S1 es consistente

OBS: <0, ?, ?, ?, ?, ?, ?> Inconsistente con todas las clases: S1 es inconsistente

OBS: <1, 0, ?, ?, ?, ?, ?> Inconsistente con S2 y sus sucesoresConsistente con S1, S3 y sus sucesores

37

Eliminación jerárquica

Eliminar candidatos sucesores de nodos inconsistentesCondición necesaria

El conjunto de tuplas de las relaciones de recubrimiento de una subclase son una extensión de las tuplas de su clase padre:

si la tupla (Sj, Di) pertenece a C+ (C-), la tupla (SkDi) ha de pertenecer a C+ (C-) para todo Sk hijo de Sj

38

Clasificación jerárquica y obtención de observaciones

Estrategia sencilla y efectiva de obtener nuevas observaciones

buscar aquellas observaciones que nos permiten seguir refinando los candidatos consistentes de más alto nivel

EjemploOBS:<1, 0, 1, ?, ?, ?, ?> Consistentes S1 y S3

No necesitamos observaciones D4 y D5

Basta observar D6 y D7 para obtener la clasificación

39

Clasificación jerárquica mediante generación guiada por datos

Parte de conjunto reducido de observaciones obtenidas por MonitorAbstrae las observaciones con AbstraerGenera candidatos más abstractos con GenerarNuevosCandidatosSolicita nuevas observaciones, Obtener, para refinar candidatos, hasta llegar a nodos terminalesSi las nuevas observaciones son consistentes con candidatos abstractos no considerados, se repite el proceso

40

Clasificación jerárquica mediante generación guiada por datos

El método se basa en las siguientes suposiciones:

Disponemos de los procedimientos, Monitor, ObtenerAbstraer y GenerarNuevosCandidatosEl espacio de datos se organiza jerárquicamente facilitando la abstracción de datos. Las soluciones se organizan en una jerarquía de refinamiento que divide las clases de soluciones.En cada nivel del espacio de soluciones existe un conjunto de datos que permite discriminar entre ellas. Es posible obtener dichos datosCandidatos simples, no excluyentes.

41

Método degeneración guiada por datos

1. Soluciones ← ∅ 2. OBSdistinguidas ← Monitor( ) 3. OBS ← Abstraer(OBSdistinguidas) 4. Si OBS ≠ ∅ Entonces 5. Mientras se puedan generar nuevos candidatos raíz hacer 6. Candidatos ← GenerarNuevosCandidatosRaiz(OBS) 7. Soluciones ← ProbarDiscriminar(Candidatos) ∪ Soluciones 8. Mientras sea posible refinar candidatos hacer 9. Soluciones ← Soluciones – {Candidato_a_refinar} 10. Candidatos ← hijos de Candidato_a_refinar en la jerarquía de

soluciones 11. Soluciones ← PorbarDiscriminar(Candidatos) ∪ Soluciones 12. Fin Mientras 13. Fin Mientras 14. Fin Si 15. Devolver(Soluciones)

42

Obtener nuevas observaciones para discriminar entre candidatos

1. ProbarDiscriminar(Candidatos) 2. NuevasSoluciones ← ∅ 3. Obtener OBSadicionales, observaciones necesarias para discriminar entre las

hipótesis de Candidatos 4. NuevasObservaciones ← Abstraer(OBSadicionales) 5. OBS ← Nuevas observaciones ∪ OBS 6. Para cada Candidato ∈ Candidatos hacer 7. Si Prueba(Candidato) Entonces NuevasSoluciones ← NuevasSoluciones ∪

Candidato 8. Fin Si 9. Fin Para 10. Devolver(NuevasSoluciones)