Upload
placido-balam
View
212
Download
0
Embed Size (px)
Citation preview
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
1/71
INTELIGENCIA ARTIFICIAL - ICIF0021
Unidad 5 - Agentes Inteligentes
Docente: Milton A. Ramrez [email protected]
Universidad San Sebastian
Facultad de Ingeniera y Tecnologa
Primer Semestre de 2011
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 1 / 71
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
2/71
Objetivos de la Unidad
Identifican los componentes que conforman un sistema de agentes.
Conocen metricas para evaluar el rendimiento de un agenteinteligente.
Identifican la caracterizacion del entorno de trabajo de un agente enbase al analisis REAS (Rendimiento, Entorno, Actuadores, Sensores).
Reconocen las propiedades del entorno de un agente en funcion de lainteraccion que este tiene con su medio.
Clasifican el entorno de un agente segun sus propiedades.
Conocen las componentes de un sistema de agentes.
Reconocen la clasificacion que tienen los agentes dependiendo de lascaractersticas propias de su programa.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 2 / 71
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
3/71
Contenidos
1 Agentes, entorno, sensores y actuadores.
2 Medidas de rendimiento de agentes.
3 Racionalidad.
4 Entornos de trabajo de agentes.
5 Estructura de un agente.
6 Clasificacion de agentes.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 3 / 71
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
4/71
Agentes y su entorno
Introduccion
Agente es cualquier
cosa capaz de percibirsu medio ambiente ,utilizando sensores
. . . as como tambienactuar en ese medio
usando actuadores.
Agente
sensores
actuadores
?
A
M
B
I
E
N
T
E
percepcin
acciones
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 4 / 71
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
5/71
Agentes y su entorno
El ser humano como agente
Sensores
ojos, odos
lengua, piel
Actuadores
piernas, brazos
boca, dedos
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 5 / 71
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
6/71
Agentes y su entorno
Un robot como agente
Sensores
pulsaciones deteclas, archivoscon informacion
paquetes de datos
que recibe por red.
Actuadores
mensajes en elmonitor, escriturade archivos dedatos
envo de paquetesde datos va red.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 6 / 71
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
7/71
Agentes y su entorno
Hipotesis general sobre agentes
Cada agente puede percibir sus propias acciones.
Pero no siempre los efectos de las mismas.
Percepcion
Percibir es recibir entradas en cualquier momento.
Una secuencia de percepciones corresponde al historico de lo que el
agente ha recibido: a veces, los agentes toman decisiones segun lo percibido en una
secuencia
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 7 / 71
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
8/71
Agentes y su entorno
En terminos matematicos un agente es una funcion que proyectapercepciones en acciones.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 8 / 71
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
9/71
Agentes y su entorno
La funcion de comportamiento se puede representar como unatabla:
que por lo general es muy grande
a veces puede ser infinita a menos que se limite el tamano de lasecuencia de percepciones.
Esta tabla es una caracterizacion externa:
el programa del agente es su caracterizacion interna.
Hay que diferenciar la funcion del agente del programa del agente.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 9 / 71
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
10/71
Agentes y su entorno
El mundo de la aspiradora como agente
Tenemos una aspiradora que puede estar en dos ubicaciones posibles:A o B.
Supondremos que es capaz de percibir en que posicion esta y si suubicacion actual tiene o no suciedad.
Sus acciones permitidas son: moverse a la izquierda (Izquierda), derecha (Derecha) limpiar (Limpiar) hacer nada (HacerNada).
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 10 / 71
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
11/71
Agentes y su entorno
Ejemplo de tabulacion parcial para estudiar el comportamiento del agente aspiradora
Observaciones
Es una tabla que
contrasta la secuenciade percepciones conla accion que debieraemprender.
La secuencia es lo que
se conoce.La accion es lo quehay que determinar.
Tabulacion parcial
Percepcion Accion
[A, Limpia] Derecha[A, Sucia] Limpiar
[B, Limpia] Izquierda
[B, Sucia] Limpiar
[A, Limpia], [A, Limpia] Derecha
[A, Limpia], [A, Sucia] Limpiar
......
[A, Limpia], [A, Limpia], [A, Sucia] Limpiar
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 11 / 71
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
12/71
Agentes y su entorno
Un ejemplo mas sofisticado: la aspiradora Roomba
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 12 / 71
C d R i lid d
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
13/71
Concepto de Racionalidad
Agente racional
Un agente racional es aquel que siempre hace lo correcto.
Cada elemento de la tabla de comportamiento debe rellenarsecorrectamente.
Que significa hacer lo correcto?
Como primera aproximacion, aquello que le permita al agente obtenerun resultado mejor:
por lo tanto, se debe medir el exito.De esta manera, los sensores, actuadores y medida de exito nospermiten definir que es racionalidad.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 13 / 71
M did d R di i
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
14/71
Medidas de Rendimiento
Un agente genera una secuencia de acciones
en el medio en que se inserta y de acuerdo a las percepciones que recibe entonces, el habitat tiene una secuencia de estados si secuenciaes la deseada, el agente habra actuado correctamente.
La medida del exito puede ser
subjetiva objetiva
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 14 / 71
M did d R di i
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
15/71
Medidas de Rendimiento
Como se puede medir el exito en el ejemplo de la aspiradora?
Propuesta 1: por la cantidad de suciedad que se ha limpiado en unintervalo de tiempo determinado (10 horas?):
y si el agente limpia, luego vuelve a tirar la basura y vuelve a limpiar
(repetidamente)?
Propuesta 2: mantener el suelo limpio.
Observacion
Es mejor crear medidas de utilidad de acuerdo al entorno, mas que deacuerdo al como lo hace el agente.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 15 / 71
R i lid d
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
16/71
Racionalidad
Factores que determinan la racionalidad de un agente en un momentodeterminado
1 La medida de rendimiento que define el criterio de exito delcomportamiento.
2 El conocimiento acumulado por el agente sobre el medio en el quehabita.
3 Las acciones que el agente puede realizar.
4 La secuencia de percepciones del agente que hasta un momentodeterminado ha captado.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 16 / 71
R i lid d
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
17/71
Racionalidad
Definicion de agente racional
En cada secuencia de percepciones, un agente racional debera emprender
aquella accion que supuestamente maximice su medida de rendimiento,
basandose en las evidencias aportadas por la secuencia de percepciones y
en el conocimiento que el agente mantiene.
Con respecto a la aspiradora
Se puede considerar al agente aspiradora como un agente racional?
Que es aquello que se debiera determinar?
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 17 / 71
Racionalidad
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
18/71
Racionalidad
Agente aspiradora
Medida de rendimiento: premia con un punto por cada recuadrolimpio en un periodo de tiempo.
Geografa del medio: el medio se conoce de antemano (recordar lafigura del ejemplo anterior) podemos suponer que la distribucion de la suciedad y la posicion inicial
del agente no se conocen
Acciones posibles: Izquierda, Derecha, Limpiar y HacerNada.
Se puede suponer tambien que percibe correctamente la localizacion ysi hay suciedad en la celda actual.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 18 / 71
Racionalidad
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
19/71
Racionalidad
Recopilacion de informacion
Proceso relacionado con ejecutar acciones que intenten modificarpercepciones futuras.
Es una parte importante de lo que involucra el concepto de
racionalidad.
Exploracion
Es un ejemplo de recopilacion de informacion.
El agente aspiradora debe realizar una exploracion inicial debido aque no conoce el ambiente.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 19 / 71
Racionalidad
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
20/71
Racionalidad
Aprendizaje
No solo se debera recopilar informacion:
sino tambien ser capaz de aprender de ella.
Cuando se conoce el entorno de antemano, no se necesita aprender. . .
solo actuar correctamente
pero aquellos son simplemente agentes fragiles.
Autonoma de agentes
Se dice que un agente no es autonomo cuando se apoya mas en el conocimiento inicial que en sus propias
percepciones
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 20 / 71
Racionalidad
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
21/71
Racionalidad
Un agente racional debe ser autonomo.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 21 / 71
Que vimos la clase pasada?
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
22/71
Que vimos la clase pasada?
Introduccion a los sistemas de agentes.
Racionalidad.Medida del rendimiento de un agente.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 22 / 71
Hoy veremos
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
23/71
Hoy veremos
Entornos de trabajo de un agente.
Propiedades de los entornos de trabajo.
Estructuras de agentes.
Tipos de agente segun el programa del agente.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 23 / 71
La naturaleza del entorno
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
24/71
La naturaleza del entorno
Los agentes racionales son soluciones a entornos de trabajo(problemas).
Como se define el entorno de trabajo?
En el agente aspiradora definimos lo que era la medida deRendimiento, Entorno,Actuadores y Sensores (REAS).
Mediante el estudio del REAS se pueden comprender de manera mascabal las distintas aristas que intervienen en la formulacion del
problema que tiene que resolver el agente.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 24 / 71
La naturaleza del entorno
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
25/71
La naturaleza del entorno
REAS para el taxista automatico
Tipo de
Agente
Medida de
Rendimiento Ambiente Actuadores Sensores
conductorautomatico detaxi.
seguro, rapido,viaje confor-table.
rutas, transito,peatones,pasajeros,condicionesmeteo-
rologicas.
acelerador,palanca decambio, freno,luces desenalizacion,
bocina.
camaras, espe-jos,velocmetro,GPS,tacometro,niveles de los
parametros delmotor.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 25 / 71
La naturaleza del entorno
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
26/71
La naturaleza del entorno
REAS para un sistema de diagnostico medico
Tipo de
Agente
Medida de
Rendimiento Ambiente Actuadores Sensores
sistema dediagnosticomedico.
pacientessanos y re-ducir costos ydemandas pornegligencias
medicas.
pacientes,hospital, taba-jadores delhospital
set de pre-guntas, diag-nostico,tratamiento.
teclado parala entrada desntomas, sis-tema foneticopara interpre-
tar lo que diceel paciente.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 26 / 71
Propiedades de entornos
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
27/71
Propiedades de entornos
Existen muchos tipos de entornos de trabajo donde se utiliza la IA.
Propiedades de los entornos de trabajo donde se aplica la IA
1 Observacion del ambiente.
2 Determinacion del siguiente estado.
3 Consideracion de la experiencia del agente.
4 Cambio del entorno.
5 Manejo de percepciones.
6 Agentes participantes.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 27 / 71
Propiedades de entornosOb i d l bi t
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
28/71
Observacion del ambiente
Ambientes totalmente observables
Los sensores del agente permiten acceso al estado completo delambiente.
Se detectan todos los aspectos medibles para la toma de decisionesdel agente.
En terminos de rendimiento, es lo mas recomendable y conveniente.
Ambientes parcialmente observables
Los sensores no son capaces de captar todo el ambiente: es lo mas habitual debido a que los sensores pueden ser poco exactos.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 28 / 71
Propiedades de entornosDete i acio del si ie te estado
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
29/71
Determinacion del siguiente estado
En entornos deterministas
El siguiente estado se determina totalmente desde el estado actualy la accion ejecutada del agente.
El agente no tiene que lidiar con la incertidumbre.
Si el medio fuera parcialmente observable, puede parecer estocastico.
En entornos estocasticos
El siguiente estado no siempre se puede determinar siempre desde elestado actual y la accion del agente.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 29 / 71
Propiedades de entornosConsideracion de la experiencia del agente
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
30/71
Consideracion de la experiencia del agente
Entorno episodicoLa experiencia del agente se divide en episodios atomicos:
cada episodio es una percepcion con su accion asociada.
El siguiente episodio no depende de las acciones de los episodios
previos.
Entorno secuencial
Las decisiones y acciones presentes pueden afectar a las decisiones y
acciones futuras.
Ejemplo clasico: agente que juega Ajedrez.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 30 / 71
Propiedades de entornosCambio de entorno
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
31/71
Cambio de entorno
Entorno estaticoEl ambiente no puede cambiar mientras el agente esta deliberando.
Son faciles de tratar puesto que no es necesario estar pendiente de loscambios que se puedan estar sucediendo.
Tampoco interesa analizar el paso del tiempo.
Entorno dinamico
El ambiente puede cambiar mientras se delibera.
El agente no siempre conoce el estado del mundo sin volver a sentirlonuevamente.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 31 / 71
Propiedades de entornosManejo de percepciones
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
32/71
Manejo de percepciones
Entorno discreto
Sus estados son distinguibles de forma finita.
Se refiere a la forma en que el agente interpreta las percepciones,genera acciones y maneja el tiempo.
Por ejemplo: agente que juega ajedrez.
Entorno continuo
Es lo contrario a un entorno discreto.
Por ejemplo, el caso del taxista automatico:
Variables continuas a considerar: velocidad, coordenadas geograficasdel taxi, angulo de viraje, etc.
Las camaras que pueda tener se consideran como continuas, pese a sunaturaleza discreta.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 32 / 71
Propiedades de entornosAgentes participantes
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
33/71
Agentes participantes
Agente individual
Interviene un agente.Por ejemplo: un agente que resuelve crucigramas.
Mutiagentes
Intervienen dos o mas agentes, que no tienen por que ser solo robotso software.
Por ejemplo: agentes que juegan ajedrez, videojuegos de estrategia,de guerra, de aventuras.
Cuando los agentes intentan minimizar el rendimiento entre s,estamos hablando de un medio competitivo:
en caso contrario, el medio es cooperativo como en el caso de laRoboCup Search and Rescue (Urban Search and Rescue).
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 33 / 71
Estructuras de Agente
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
34/71
Hasta ahora hemos hablado de la conducta de los agentesinteligentes. . .
que es la accion dada una secuencia de percepciones.
La IA debe disenarlo que se conoce como el programa del agente.
Los programas de agente seejecutan
en computadores con sensoresy actuadores, que es el hardware del agente.
Esto se llama Arquitectura
Entonces: Agente = Arquitectura + Programa.El programa debe ser el adecuado para la arquitectura.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 34 / 71
Programas de Agente
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
35/71
La mayora sigue la misma estructura:
recibenpercepciones desde sensores envan acciones a los actuadores
Programa y Funcion del Agente
El programa recibe la percepcion actual.
La funcion recibe todo el historico de percepciones (tabla).
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 35 / 71
Programas de Agente
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
36/71
Cual es el problema con la tabla de agente?
Esta condenada al fracaso.
Veamos el caso del taxi automatizado:
si cada imagen de camara entrega una tasa de 27
MBs
, suponiendo
una resolucion de 640 480
, con 24 bits de color y 30 fps. Se estima que por cada hora de conduccion tendramos una tabla conla no despreciable cantidad de 10250.000.000.000 entradas.
En el caso del pequeno y ordenado mundo del Ajedrez:
Al menos tendramos 10150 entradas.
Solo como referencia
Se calcula que el numero de atomos observables en el universo es delorden de 1080.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 36 / 71
Programas de Agente
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
37/71
La idea de la IA es crear programas de agentes racionales usando unapequena cantidad de codigo, sin tener que recurrir a grandes tablas.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 37 / 71
Programas de Agente
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
38/71
Otras areas han logrado un objetivo similar
Antiguamente haban grandes tablas con races cuadradas paraingenieros y matematicos:
hoy las calculadoras utilizan un programa que no excede las cincolneas.
De la misma manera para el calculo de funcioneslogartmico-exponenciales, circulares, etc.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 38 / 71
Programas de Agente
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
39/71
Tipos de programa de agente.
1 Agentes reactivos simples.
2 Agentes reactivos basados en modelos.
3 Agentes basados en objetivos.
4 Agentes basados en utilidad.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 39 / 71
Tipos de Programa de AgenteAgentes Reactivos Simples
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
40/71
Es el tipo de agente mas sencillo.
Seleccionan la accion solo sobre las percepciones actuales del agente,ignorandolas percepciones historicas.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 40 / 71
Tipos de Programa de AgenteAgentes Reactivos Simples
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
41/71
Las reacciones son conexiones mentales que siguen una reglasencilla:
si entonces por ejemplo: si el auto que va adelante enciende la luz de freno,
entonces disminuyo mi velocidad.
Estas reglas se llaman reglas de condicion-accion (CA).
Agente
sensores
actuadores
reglas
CA
A
M
B
I
EN
T
E
percepcin
acciones
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 41 / 71
Tipos de Programa de AgenteAgentes Reactivos Simples
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
42/71
Ejemplo: Programa de Agente Reflejo Simple Aspiradora
Entrada: (ubicacion, estado), ubicacion {A,B},estado {limpio, sucio}Salida: accion {Izquierda, Derecha, Limpiar}
1: si (estado = limpio) y (ubicacion = A) entonces2: retornar Derecha3: fin si
4: si (estado = limpio) y (ubicacion = B) entonces5: retornar Izquierda6: fin si7: si (estado = sucio) y (ubicacion = A) entonces8: retornar Limpiar9: fin si
10: si (estado = sucio) y (ubicacion = B) entonces11: retornar Limpiar12: fin si
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 42 / 71
Tipos de Programa de AgenteAgentes Reactivos Simples
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
43/71
Estos agentes son simples pero tienen una inteligencia limitada.
Por lo general requieren que el mundo sea totalmente observable:
si acaso lo que se desea es tomar la decision correcta.
Otro problema es que pueden caer en bucles infinitos, dependiendo desu arquitectura:
pueden tomar decisiones de modo aleatorio por ejemplo: aspiradora sin sensor de ubicacion.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 43 / 71
Tipos de Programa de AgenteAgentes basados en Modelos
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
44/71
El problema a resolver es la visibilidad del mundo.
La solucion para la visibilidad parcial: almacenar aquellas partes delmundo que no se ven. . .
se requiere de un estado interno
que dependa de la historia de las percepciones por ejemplo: al conducir, saber donde estan los otros vehculos.
Se necesita informacion sobre el comoevoluciona el mundo,independiente del agente: saber por ejemplo que los autos seacercan cuando se encienden las luces de freno traseras.
El como es lo que se conoce como modelo.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 44 / 71
Tipos de Programa de AgenteAgentes basados en Modelos
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
45/71
Estructura del agente basado en modelos
cmo eselmundoahora
Agente
sensores
actuadores
A
MB
I
E
N
T
E
percepcin
acciones
qu accin
emprenderahora
estado
cmoevolucionaelmundo
quhacenmisacciones
reglasCA
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 45 / 71
Tipos de Programa de AgenteAgentes basados en Objetivos
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
46/71
No siempre es suficiente el conocimiento sobre el estado actual delmundo.
Por ejemplo: el taxista automatico al verse enfrentado a un cruce decalles...
puede decidir girar a la izquierda, derecha o bien continuar su marcha
hacia adelante dependiendo hacia donde quiere ir, y NO de las percepciones del
mundo.
Se requiere, por lo tanto, informacion sobre un objetivo o metapara el agente.
Para esto, se puede emplear el resultado que generen las acciones, deun modo similar a como opera el agente basado en modelos.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 46 / 71
Tipos de Programa de AgenteAgentes basados en Objetivos
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
47/71
Estructura de un agente reactivo basado en objetivos
cmo eselmundo
ahora
Agente
sensores
actuadores
A
M
B
I
E
N
T
E
percepcin
acciones
quaccindebieraemprender ahora
estado
cmoevolucionaelmundo
quhacenmisacciones
metas
cmosersiemprendo
la accin A?
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 47 / 71
Tipos de Programa de AgenteAgentes basados en Objetivos
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
48/71
Se recomienda su uso en. . .
Busqueda.
Planificacion.Porque encuentran secuencias de acciones para alcanzar objetivosconcretos:
de acuerdo a lo que agente perciba.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 48 / 71
Tipos de Programa de AgenteAgentes basados en Utilidad
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
49/71
Las metas por s solas no son suficientes:
para generar comportamiento de gran calidad
Por ejemplo, hay muchas maneras de que el taxi automatico llegue asu destino:
no esta en discusion que el taxista cumple con su objetivo pero no todas resultan comodas o baratas para el usuario.
Por lo tanto, las metas definen vagamente lo que es felicidad ytristeza, con respecto al cumplimiento de objetivos.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 49 / 71
Tipos de Programa de AgenteAgentes basados en Utilidad
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
50/71
Sera mejor tener una medida concreta de felicidad que permitacomparar estados:
cientficamente conocida como utilidad un estado puede tener mas utilidad que otro.
Funcion de Utilidad
Toma uno o mas estado y los transforma a un numero real, que va arepresentar al nivel de felicidad del agente.
A veces hay estados conflictivos:
la utilidad representa un balance por ejemplo: velocidad y seguridad al conducir
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 50 / 71
Tipos de Programa de AgenteAgentes basados en Utilidad
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
51/71
cmo eselmundoahora
Agente
sensores
actuadores
A
M
B
I
E
N
T
E
percepcin
acciones
quaccindebieraemprender ahora
estado
cmoevolucionaelmundo
quhacenmisacciones
utilidad
cmosersi
emprendola accin A?
qutanfeliz serenese caso?
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 51 / 71
Que vimos la clase pasada?
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
52/71
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 52 / 71
Hoy veremos
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
53/71
Estructura de agentes.
Tipos de programas de agentes.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 53 / 71
Estructuras de Agente
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
54/71
Hasta ahora hemos hablado de la conducta de los agentesinteligentes. . .
que es la accion dada una secuencia de percepciones.
La IA debe disenarlo que se conoce como el programa del agente
Los programas de agente se ejecutan en computadores con sensores
y actuadores.
Esto se llama Arquitectura
Entonces: Agente = Arquitectura + Programa.
El programa debe ser el adecuado para la arquitectura.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 54 / 71
Programas de Agente I
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
55/71
La mayora sigue la misma estructura:
recibenpercepciones desde sensores
envan acciones a actuadores
Programa y Funcion del Agente
El programa recibe la percepcion actual:
porque no hay algo disponible en el entorno por ende, es necesario recordar las percepciones.
La funcion recibe todo el historico de percepciones (tabla).
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 55 / 71
Programas de Agente II
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
56/71
Cual es el problema con la tabla de agente?
Esta condenada al fracaso.
Veamos el caso del taxi automatizado:
si cada imagen de camara entrega una tasa de 27MBs
, suponiendo unaresolucion de 640 480, con 24 bits de color y 30 fps.
Se estima que por cada hora de conduccion tendramos una tabla conla no despreciable cantidad de 10250.000.000.000 entradas.
En el caso del pequeno y ordenado mundo del Ajedrez:
Al menos tendramos 10150 entradas
Solo como referencia
Se calcula que el numero de atomos observables en el universo es delorden de 1080.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 56 / 71
Programas de Agente III
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
57/71
La idea de la IA es crear programas de agentes racionales usando una
pequena cantidad de codigo, sin tener que recurrir a grandes tablas.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 57 / 71
Programas de Agente IV
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
58/71
Otras areas han logrado un objetivo similar
Antiguamente haban grandes tablas con races cuadradas paraingenieros y matematicos:
hoy las calculadoras utilizan un programa que no excede las cincolneas.
De la misma manera para el calculo de funcioneslogartmico-exponenciales, circulares, etc.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 58 / 71
Programas de Agente V
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
59/71
Tipos de programa de agente.
1 Agentes reactivos simples.
2 Agentes reactivos basados en modelos.3 Agentes basados en objetivos.
4 Agentes basados en utilidad.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 59 / 71
Tipos de Programa de Agente IAgentes Reactivos Simples
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
60/71
Es el tipo de agente mas sencillo.
Seleccionan la accion solo sobre las percepciones actuales del agente,ignorando las percepciones historicas.
Ejemplo: Funcion de Agente Reflejo Simple Aspiradora
Entrada: [ubicacion, estado]Salida: accion
1: si estado = Sucio entonces2: retornar Limpiar3: sino si ubicacion = A entonces
4: retornar Derecha5: sino si ubicacion = B entonces6: retornar Izquierda7: fin si
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 60 / 71
Tipos de Programa de Agente IIAgentes Reactivos Simples
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
61/71
Las reacciones son conexiones mentales que siguen una reglasencilla:
si entonces
por ejemplo: si el auto que va adelante enciende la luz de freno,entonces frenar.
Estas reglas se llaman reglas de condicion-accion (CA)
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 61 / 71
Tipos de Programa de Agente IIIAgentes Reactivos Simples
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
62/71
Estos agentes son simples pero tienen una inteligencia limitada.
Por lo general requieren que el mundo sea totalmente observable:
si acaso lo que se desea es tomar la decision correcta.
Otro problema es que pueden caer en bucles infinitos, dependiendo desu arquitectura:
pueden tomar decisiones de modo aleatorio
por ejemplo: aspiradora sin sensor de ubicacion.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 62 / 71
Tipos de Programa de Agente IAgentes basados en Modelos
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
63/71
El problema a resolver es la visibilidad del mundo.La solucion para la visibilidad parcial: almacenar aquellas partes delmundo que no se ven:
se requiere de un estado interno que dependa de la historia de las percepciones
por ejemplo: al conducir, saber donde estan los otros vehculos.
Se necesita informacion sobre el comoevoluciona el mundo,independiente del agente: saber por ejemplo que los autos seacercan cuando frenan.
El como es lo que se conoce como modelo.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 63 / 71
Tipos de Programa de Agente IIAgentes basados en Modelos
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
64/71
cmo eselmundoahora
Agente
sensores
actuadores
A
M
B
IE
N
T
E
percepcin
acciones
qu accinemprenderahora
estado
cmoevolucionaelmundo
quhacenmis
acciones
reglasCA
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 64 / 71
Tipos de Programa de Agente IAgentes basados en Objetivos
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
65/71
No siempre es suficiente el conocimiento sobre el estado actual delmundo.
Por ejemplo: el taxista automatico al verse enfrentado a un cruce decalles...
puede decidir girar a la izquierda, derecha o bien continuar su marcha
hacia adelante dependiendo hacia donde quiere ir, y NO de las percepciones del
mundo.
Se requiere, por lo tanto, informacion sobre un objetivo o metapara el agente.
Para esto, se puede emplear el resultado que generen las acciones, deun modo similar a como opera el agente basado en modelos.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 65 / 71
Tipos de Programa de Agente IIAgentes basados en Objetivos
Estructura de un agente reactivo basado en objetivos
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
66/71
Estructura de un agente reactivo basado en objetivos
cmo eselmundoahora
Agente
sensores
actuadores
A
M
B
I
E
N
T
E
percepcin
acciones
quaccindebieraemprender ahora
estado
cmoevolucionaelmundo
quhacenmisacciones
metas
cmosersiemprendo
la accin A ?
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 66 / 71
Tipos de Programa de Agente IIIAgentes basados en Objetivos
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
67/71
Se recomienda su uso en. . .
Busqueda.
Planificacion.
Porque encuentran secuencias de acciones para alcanzar objetivosconcretos:
de acuerdo a lo que agente perciba.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 67 / 71
Tipos de Programa de Agente IAgentes basados en Utilidad
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
68/71
Las metas por s solas no son suficientes:
para generar comportamiento de gran calidad
Por ejemplo, hay muchas maneras de que el taxi automatico llegue asu destino:
no esta en discusion que el taxista cumple con su objetivo
pero no todas resultan comodas o baratas para el usuario.
Por lo tanto, las metas definen vagamente lo que es felicidad ytristeza, con respecto al cumplimiento de objetivos.
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 68 / 71
Tipos de Programa de Agente IIAgentes basados en Utilidad
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
69/71
Sera mejor tener una medida concreta de felicidad que permita
comparar estados: cientficamente conocida como utilidad un estado puede tener mas utilidad que otro.
Funcion de Utilidad
Toma uno o mas estado y los transforma a un numero real, que va arepresentar al nivel de felicidad del agente.
A veces hay estados conflictivos:
la utilidad representa un balance
por ejemplo: velocidad y seguridad al conducir
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 69 / 71
Tipos de Programa de Agente IIIAgentes basados en Utilidad
Estructura de un agente basado en utilidad
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
70/71
g
cmoeselmundoahora
Agente
sensores
actuadores
A
M
B
I
E
N
T
E
percepcin
acciones
quaccindebieraemprender ahora
estado
cmoevolucionaelmundo
quhacenmisacciones
utilidad
cmosersiemprendola accin A?
qutan feliz serenese caso?
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 70 / 71
7/25/2019 unidadno-5-agentesinteligentes-111106203032-phpapp02.pdf
71/71
Fin de la Unidad 5
M. Ramrez K. (USS) Apunte curso IA Primer Semestre 2011 71 / 71