76
Resumen Implementaci´ on de Esquemas Num´ ericos para la Ecuaci´ on de Bellman y Aplicaciones a la Optimizaci´ on de Trayectorias Jos´ e Eduardo Aliste Prieto Departemento de Ingenier´ ıa Matem´ atica Universidad de Chile 7 de enero de 2005 Jos´ e Eduardo Aliste Prieto Implementaci´ on de Esquemas Num´ ericos para la Ecuaci´ on de Bel

Implementación de Esquemas Numéricos para la Ecuación de ...jaliste/pres_beamer.pdf · 5 Pruebas Num´ericas Pruebas en 1D Jos´e Eduardo Aliste Prieto Implementaci´on de Esquemas

  • Upload
    others

  • View
    19

  • Download
    0

Embed Size (px)

Citation preview

Resumen

Implementacion de Esquemas Numericos para laEcuacion de Bellman y Aplicaciones a la

Optimizacion de Trayectorias

Jose Eduardo Aliste Prieto

Departemento de Ingenierıa MatematicaUniversidad de Chile

7 de enero de 2005

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

Resumen Parte I: Ecuacion de Hamilton Jacobi Bellman

Parte I: Ecuacion de Hamilton Jacobi Bellman1 Introduccion

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

2 Ecuacion de Hamilton-Jacobi-BellmanIntroduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

3 Metodos de diferencias finitas para HJBMotivacionDiferencias finitas en dimension superiorImplementacion

4 Metodos decentrados5 Pruebas Numericas

Pruebas en 1D

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

Resumen Parte I: Ecuacion de Hamilton Jacobi Bellman

Parte I: Ecuacion de Hamilton Jacobi Bellman1 Introduccion

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

2 Ecuacion de Hamilton-Jacobi-BellmanIntroduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

3 Metodos de diferencias finitas para HJBMotivacionDiferencias finitas en dimension superiorImplementacion

4 Metodos decentrados5 Pruebas Numericas

Pruebas en 1D

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

Resumen Parte I: Ecuacion de Hamilton Jacobi Bellman

Parte I: Ecuacion de Hamilton Jacobi Bellman1 Introduccion

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

2 Ecuacion de Hamilton-Jacobi-BellmanIntroduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

3 Metodos de diferencias finitas para HJBMotivacionDiferencias finitas en dimension superiorImplementacion

4 Metodos decentrados5 Pruebas Numericas

Pruebas en 1D

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

Resumen Parte I: Ecuacion de Hamilton Jacobi Bellman

Parte I: Ecuacion de Hamilton Jacobi Bellman1 Introduccion

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

2 Ecuacion de Hamilton-Jacobi-BellmanIntroduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

3 Metodos de diferencias finitas para HJBMotivacionDiferencias finitas en dimension superiorImplementacion

4 Metodos decentrados5 Pruebas Numericas

Pruebas en 1D

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

Resumen Parte I: Ecuacion de Hamilton Jacobi Bellman

Parte I: Ecuacion de Hamilton Jacobi Bellman1 Introduccion

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

2 Ecuacion de Hamilton-Jacobi-BellmanIntroduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

3 Metodos de diferencias finitas para HJBMotivacionDiferencias finitas en dimension superiorImplementacion

4 Metodos decentrados5 Pruebas Numericas

Pruebas en 1D

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

Resumen Parte I: Ecuacion de Hamilton Jacobi Bellman

Parte II: Modelos Aeroespaciales

6 Modelo general

7 Modelo reducido

8 Hamiltoniano decentrado

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

Resumen Parte I: Ecuacion de Hamilton Jacobi Bellman

Parte II: Modelos Aeroespaciales

6 Modelo general

7 Modelo reducido

8 Hamiltoniano decentrado

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

Resumen Parte I: Ecuacion de Hamilton Jacobi Bellman

Parte II: Modelos Aeroespaciales

6 Modelo general

7 Modelo reducido

8 Hamiltoniano decentrado

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Parte I

Ecuacion de Hamilton-Jacobi-Bellman

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

Resumen1 Introduccion

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

2 Ecuacion de Hamilton-Jacobi-BellmanIntroduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

3 Metodos de diferencias finitas para HJBMotivacionDiferencias finitas en dimension superiorImplementacion

4 Metodos decentrados5 Pruebas Numericas

Pruebas en 1D

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

Sistemas controlados

Consideremos el siguiente sistema dinamico controlado:y(t) = f (y(t), α(t)), t ≥ 0

y(0) = x

donde x ∈ RN es la posicion inicial, yx ,α(·) ∈ RN es la trayectoria,f es la dinamica y α el control, elegido en el espacio de controles:

A = α : [0,∞) → Rm|α es medible y α(t) ∈ A c.t.p. t > 0

con A ⊂ Rm compacto. Supondremos que f es continua y quef (∗, a) es uniformemente Lipschitz con respecto a a ∈ A.

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

Ejemplo: El carro-cohete

Consideramos un carro el cual:

Esta restringido a moverse en una sola direccion.

El carro tiene control exacto de su aceleracion.

El modulo de la aceleracion es menor que 1[m/s2].

El sistema controlado para el carro es:y(t) =

(0 1

0 0

)y(t) +

(0

1

)α(t),

y(0) = x ,

A = [−1, 1]

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

Ejemplo: El carro-cohete

Consideramos un carro el cual:

Esta restringido a moverse en una sola direccion.

El carro tiene control exacto de su aceleracion.

El modulo de la aceleracion es menor que 1[m/s2].

El sistema controlado para el carro es:y(t) =

(0 1

0 0

)y(t) +

(0

1

)α(t),

y(0) = x ,

A = [−1, 1]

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

Ejemplo: El carro-cohete

Consideramos un carro el cual:

Esta restringido a moverse en una sola direccion.

El carro tiene control exacto de su aceleracion.

El modulo de la aceleracion es menor que 1[m/s2].

El sistema controlado para el carro es:y(t) =

(0 1

0 0

)y(t) +

(0

1

)α(t),

y(0) = x ,

A = [−1, 1]

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

Ejemplo: El carro-cohete

Consideramos un carro el cual:

Esta restringido a moverse en una sola direccion.

El carro tiene control exacto de su aceleracion.

El modulo de la aceleracion es menor que 1[m/s2].

El sistema controlado para el carro es:y(t) =

(0 1

0 0

)y(t) +

(0

1

)α(t),

y(0) = x ,

A = [−1, 1]

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

Problema de Controlabilidad

Destino o Interfaz: T ⊂ RN conjunto cerrado con fronteracompacta.

Tiempo de llegada a Destino:tx(α) = inft > 0 : yx ,α(t) ∈ T Tiempo Mınimo: T (x) = inftx(α) : α ∈ AConjunto Alcanzable: R = x ∈ RN : T (x) < +∞Preguntas:

¿Como es el Conjunto R?¿Es posible caracterizar R de acuerdo a las propiedades de f yde A?

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

Problema de Controlabilidad

Destino o Interfaz: T ⊂ RN conjunto cerrado con fronteracompacta.

Tiempo de llegada a Destino:tx(α) = inft > 0 : yx ,α(t) ∈ T Tiempo Mınimo: T (x) = inftx(α) : α ∈ AConjunto Alcanzable: R = x ∈ RN : T (x) < +∞Preguntas:

¿Como es el Conjunto R?¿Es posible caracterizar R de acuerdo a las propiedades de f yde A?

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

Problema de Controlabilidad

Destino o Interfaz: T ⊂ RN conjunto cerrado con fronteracompacta.

Tiempo de llegada a Destino:tx(α) = inft > 0 : yx ,α(t) ∈ T Tiempo Mınimo: T (x) = inftx(α) : α ∈ AConjunto Alcanzable: R = x ∈ RN : T (x) < +∞Preguntas:

¿Como es el Conjunto R?¿Es posible caracterizar R de acuerdo a las propiedades de f yde A?

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

Control Optimo

Seleccion de controles: Si x ∈ R, ¿ Cual es el mejor controlara alcanzar T ?

Criterio de minimizacion:

J(x , α) =

∫ tx (α)

0`(yx ,α(s), α(s))e−λsds+e−λtx (α)g(yx ,α(tx(α)))

(1)donde ` es el costo instantaneo, g es el costo final y λ ≥ 0 esla tasa de descuento.

Definition (Control Optimo)

Dado un estado inicial x , un control α∗ ∈ A se dice CONTROLOPTIMO si

J(x , α∗) = infJ(x , α) : α ∈ A

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

Control Optimo(cont.)

El objetivo general de este trabajo es:

El estudio de metodos numericos para encontrar controlesoptimos para un sistema (f ,A, `, g , T ) y estado inicial x

dados.

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

Algunos metodos en control optimo

Metodos Directos: Discretizan directamente el problema,obteniendo un programa no lineal (NLP), el cual resuelvenutilizando metodos conocido de optimizacion numerica:

Programacion Cuadratica Secuencial (SQP) (ver [Bet01])

Metodos de Punto interior (ver [BBH+03])

Metodos indirectos: Escriben condiciones de optimalidad para elproblema de control, las cuales son luego discretizadas y resueltasmediante algoritmos adhoc

Principio de Pontryagin y Metodos de tiro.(Ver [Gui02]).

Programacion Dinamica.

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

Algunos metodos en control optimo

Metodos Directos: Discretizan directamente el problema,obteniendo un programa no lineal (NLP), el cual resuelvenutilizando metodos conocido de optimizacion numerica:

Programacion Cuadratica Secuencial (SQP) (ver [Bet01])

Metodos de Punto interior (ver [BBH+03])

Metodos indirectos: Escriben condiciones de optimalidad para elproblema de control, las cuales son luego discretizadas y resueltasmediante algoritmos adhoc

Principio de Pontryagin y Metodos de tiro.(Ver [Gui02]).

Programacion Dinamica.

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

Algunos metodos en control optimo

Metodos Directos: Discretizan directamente el problema,obteniendo un programa no lineal (NLP), el cual resuelvenutilizando metodos conocido de optimizacion numerica:

Programacion Cuadratica Secuencial (SQP) (ver [Bet01])

Metodos de Punto interior (ver [BBH+03])

Metodos indirectos: Escriben condiciones de optimalidad para elproblema de control, las cuales son luego discretizadas y resueltasmediante algoritmos adhoc

Principio de Pontryagin y Metodos de tiro.(Ver [Gui02]).

Programacion Dinamica.

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

Algunos metodos en control optimo

Metodos Directos: Discretizan directamente el problema,obteniendo un programa no lineal (NLP), el cual resuelvenutilizando metodos conocido de optimizacion numerica:

Programacion Cuadratica Secuencial (SQP) (ver [Bet01])

Metodos de Punto interior (ver [BBH+03])

Metodos indirectos: Escriben condiciones de optimalidad para elproblema de control, las cuales son luego discretizadas y resueltasmediante algoritmos adhoc

Principio de Pontryagin y Metodos de tiro.(Ver [Gui02]).

Programacion Dinamica.

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Resumen1 Introduccion

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

2 Ecuacion de Hamilton-Jacobi-BellmanIntroduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

3 Metodos de diferencias finitas para HJBMotivacionDiferencias finitas en dimension superiorImplementacion

4 Metodos decentrados5 Pruebas Numericas

Pruebas en 1D

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Principio de la Programacion Dinamica

Consideremos la funcion valor:

v(x) = infJ(x , α) : α ∈ A

Proposicion (Principio de la Programacion Dinamica)

Si t ∈ (0,T (x)) entonces

v(x) = infα∈A

∫ t

0`(yx ,α(s), α(s))e−λsds + v(yx ,α(t))e−λt

.

(PPD)

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Caso suave

Si suponemos que v es diferenciable en un punto x ∈ Ω = T c

entonces v satisface

λv(x) + supa∈A

−`(x , a)− f (x , a) · ∇v(x) = 0, (HJB)

que es una version infinitesimal de (PPD). Luego, si v esdiferenciable en todo Ω, sera solucion de la ecuacion anterior, lacual es conocida como Ecuacion de Hamilton-Jacobi-Bellman.

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Caso suave: Sıntesis del Control Optimo

Sea S la multifuncion

S(z) = argmaxa∈A

−f (z , a) ∗ ∇v(z)− `(z , a).

Se puede probar que si α∗ es un control optimo partiendo de xentonces

α∗(t) ∈ S(yx ,α∗(t)). (CO)

Mas aun, bajo hipotesis adicionales se puede probar que estacondicion es tambien suficiente. Decimos que un control elegido deesta forma es retroalimentado y que S es una funcion deretroalimentacion.

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Ventajas del enfoque de Bellman

Estabilidad de las trayectorias frente a perturbaciones.

Si uno conociera S explicitamente, podrıa calcular controlesoptima para cualquier condicion inicial x dada.

Si uno conociera v entonces para calcular S debemos resolverun programa no lineal ”standard”(En general, basta encontrarun solo mınimo).

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Ventajas del enfoque de Bellman

Estabilidad de las trayectorias frente a perturbaciones.

Si uno conociera S explicitamente, podrıa calcular controlesoptima para cualquier condicion inicial x dada.

Si uno conociera v entonces para calcular S debemos resolverun programa no lineal ”standard”(En general, basta encontrarun solo mınimo).

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Ventajas del enfoque de Bellman

Estabilidad de las trayectorias frente a perturbaciones.

Si uno conociera S explicitamente, podrıa calcular controlesoptima para cualquier condicion inicial x dada.

Si uno conociera v entonces para calcular S debemos resolverun programa no lineal ”standard”(En general, basta encontrarun solo mınimo).

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Desventajas del enfoque de Bellman

v es imposible de calcular directamente.

v no es necesariamente diferenciable.¿Como interpretarentonces (HJB)?

Aun siendo v diferenciable, no hay unicidad de soluciones para(HJB), incluso con las correctas condiciones de borde.

Incluso para los problemas mas simples, (HJB) es unaecuacion completamente no lineal(Fully No linear), y por lotanto dificil de resolver.

En la mayorıa de las aplicaciones, N ≥ 4.

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Desventajas del enfoque de Bellman

v es imposible de calcular directamente.

v no es necesariamente diferenciable.¿Como interpretarentonces (HJB)?

Aun siendo v diferenciable, no hay unicidad de soluciones para(HJB), incluso con las correctas condiciones de borde.

Incluso para los problemas mas simples, (HJB) es unaecuacion completamente no lineal(Fully No linear), y por lotanto dificil de resolver.

En la mayorıa de las aplicaciones, N ≥ 4.

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Desventajas del enfoque de Bellman

v es imposible de calcular directamente.

v no es necesariamente diferenciable.¿Como interpretarentonces (HJB)?

Aun siendo v diferenciable, no hay unicidad de soluciones para(HJB), incluso con las correctas condiciones de borde.

Incluso para los problemas mas simples, (HJB) es unaecuacion completamente no lineal(Fully No linear), y por lotanto dificil de resolver.

En la mayorıa de las aplicaciones, N ≥ 4.

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Desventajas del enfoque de Bellman

v es imposible de calcular directamente.

v no es necesariamente diferenciable.¿Como interpretarentonces (HJB)?

Aun siendo v diferenciable, no hay unicidad de soluciones para(HJB), incluso con las correctas condiciones de borde.

Incluso para los problemas mas simples, (HJB) es unaecuacion completamente no lineal(Fully No linear), y por lotanto dificil de resolver.

En la mayorıa de las aplicaciones, N ≥ 4.

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Desventajas del enfoque de Bellman

v es imposible de calcular directamente.

v no es necesariamente diferenciable.¿Como interpretarentonces (HJB)?

Aun siendo v diferenciable, no hay unicidad de soluciones para(HJB), incluso con las correctas condiciones de borde.

Incluso para los problemas mas simples, (HJB) es unaecuacion completamente no lineal(Fully No linear), y por lotanto dificil de resolver.

En la mayorıa de las aplicaciones, N ≥ 4.

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Conclusiones

Para calcular v tenemos dos herramientas: El principio de laProgramacion Dinamica y la Ecuacion deHamilton-Jacobi-Bellman.

Necesitamos una nocion de solucion bien adaptada a este tipode problemas, en la cual podamos caracterizar v comosolucion en este nuevo sentido de (HJB).

La respuesta al segundo puento fue dada por Crandall y Lions en[CL83], quienes proponen una nueva nocion de solucion(la solucionde viscosidad) que posee las propiedades deseadas.

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Soluciones de Viscosidad para HJ

Sea Ω ⊂ RN un abierto, λ ≥ 0 y la ecuacion de Hamilton-Jacobi:

λu(x) + H(x ,∇u(x)) = 0 (HJ)

Definition

Una funcion u ∈ C (Ω) se dice subsolucion(respectivamentesupersolucion) de viscosidad de (HJ) si para cualquier ϕ ∈ C 1(Ω)y cualquier x0 ∈ Ω maximo local(respectivamente mınimo local) deu − ϕ se tiene

λu(x0) + H(x0,∇ϕ(x0)) ≤ 0.(resp. ≥ 0)

Finalmente, decimos que u es una solucion de viscosidad de (HJ)si es simultaneamente una subsolucion de viscosidad y unasupersolucion de viscosidad de (HJ).

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Principio de Comparacion

Theorem ([BCD97, Teo. II.3.1])

Sea Ω un abierto acotado de RN . Suponga que u1, u2 ∈ C (Ω) son,respectivamente,una sub- y supersolucion de viscosidad de

u(x) + H(x ,∇u(x)) = 0, x ∈ Ω

y que u1 ≤ u2 sobre ∂Ω. Suponga ademas que H satisface

|H(x , p)− H(y , p)| ≤ ω1(|x − y |(1 + |p|)) (H1)

donde ω1 es un modulo de continuidad, es decir,ω1 : [0,+∞[→ [0,+∞[ es continua no decreciente y ω1(0) = 0.Entonces u1 ≤ u2 en Ω.

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Unicidad del Problema de Dirichlet para HJ

Consideremos el siguiente Problema de contorno tipo Dirichlet:λu + H(x ,∇u) = 0, x ∈ Ω,

u = g , x ∈ ∂Ω,(HJC)

donde λ > 0. Decimos que una solucion de viscosidad que satisfacela condicion de borde es una solucion de (HJC). Supongamos que(HJC) tiene solucion y que H satisface las hipotesis del Teoremaanterior. Entonces, en C (Ω) hay una unica solucion de (HJC).

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

La funcion valor y la ecuacion HJB

Denotemos por Q el dominio de v , es decir,

Q = x ∈ RN : v(x) < +∞

Proposicion

Suponga que v es continua y Q es abierto. Entonces v es solucionde viscosidad de

λv(x) + supa∈A

−`(x , a)−∇v(x) · f (x , a) = 0, x ∈ Q \ T .

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Continuidad de la funcion valor

El resultado anterior nos estimula a estudiar las condiciones bajolas cuales v es una funcion continua.

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Horizonte infinito Clasico

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Destino no vacıo: hipotesis de controlabilidad local

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Tasa de descuento nula: Transformada de Kruzkov

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Costo final no nulo: hipotesis de compatibilidad

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Introduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

Algunos comentarios sobre soluciones no-continuas de HJ

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

MotivacionDiferencias finitas en dimension superiorImplementacion

Resumen1 Introduccion

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

2 Ecuacion de Hamilton-Jacobi-BellmanIntroduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

3 Metodos de diferencias finitas para HJBMotivacionDiferencias finitas en dimension superiorImplementacion

4 Metodos decentrados5 Pruebas Numericas

Pruebas en 1D

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

MotivacionDiferencias finitas en dimension superiorImplementacion

Motivacion

Consideremos la ecuacion:u(x)− 1 + |u′(x)| = 0, x 6= 0,

u(0) = 0,(2)

y la aproximacion centrada:uj − 1 +

|uj+1−uj−1|2δ = 0, j 6= 0,

u0 = 0,(3)

Podemos observar que:

Si u0 es la solucion de (2), entonces u0 es creciente.

Es razonable imponer que la aproximacion sea tambiencreciente, es decir, ui ≤ uj si i ≤ j . Ası, (3) queda

uj + 1 = uj−1 − 2δuj + 2δ (4)

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

MotivacionDiferencias finitas en dimension superiorImplementacion

Motivacion

Consideremos la ecuacion:u(x)− 1 + |u′(x)| = 0, x 6= 0,

u(0) = 0,(2)

y la aproximacion centrada:uj − 1 +

|uj+1−uj−1|2δ = 0, j 6= 0,

u0 = 0,(3)

Podemos observar que:

Si u0 es la solucion de (2), entonces u0 es creciente.

Es razonable imponer que la aproximacion sea tambiencreciente, es decir, ui ≤ uj si i ≤ j . Ası, (3) queda

uj + 1 = uj−1 − 2δuj + 2δ (4)

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

MotivacionDiferencias finitas en dimension superiorImplementacion

Motivacion(cont.)

(4) puede ser resuelta analıticamente,

uj = A(−δ +√

δ2 + 1)j + B(−δ −√

δ2 + 1)j + 1, j > 1,

con A y B constantes a determinar.

Para calcular A y B necesitamos valores a priori de u0 y u1.

Como u(0) = 0, resta ver que valor a priori dar a u1.

De la forma (4), esperamos que aparezcan oscilaciones en laaproximacion si el valor a prior de u1 es “MAL ELEGIDO”.

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

MotivacionDiferencias finitas en dimension superiorImplementacion

Motivacion: Efecto de u1

0

0.2

0.4

0.6

0.8

0.2 0.4 0.6 0.8 1

0.1

0.2

0.3

0.4

0.5

0.6

0 0.2 0.4 0.6 0.8 1

Figura: Aproximacion (4) usando δ = 0,01 y u1 = 0,2(izquierda) yu1 = 1− e−0,01 + 0,01(derecha)

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

MotivacionDiferencias finitas en dimension superiorImplementacion

Motivacion: Como elegir u1

Consideremos la siguiente aproximacion decentrada:

uj − 1 +|uj−1 − uj |

δ= 0, j 6= 0 (5)

Para resolver (5) necesitamos un valor a priori solo para u0.

Tenemos dos metodos para resolver (2):1 Resolver (4) utilizando (5) para calcular el valor a priori de

u1(metodo hibrido).2 Resolver (5)(metodo decentrado).

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

MotivacionDiferencias finitas en dimension superiorImplementacion

Comparacion de metodos: hıbrido v/s decentrado.

0.1

0.2

0.3

0.4

0.5

0.6

0.2 0.4 0.6 0.8 1

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

MotivacionDiferencias finitas en dimension superiorImplementacion

Comparacion de metodos:(cont.)

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1−5

0

5

10

15

20x 10

−3

0 0.5 1 1.5 2 2.5 3 3.5 40

0.02

0.04

0.06

0.08

0.1

0.12

Figura: Error absoluto de los metodos con δ = 0,1. Metododecentrado(azul) y metodo hıbrido(verde)

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

MotivacionDiferencias finitas en dimension superiorImplementacion

Observaciones

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

MotivacionDiferencias finitas en dimension superiorImplementacion

Diferencias finitas en dimension superior: Notaciones

Si j ∈ ZN , |j | :=∑N

i=1 |ji |.Sea δ ∈ RN

++ el paso de discretizacion en espacio.

Sea iδ : ZN → RN definida por:

iδ(j) = (δ1j1, δ2j2, · · · , δnjn).

RNδ := iδ(Z

N) y denotamos x j = iδ(j).

Si A ⊂ RN , Aδ = A ∩ RNδ .

Si B ⊂ RNδ , B = i−1

δ (B).

Sea u : RN → R, denotamos por uj una aproximacion de u enx j y ∆φuj una aproximacion de ∇u(x j) dada por

∆Φuj := Φ(j , δ, E1, a).

donde E1 = (ul : |l − j | ≤ 1).

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

MotivacionDiferencias finitas en dimension superiorImplementacion

Diferencias finitas en dimension superior: Notaciones

Si j ∈ ZN , |j | :=∑N

i=1 |ji |.Sea δ ∈ RN

++ el paso de discretizacion en espacio.

Sea iδ : ZN → RN definida por:

iδ(j) = (δ1j1, δ2j2, · · · , δnjn).

RNδ := iδ(Z

N) y denotamos x j = iδ(j).

Si A ⊂ RN , Aδ = A ∩ RNδ .

Si B ⊂ RNδ , B = i−1

δ (B).

Sea u : RN → R, denotamos por uj una aproximacion de u enx j y ∆φuj una aproximacion de ∇u(x j) dada por

∆Φuj := Φ(j , δ, E1, a).

donde E1 = (ul : |l − j | ≤ 1).

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

MotivacionDiferencias finitas en dimension superiorImplementacion

Sistema de diferencias finitas

Con las notaciones anteriores podemos escribir la siguienteaproximacion:

λvj = infa∈A`(x j , a) + f (x j , a) ·∆Φvj, j ∈ Ωδ

vj = g(x j), j ∈ Tδ(PCD)

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

MotivacionDiferencias finitas en dimension superiorImplementacion

Existencia de aproximaciones

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

MotivacionDiferencias finitas en dimension superiorImplementacion

Convergencia de aproximaciones

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

MotivacionDiferencias finitas en dimension superiorImplementacion

Implementacion

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

MotivacionDiferencias finitas en dimension superiorImplementacion

Truncamiento

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Resumen1 Introduccion

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

2 Ecuacion de Hamilton-Jacobi-BellmanIntroduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

3 Metodos de diferencias finitas para HJBMotivacionDiferencias finitas en dimension superiorImplementacion

4 Metodos decentrados5 Pruebas Numericas

Pruebas en 1D

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Metodo decentrado teorico

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Metodo decentrado truncado

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Condicion de estabilidad

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Convergencia

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Pruebas en 1D

Resumen1 Introduccion

Sistemas controladosProblema de ControlabilidadControl OptimoMetodos Numericos

2 Ecuacion de Hamilton-Jacobi-BellmanIntroduccion y MotivacionSoluciones de ViscosidadPrincipios de Comparacion y UnicidadContinuidad de la funcion valor

3 Metodos de diferencias finitas para HJBMotivacionDiferencias finitas en dimension superiorImplementacion

4 Metodos decentrados5 Pruebas Numericas

Pruebas en 1D

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

IntroduccionEcuacion de Hamilton-Jacobi-Bellman

Metodos de diferencias finitas para HJBMetodos decentrados

Pruebas Numericas

Pruebas en 1D

Pruebas en 1D

ConsideramosN = 1, λ = 1, T = 0`(x , a) = x , f (x , a) = −xa,A = [0, 1].

(6)

La ecuacion (HJB) se reescribe como:

v(x) =

x − v ′(x)x si v ′(x)x > 0

x si v ′(x)x < 0(7)

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

Modelo generalModelo reducido

Hamiltoniano decentrado

Resumen

6 Modelo general

7 Modelo reducido

8 Hamiltoniano decentrado

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

Modelo generalModelo reducido

Hamiltoniano decentrado

Resumen

6 Modelo general

7 Modelo reducido

8 Hamiltoniano decentrado

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

Modelo generalModelo reducido

Hamiltoniano decentrado

Resumen

6 Modelo general

7 Modelo reducido

8 Hamiltoniano decentrado

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

Conclusiones

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias

Referencias

beamericonarticleN. Berend, J.F. Bonnans, M. Haddou, J. Laurent-Varin, andC. Talbot.A preliminary interior point algorithm for solving optimalcontrol problems.In Fifth Int. Conf. on Launcher Technology, Madrid, November25-27, 2003.

beamericonarticleMartino Bardi and Italo Capuzzo-Dolcetta.Optimal control and viscosity solutions ofHamilton-Jacobi-Bellman equations.Systems & Control: Foundations & Applications. BirkhauserBoston Inc., Boston, MA, 1997.With appendices by Maurizio Falcone and Pierpaolo Soravia.

beamericonarticleJ.T. Betts.Practical Methods for Optimal Control Using NonlinearProgramming.SIAM Advances in Design and Control, 2001.

beamericonarticleMichael G. Crandall and Pierre-Louis Lions.Viscosity solutions of Hamilton-Jacobi equations.Trans. Amer. Math. Soc., 277(1):1–42, 1983.

beamericonarticleT. Guilbaud.Methodes numeriques pour la commande optimale.PhD thesis, Universite de Paris VI, 2002.

Jose Eduardo Aliste Prieto Implementacion de Esquemas Numericos para la Ecuacion de Bellman y Aplicaciones a la Optimizacion de Trayectorias