Estrategia Subóptima Para El Problema de Control Óptimo Lineal Cuadrática en Tiempo Finito

Embed Size (px)

DESCRIPTION

suboptima

Citation preview

  • ESTRATEGIA SUBPTIMA PARA EL PROBLEMA DE CONTROL PTIMO LINEAL CUADRTICA EN TIEMPO FINITO Resumen: En este artculo, los autores estudian analticamente el impacto de la ganancia de retroalimentacin constante ptima del problema de control ptimo lineal cuadrtica estado estacionario al problema de control correspondiente en tiempo finito lineal cuadrtica ptima. Aportaciones del estudio son de 3 tipos: (i) las condiciones de aplicabilidad de este procedimiento subptimo se presentan; (ii) una frmula para la prdida de rendimiento debido a esta aplicacin prctica (uso de la constante en lugar de la ganancia variable en el tiempo) se deriva; y se discute (iii) una tcnica basada en el grado prescrito de estabilidad que se puede utilizar con xito en la prctica. Ejemplos se incluyen para demostrar la prdida de rendimiento debido a esta (subptima) aplicacin simplificada aproximada lineal cuadrtica finito-horizonte de control ptimo problema. Introduccin La ganancia de realimentacin ptima de problema de control cuadrtica (LQ) lo finito horizonte-linealidad se obtiene resolviendo la ecuacin de Riccati diferencial, y por lo tanto es variable en el tiempo. La aplicacin de una ganancia de realimentacin constante (obtenida mediante la resolucin de la ecuacin algebraica de Riccati el horizonte infinite- problema correspondiente control ptimo LQ) en lugar de la ganancia de realimentacin variable en el tiempo simplifica enormemente la implementacin. Es bien sabido que en el lmite, en ciertas condiciones, cuando el horizonte de optimizacin tiende a infinito, la ganancia ptima LQ variable en el tiempo se aproxima a la (estado estacionario) de ganancia ptima LQ invariante en el tiempo. A continuacin, se estudia el impacto en el criterio de desempeo cuadrtica del uso de la constante de ganancia ptima retroalimentacin LQ en el LQ problema de control ptimo finito-horizonte. Las principales contribuciones de este trabajo son evaluar la prdida de rendimiento correspondientes, proporcionar directrices para la aplicacin del procedimiento presentado y proponer una tcnica basada en el grado prescrito de mtodo de la estabilidad que puede ser utilizado con xito en la prctica. Las soluciones a los problemas finitas y optimizacin horizonte LQ-tiempo infinito se conocen desde la obra original de Kalman [1], y que se pueden encontrar en muchos libros de texto estndar en los sistemas de control ptimos lineales, por ejemplo [2-4]. Ha sido todava un rea de investigacin activa como se ha demostrado en los recientes documentos [5, 6]. El "problema de control ptimo LQ-horizonte finito 'se define por

    Y

    Tenga en cuenta que ya que la matriz Q es simtrica y positiva semi-definido que se puede escribir como Q = CTC, donde C es el factor de Cholesky de Q [7]. La solucin conocida a la problema de optimizacin se define en (1) y (2) conduce a la variable en el tiempo ganancia de realimentacin ptima dada por

  • Una solucin nica P (t) = P (t, tf) de la ecuacin diferencial de Riccati se define en (3) se puede encontrar mediante la integracin hacia atrs en el tiempo a partir de Pf, el problema valor final. Esta solucin existe durante un intervalo de tiempo finito-bajo condiciones suaves indicados en la siguiente suposicin [3]. Supuesto 1: Matrices A, Q, S, Pf son constantes con S, Q, Pf ser positivo semi-definido. Lema 1 [3]: En condiciones establecidas en Asuncin 1, el Ecuacin diferencial de Riccati se define en (3) tiene un nico solucin semi-definida positiva en un intervalo de tiempo finito [t0, tf]. Por la razn de la simplicidad, la dependencia del criterio de desempeo ptimo en el sistema inicial condiciones es suprimida por suponiendo que el inicial condiciones se distribuyen uniformemente sobre la esfera unidad, que es un supuesto estndar en los estudios analticos de el problema de control ptimo LQ. Vamos a adoptar esta simplificacin en los ejemplos presentados. El 'LQ control ptimo en tiempo infinito correspondiente imponentes supuestos estndar correspondientes [1-4, 8] en las matrices de problemas, que se indicarn en Asuncin 2. Minimizacin de

    sujetos a (1) requiere que la ecuacin algebraica de Riccati ser resuelto [en lugar de la ecuacin diferencial de Riccati (3)], que produce una ptima ganancia de retroalimentacin de estado estacionario constante

    Es comn en la literatura de ingeniera para imponer las condiciones stabilisability-detectabilidad (formas ms dbiles de las condiciones controlabilidad-observabilidad) [1-4, 8] para garantizar la existencia de una solucin estabilizadora nica de (5). Por lo tanto, necesitamos la siguiente hiptesis. Supuesto 2: El triple (A, B, C) es stabilisable y detectable. Lema 2 [1-4, 8]: Bajo condiciones establecidas en la asuncin 2, la ecuacin algebraica de Riccati se define en (5) tiene una solucin semi-definida positiva nica estabilizacin, es decir, la matriz de realimentacin A - SP es asintticamente estable. Es importante tener en cuenta que existe la solucin nica semidefinite estabilizar positiva de la ecuacin algebraica de Riccati se define en (3), incluso bajo condiciones ms suaves que los especificados en la asuncin 2. Ellos se dan en la siguiente lema [9]. Lema 3 [9]: La solucin estabilizante nico positivo semi-definido de la ecuacin algebraica de Riccati se define en (3) existe si el par (A, B) es stabilisable y la matriz hamiltoniano

    no tiene valores propios sobre el eje imaginario. En tal caso, la matriz de realimentacin A - SP es asintticamente estable. Es bien sabido que, en Asuncin 2 [3], en el lmite cuando tf alinfinito, tenemos

    5

  • OBSERVACIN 1: Cabe destacar que (6) 'no se sostiene en las condiciones establecidas en' Lema 3 a pesar de que Fopt existe y A - SP es asintticamente estable. En tal caso, una condicin adicional tiene que ser impuesta, que de hecho es la condicin que garantiza que la solucin de la ecuacin diferencial de Riccati tiende a la solucin de la ecuacin algebraica de Riccati como t tiende al infinito, [10]. Esa condicin se dar ms adelante en el documento, vanse las frmulas (24), (25) y Comentario 2. Debido al resultado dado en (6), los ingenieros de control de implementar la constante de horizonte infinito ganancia de realimentacin definido en (5) como una solucin subptima para el problema de control ptimo horizonte finito [que requiere el tiempo- variable ganancia de realimentacin definido en (3 )]. Bsicamente, si el intervalo de tiempo de optimizacin tf - que es grande, parece que una implementacin de este tipo podra estar justificada. Hasta nuestro mejor conocimiento, en la literatura de ingeniera de control, no hay ninguna justificacin analtica para tal implementacin. En este estudio, vamos a derivar una expresin para la prdida de rendimiento debido a dicha implementacin y mostrar en un ejemplo de un problema de control ptimo realista, tomado de la prctica de ingeniera de la automocin, que "una implementacin de este tipo puede producir una prdida de gran rendimiento en un amplio intervalo de hora'. Al final, proporcionaremos directrices cuando la aplicacin considerada (suponiendo que es aplicable, ver Nota 1) produce resultados satisfactorios. En primer lugar, se formula el problema de control subptimo (aproximado) LQ finito horizonte de (1) y (2) que utiliza la ganancia ptima constante definida en (5), y determinar el criterio de desempeo correspondiente de la optimizacin finitos horizonte. El 'control subptimo "para (1) se define por

    El rendimiento correspondiente finito horizonte subptima criterio (2) bajo el control subptimo definido en (5) es dada por (ver (8))

    Usando un resultado conocido (por ejemplo, [3, el teorema 1.54, p. 110]), el criterio de rendimiento (8) se puede evaluar como

    La solucin K (t) = K (t, tf) se puede obtener mediante la integracin hacia atrs en el tiempo a partir de la condicin final dado. En la siguiente seccin, se presenta un ejemplo motivador, realista finitos horizonte de control ptimo que indica una situacin cuando el controlador subptima (7) no se puede utilizar en la prctica, a pesar de que tf es grande. En el seguimiento del trabajo vamos a encontrar la razn de este problema y vamos a ofrecer directrices bajo las cuales el controlador subptima se define en (7) y (8) se puede utilizar (asumiendo que es factible, ver Nota 1). 2 ejemplo Motivar

  • Considere un horizonte finito-problema de control ptimo LQ para un sistema de suspensin del coche se define en [4] por

    Tenga en cuenta que en este ejemplo, Asuncin 2 est satisfecho con la matriz C est dada por

    Es decir, el triple (A, B, C) es controlable y observable, lo que implica que tambin es stabilisable y detectable [3, 4, 8]. Los valores para el criterio de rendimiento subptimo Jtsub dadas en (9) y el criterio de rendimiento ptimo Jt FPT definido en (3) se representan con respecto a tf en la Fig. 1 suponiendo que las condiciones iniciales se distribuyen uniformemente sobre la esfera unidad, es decir, como funciones del tiempo que se les da por

    Observacin 2: Se debe enfatizar que la acumulada prdida de rendimiento durante todo el perodo de la optimizacin de t0 a tf puede ser sustancial. Representa el rea entre la curvas criterio de desempeo ptimos y ptimos. Los 'prdida de