PROYECTO INTEGRADOR DE LA
CARRERA DE INGENIERÍA MECÁNICA
SISTEMAS NO HOLÓNOMOS GENERALIZADOS Y SU
APLICACIÓN A LA TEORÍA DE CONTROL
AUTOMÁTICO MEDIANTE VÍNCULOS CINEMÁTICOS
Diego Gastón Pérez
Autor
Dr. Sergio Grillo
Co-Director
Ing. Félix Maciel
Co-Director
San Carlos de Bariloche
Junio 2006
Instituto Balseiro
UNIVERSIDAD NACIONAL DE CUYO
Comisión Nacional de Energía Atómica
– Argentina –
A mis viejos.
Resumen
En trabajos recientes [4, 13, 15, 16], se trata el control de sistemas subacutados
mediante la técnica de vínculos virtuales, dando lugar a una dinámica que puede
ser descripta a paritr de sistemas no holónomos generalizados. Este procedimiento
consiste en la imposición virtual de un vínculo cinemático sobre las coordenadas
generalizadas del sistema de forma de conseguir la estabilización puntos del siste-
ma naturalmente inestables. El objetivo central de este trabajo es resolver el control
cuasi-global de diferentes sistemas simples como son los péndulos invertidos con
carro y con disco de inercia. Así, presentaremos los vínculos que posibilitan esto,
las condiciones que fueron necesarias para su diseño y la señal de control que de-
be implementarse para el esquema de control a lazo cerrado. Alternativamente al
control cuasi-global, presentaremos diferentes vínculos que también permiten con-
trolar el sistema pero para un rango limitado de condiciones iniciales, a lo que de-
nominaremos control local. Finalmente, en forma accesoria, analizaremos algunas
condiciones bajo las cuales resulta factible la reproducción mediante vínculos vir-
tuales no holónomos de otras técnicas de control conocidas como son los métodos
energéticos [2, 3] y los convencionales [6, 14].
Palabras clave: Control Cuasi Global, Control Local, Sistemas No Holónomos
Generalizados, Sistemas Subactuados, Vínculos Virtuales.
III
Abstract
In recent works [4, 13, 15, 16], underactuated systems are dealt by means of vir-
tual constraints technics giving rise to dynamics wich can be described using gene-
ralized nonholonomic systems. This procedure consists of the imposition of a virtual
kinematic constraint on the genelalized coordinates in a way that stabilization of ot-
herwise unstable points of the system is acheived. The main objective of this work is
to solve the almost-global control for several siple systems such as the inverted pen-
dulum on a cart and the inertia wheel pendulum. Thus, we will show the constraints
which asure this, as well as the conditions necessary for their design and their ana-
log control signal for a closed loop system description. Alternatively to the almost-
global control strategy, we will introduce several other constraints that also allow
us to control the system but for a more restricted set of initial conditions, which will
be denominated local control. Finally, in an accessory form, we will analyze some
conditions under which results feasible the reproduction by means of nonholono-
mic virtual constraints control, of other well-known techniques of control such as
the energy shapping [2, 3] and the conventional methods [6, 14].
Keyword: Almost-Global Control, Generalized Nonholonomic Systems, Local
Control, Underactuated Systems, Virtual Constraints.
IV
Introducción
El estudio de los sistemas mecánicos con vínculos cinemáticos tiene sus origenes
a fines del siglo XIX (ver [13]), en particular los sistemas con vínculos no holónomos
fueron tratados en varios trabajos de fines de ese siglo y principios del siguiente [ver
trabajos de P. Appell (1911), H. Hertz (1881)], sin embargo su estudio sistemático se
vio luego interrumpido por un largo período de tiempo. Con la llegada de la me-
cánica cuántica y la relativista a principios del siglo XX el análisis formal de estos
sistemas fue relegado durante casi cincuenta años. Recién a fines del siglo pasado se
retoma su tratamiento sistemático, con aportes en este sentido de A. Bloch, H. Cen-
dra, A. Fufaev, M. de León, J. Marsden y C.-M. Marle, entre otros1, –encontrando
muchas veces en la geometría diferencial las herramientas necesarias para forma-
lizar su tratamiento–. Aparentemente, la descripción a través este formalismo de
sistemas controlados mediante servomecanismos, generó un renovado interés por los
sistemas no holónomos. Necesidades de la ingeniería de resolver estos casos que
pueden ser tratados mediante este formalismo –en aplicaciones de robótica y con-
trol automático en general–, son las que habrían despertado el interés actual por su
estudio. Trabajos recientes confirman esto último tratando de sistematizar el estudio
del control de sistemas no lineales mediante diferentes métodos. Algunas de estas
técnicas, cuyo estudio se extiende hasta el día de hoy, son los médotos energéticos
–por ejemplo [2] (2000) y [3] (2001)– y los métodos de control por vínculos virtuales
–[15] (2004) y [16] (2004)–. En particular, si bien ambos métodos son plausibles de
ser representados mediante el formalismo lagrangiano, esta última técnica de con-
trol es la que naturalmente conduce a sistemas no holónomnos generalizados. En este
marco, este proyecto integrador de ingeniería mecánica se enfoca, justamente, en el
estudio de este tipo de aplicaciones al control de sistemas mecánicos que podemos
1ver referencias en [3, 5, 13]
V
describir mediante la mecánica no holonoma generalizada, que se detalla en [5] y [4].
Cabe destacar que aquí no utilizaremos el formalismo de la geometría diferencial, a
excepción de algunos resultados y comentarios accesorios.
Al aplicar servomecanismos encontramos que estos permiten la implementación
sencilla de los vínculos no clásicos como los que se describen en [13], así mediante es-
tos vínculos no integrables en las velocidades nos proponemos estabilizar posiciones
del sistema naturalmente inestables. Sin embargo, los sitemas mecánicos resultantes
no cumplen con el principo de D’Alambert, uno de los puntos básicos del formalismo
de Lagrange (ver [4]). Así, las ecuaciones de movimiento no pueden ser deducidas
mediante el procedimiento lagrangiano usual, de forma que debemos ser cuidado-
sos en los pasos que realizaremos a tales fines. Trataremos así con sistemas para los
cuales las fuerzas de vínculo realizan trabajo, y donde los desplazamientos virtuales no
son necesariamente compatibles con los vínculos. No obstante, en [4] se presentan las
bases para resolver estos inconvenientes, de las cuales haremos uso en este trabajo.
Para esto será necesario ampliar la definición de vínculo que se tiene para sistemas
d’alambertianos donde los desplazamientos virtuales2 se desprenden de las ecua-
ciones de vínculo. Al tratar con sistemas no holónomos generalizados veremos que
resulta necesario considerar a los vínculos variacionales3 y cinemáticos como concep-
tos independientes y separados. Tambien, discutiremos el principio de los trabajos
virtuales generalizado (ver [4]) y su aplicación a los servomecanismos con el objeti-
vo de determinar los vínculos variacionales que consideraremos sobre el sistema.
Especificamente nos enfocaremos en la aplicación del método de control median-
te vínculos virtuales (como el que se describe[15]) sobre diferentes sistemas mecáni-
cos simples. Al igual que en [1, 2, 3, 13, 15, 16], entre muchos otros, recurriremos
a diferentes tipos de péndulos invertidos como ejemplos de estudio para sistemas
no lineales. –Este tipo de sistemas, aunque sencillos, dan lugar (en general) a ecua-
ciones diferenciales no integrables que deberemos resolver numericamente.– En este
sentido, nuestro objetivo principal es lograr estabilizar la posición superior (natural-
mente inestable) del péndulo invertido. Encontraremos así, vínculos que permitirán
tener un Control Cuasi-Global del sistema, como los que presentamos en el Capítulo
2Nos referimos a los desplazamientos virtuales que se realizan sobre el sistema en el principio de
Hamilton (ver[7]).3Seguiremos la definición de vínculo variacional que se dá en [5]
VI
3.
A continuación daremos un breve resumen de los contenidos de cada capítulo
en que se haya dividido este trabajo.
Capítulo 1:
Comenzaremos por definir los sistemas no holómos generalizados y los
rudimentos que necesitaremos para su estudio. Aquí presentaremos los
vínculos variacionales y su relación con las fuerzas de vínculo (o la ac-
ción de control en el formalismo de control a lazo cerrado). En este capí-
tulo motivaremos la aplicación de este formalismo mediante un ejemplo
sencillo como es el modelo de neumático de Rocad (ver [9]). Ejemplifica-
remos los procedimientos generales que seguiremos para la construcción
de las ecuaciones de movimiento y el cálculo de las fuerzas de vínculo
dentro de este formalismo.
Capítulo 2:
Luego, introduciremos el método de control mediante vínculos virtuales
que dará lugar sistemas no holónomos como los descriptos en el capí-
tulo anterior. En §2.2 presentaremos el comportamiento del péndulo con
carro ante la aplicación de diferentes vínculos cinemáticos, cuya imple-
mentación se reliza únicamente mediante una fuerza horizontal sobre el
carro. Encontraremos el valor al cual deben ajustarse los parámetros que
definen el vínculo de manera de estabilizar localmente la posición supe-
rior del péndulo.
Capítulo 3:
En este capítulo presentaremos varios vínculos variacionales y cinemá-
ticos, mediante los cuales es posible estabilizar la posición superior del
péndulo invertido, de forma que para cualquier condición inicial al azar
se tienda indefectiblemente a esta posición. A esta situación la llamare-
mos Control Cuasi-Global. Este es un capítulo central del trabajo, ya que
allí daremos, tanto para el sistema del péndulo con carro como para el
VII
del disco de inercia, un par de vínculos variacionales y cinemáticos me-
diante los cuales conseguiremos el control cuasi-global de los mismos.
Analizaremos las condiciones que se deben cumplir a fin de conseguir la
dinámica buscada, determinando así zonas de estabilidad para los pará-
metros. Finalmente daremos la expresión de la señal de control que debe
implementarse de acuerdo al formalismo de control a lazo cerrado.
Capítulo 4:
En este capítulo realizamos una comparación entre el método de control
mediante vínculos virtuales que proponemos en este trabajo y algunos
de los otros métodos conocidos.
En particular, en §4.1 contrastaremos los métodos lineales convenciona-
les en el espacio-estado4 con el método de control mediante vínculos vir-
tuales lineales. Por este camino encontraremos una serie de condiciones
suficientes para las cuales el sistema convencional puede ser reproducido
mediante un vínculo virtual lineal y mostraremos además, como cons-
truirlo.
Por otra parte, en §4.2 reproduciremos la dinámica de control lograda
mediante una técnica de control de desarrollo reciente como es la de la-
grangianos controlados que se propone en [2]. En este caso encontraremos
que, siempre que exista alguna variable cíclica5 en el sistema, este méto-
do puede ser reproducido mediante el control por vínculos virtuales. En
particular, mostraremos además cual es la familia de vínculos virtuales
mediante la cual se consigue el mismo control del sistema.
Capítulo 5:
En este capítulo, a modo de cierre, resumiremos las conclusiones más
relevantes que habremos obtenido en cada uno de los anteriores.
La distribución del trabajo se completa con una serie de apéndices con cálculos,
4Por espacio-estado entenderemos space state según se define en [14, 6].5Se dice que s es una variable cíclica si ∂L /∂s = 0, ver [7].
VIII
descripciones y discuciones complementarias que decidimos no colocar en el cuepo
principal a fin de no entorpecer la lectura.
IX
Índice general
Índice general X
Índice de Figuras XII
1. Sistemas No Holónomos 1
1.1. Sistemas estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Sistemas no d’alembertianos . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3. Sistemas generalizados . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4. Las ecuaciones de movimiento . . . . . . . . . . . . . . . . . . . . . . 6
1.5. Las fuerzas generalizadas . . . . . . . . . . . . . . . . . . . . . . . . . 8
2. Control mediante Vínculos Virtuales 10
2.1. Estrategias de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2. Control local . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2.1. Vínculo lineal a coeficientes constantes . . . . . . . . . . . . . 13
2.2.2. Vínculo lineal a coeficientes variables . . . . . . . . . . . . . . 17
2.2.3. Vínculo no lineal . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3. Control Cuasi-Global 23
3.1. Control del péndulo con disco de inercia . . . . . . . . . . . . . . . . . 24
3.1.1. Análisis lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.1.2. Adimensionalización . . . . . . . . . . . . . . . . . . . . . . . . 28
3.1.3. Señal de Control . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.2. Control del péndulo con carro . . . . . . . . . . . . . . . . . . . . . . . 38
3.2.1. Adimensionalización . . . . . . . . . . . . . . . . . . . . . . . . 40
3.2.2. Análisis lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
X
ÍNDICE GENERAL
3.3. Señal de Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4. Contraste con Otros Métodos de Control 49
4.1. Métodos lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.2. Métodos energéticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5. Conclusiones 56
A. El péndulo con disco 57
B. El péndulo con carro 59
B.1. Análisis de la expresión gral. de Cv . . . . . . . . . . . . . . . . . . . . 61
C. Lagrangianos de sistemas articulados 63
C.1. El péndulo con disco. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
C.2. El péndulo con carro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
D. Sistemas subactuados 69
D.1. Definición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
D.2. Deducción de las ecuaciones de E −L . . . . . . . . . . . . . . . . . 69
E. Reparametrización del péndulo con disco. 71
F. Códigos de cálculo 74
F.1. Cálculo de las zonas de estabilidad . . . . . . . . . . . . . . . . . . . . 74
F.2. Resolución numérica de la dinámica . . . . . . . . . . . . . . . . . . . 78
G. Evaluación económica. 81
G.1. Distribución de Tareas . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
G.2. Estimación de Costos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
Referencias 83
Agradecimientos 85
XI
Índice de Figuras
1.1. Deformación de la zona de contacto del neumático –vista superior–. . 5
1.2. El péndulo con disco. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1. El péndulo con carro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2. Retrato de fases: Ck con coef. constantes. . . . . . . . . . . . . . . . . . 15
2.3. Evolución temporal del péndulo con carro . . . . . . . . . . . . . . . . 16
2.4. Evolución del péndulo con carro en TQ. . . . . . . . . . . . . . . . . . 17
2.5. Retrato de fases para vínculos con coef. variables . . . . . . . . . . . . 20
2.6. Retrato de fases para vínculos no lineales . . . . . . . . . . . . . . . . 22
3.1. Zona de estabilidad: foco en O . . . . . . . . . . . . . . . . . . . . . . 27
3.2. Retrato de fases: foco en O. . . . . . . . . . . . . . . . . . . . . . . . . 27
3.3. Retrato de fases extendido: foco en O. . . . . . . . . . . . . . . . . . . 28
3.4. Zonas de estabilidad en ∆−ε. . . . . . . . . . . . . . . . . . . . . . . . 32
3.5. Retrato de fases: nodo en O. . . . . . . . . . . . . . . . . . . . . . . . . 32
3.6. Retrato de fases extendido: nodo en O. . . . . . . . . . . . . . . . . . . 33
3.7. Bifurcación en ∆ = 0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.8. Retratos de fases: control Cuasi-Global para un nodo en O. . . . . . . 35
3.9. Retratos de fases: control local en Π. . . . . . . . . . . . . . . . . . . . 36
3.10. Comparación de potencia necesaria. . . . . . . . . . . . . . . . . . . . 37
3.11. Diagrama de bloques: el péndulo con disco . . . . . . . . . . . . . . . 38
3.12. Parámetros adimensionales: foco en O. . . . . . . . . . . . . . . . . . 42
3.13. Retrato de fases: foco en O . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.14. Retrato de fases extendido: foco en O . . . . . . . . . . . . . . . . . . 43
3.15. Parámetros adimensionales: foco inestable en Π. . . . . . . . . . . . . 44
3.16. Retrato de fases: foco en O . . . . . . . . . . . . . . . . . . . . . . . . . 44
XII
ÍNDICE DE FIGURAS
3.17. Parámetros adimensionales: nodo en O. . . . . . . . . . . . . . . . . . 45
3.18. Retrato de fases: nodo en O . . . . . . . . . . . . . . . . . . . . . . . . 46
3.19. Retrato de fases: Estabilización de Órbitas. . . . . . . . . . . . . . . . 46
3.20. Diagrama de bloques: el péndulo con carro . . . . . . . . . . . . . . . 48
A.1. El péndulo con disco. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
B.1. El péndulo con carro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
C.1. Descomposición de la posición. . . . . . . . . . . . . . . . . . . . . . . 64
G.1. Descripción de tareas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
G.2. Diagrama de Gantt del proyecto. . . . . . . . . . . . . . . . . . . . . . 81
XIII
Capítulo 1
Sistemas No Holónomos
Generalizados
1.1. Sistemas no holónomos estándar
Llamaremos Sistemas No Holónomos Estándar a aquellos sistemas lagrangianos
con m vínculos de la forma1
wai qi = 0 , a = 1, . . . , m, (1.1)
donde los qi son las coordenadas generalizadas y los coeficientes wai pueden ser
funciones, a lo sumo, de los qi. Notar que, si pensamos a los wai como vectores wa,
los vínculos de arriba dicen que las velocidades del sistema deben ser ortogonales
al espacio generado por los wa. Si L = L (q, q) es el lagrangiano del sistema,
sus ecuaciones de movimiento resultan de extremar la acción∫
L (q, q) dt para
variaciones ∆qi, es decir, desplazamientos virtuales, que cumplan
wai ∆qi = 0. (1.2)
En consecuencia, las ecuaciones que los definen son (1.1) y[
ddt
(∂
∂qi L
)− ∂
∂qi L
]∆qi = 0
con ∆qi cumpliendo (1.2). Estas últimas, mediante los multiplicadores indeterminados
de Lagrange λa –siguiendo el procedimiento que se detalla en [7]–, pueden llevarse a
1Índices repetidos indican sumatoria.
1
1. SISTEMAS NO HOLÓNOMOS Sistemas no d’alembertianos
la formaddt
(∂
∂qi L
)− ∂
∂qi L = fi , (1.3)
donde las fi son componentes de las fuerzas f que implementan los vínculos, y están
dadas por
fi = wai λa . (1.4)
Explícitamente, las ecuaciones resultan
ddt
(∂
∂qi L
)− ∂
∂qi L = wai λa
wai qi = 0
(1.5)
Volviendo a (1.4), podemos decir que las fuerzas de vínculo f pertenecen al es-
pacio generado por los wa. Como consecuencia de ello
< f, q >= fi qi = 0 , (1.6)
es decir, las fuerzas de vínculo son ortogonales a las velocidades generalizadas, afir-
mación que se conoce como Principio de D’Alembert. Es claro también que
< f, ∆q >= fi ∆qi = 0 , (1.7)
lo cual implica el cumplimiento del Principio de los Trabajos Virtuales: «las fuerzas de
vínculo no realizan trabajo en la dirección de los desplazamientos virtuales».
1.2. Violación del Principio de D’Alembert
Existen sistemas con vínculos [como los dados por (1.1)] para los cuales las fuer-
zas que implementan estos últimos no son ortogonales a las velocidades generaliza-
das: las fuerzas de vínculo de tales sistemas no satisfacen el Principio de D’Alembert
(ver [5] y [13]). En particular, las fuerzas de vínculo no toman valores en el espacio
generado por los wa, sino en otro espacio F que debe ser especificado como parte
de la definición del sistema. Sus ecuaciones de movimiento están dadas por (1.1) y
(1.3), pero con
fi = vai λa , (1.8)
2
1. SISTEMAS NO HOLÓNOMOS Sistemas no d’alembertianos
donde cada vai difiere de los wa
i asociado a los vínculos. (Los coeficientes vai pue-
den, en general, ser funciones de q y q.) Más precisamente [comparar con (1.5)], las
ecuaciones sonddt
(∂
∂qi L
)− ∂
∂qi L = vai λa
wai qi = 0 .
(1.9)
Las ecuaciones de vínculo que aparecen en estos sistemas pueden ser no lineales
en las velocidades, es decir, dadas por ecuaciones
wa (q, q) = 0, a = 1, . . . , m. (1.10)
De nuevo, si pensamos a los vai como vectores va, la ecuación (1.8) dice que las
fuerzas de vínculo toman valores en el espacio F generado por los vectores va.
Luego, si llamamos
Ck = q : wa (q, q) = 0al espacio de velocidades definido por los vínculos, los sistemas mencionados están
definidos por los datos L, Ck y F , a diferencia del caso estándar, para el cual sólo
basta especificar L y Ck.
La primera parte de (1.9) podemos obtenerla en forma variacional. De hecho,
extremando la acción para variaciones δqi cumpliendo
vai δqi = 0 , (1.11)
obtenemos (ddt
(∂
∂qi L
)− ∂
∂qi L
)δqi = 0,
y utilizando multiplicadores de Lagrange, arribamos precisamente a
ddt
(∂
∂qi L
)− ∂
∂qi L = vai λa. (1.12)
La observación anterior nos dice que estos sistemas pueden alternativamente ser
descriptos en términos de los datos L , Ck y Cv, en lugar de F . De todos modos,
conociendo unos datos puden determinarse los otros, ya que Cv = F⊥, es decir, Cv
es el ortogonal de F .
3
1. SISTEMAS NO HOLÓNOMOS Sistemas generalizados
1.3. Sistemas no holónomos generalizados
Motivado por lo discutido en la sección anterior, vamos a definir, tal como se ha-
ce en [4], una clase de sistemas dinámicos que contiene a los sistemas no holónomos
estándar como caso particular, y que llamaremos Sistemas no Holónomos Generaliza-
dos. Se trata de sistemas definidos por ternas (L , Ck, Cv), siendo L el lagrangiano,
Ck = q : wb (q, q) = 0los vínculos cinemáticos y
Cv = δq : vbi (q, q) δqi = 0
los vínculos variacionales. Las tayectorias de tales sistemas serán curvas q (t) que cum-
plen (ddt
(∂
∂qi L
)− ∂
∂qi L
)δqi = 0; δq ∈ Cv y q ∈ Ck,
o en forma equivalente
(ddt
(∂
∂qi L
)− ∂
∂qi L
)δqi = 0
vbi (q, q) δqi = 0
wai (q, q) = 0.
Utilizando multiplicadores de Lagrange –como ya hemos hecho para las ecua-
ciones (1.5) y (1.9)–obtenemos
(ddt
(∂
∂qi L
)− ∂
∂qi L
)= va
i (q, q) λa
wai (q, q) = 0.
Luego, las cantidades fi = vai λa representan las fuerzas necesarias para implemen-
tar los vínculos Ck, y cumplen
< f, δq >= fi δqi = 0. (1.13)
Es decir, las fuerzas de vínculo definen un espacio F dado por el ortogonal a Cv.
Si llamamos desplazamientos virtuales a los elemenentos de Cv, tendremos para estos
sistemas una generalización de la idea del Principio de los Trabajos Virtuales: las
fuerzas de vínculo no realizan trabajo en las direcciones definidas por los desplazamientos
virtuales.
A continuación veremos un ejemplo de sistema no holónomo generalizado.
4
1. SISTEMAS NO HOLÓNOMOS Sistemas generalizados
El modelo de neumático de Rocard
Consideremos el sistema simplificado para un neumático de masa M que rue-
da sin resbalar sobre un plano como el que se describe en [9], [10]. Por simpli-
cidad veamos el caso de un sólo neumático perfectamente elástico cuyo plano
de movimiento debe permanecer perpendicular al piso. El centro de la zona de
contacto del neumático con el piso lo indicaremos mediante el par (x1, x2) y lo
consideraremos centrado en el ancho del neumático. Sin embargo, admitiremos
una pequeña deformación angularε en esta zona que posibilita un desfasaje igual
entre la velocidad x del centro del neumático y el plano de la rueda (ver Figura
1.1). El ángulo entre el plano de la rueda y el eje x1 es θ, entonces el ángulo entre
x y x1 es θ − ε. El ángulo de rotación de la rueda respecto de su propio eje es
ψ. En resumen, un punto genérico del espacio de configuración2 Q del sistema
será q = (ψ,θ,ε, x1, x2).
F
xε
θ
(x1, x2)
x
θ
(x1, x2)
Figura 1.1: Deformación de la zona de contacto del neumático –vista superior–.
Ahora asociemos la descripción de este sistema con un sistema no holónomo
generalizado, tal y como se hace en [5]. Para esto consideremos el vínculo cine-
mático (Ck) dado por las ecuaciones
x1 = ψcos(θ−ε) , x2 = ψsen(θ−ε) , (1.14)
que describen la condición de rodadura, y
ψ(θ− ε
)=
aM
ε , (1.15)
que tiene en cuenta el efecto de la fuerza F = aε que hace el piso sobre el
sistema, donde a es una contante de proporcionalidad. Y donde el vínculo va-
2Ver definición de Q en [7]
5
1. SISTEMAS NO HOLÓNOMOS Las ecuaciones de movimiento
riacional (Cv) está definido por
δx1 − δψ cos(θ−ε) = 0 ,
δx2 − δψ sen(θ−ε) = 0 ,
δθ− δε = 0 .
(1.16)
Notemos que la ecuación (1.15) es cuadrática en las velocidades por lo cual este
sistema escapa a los alcances de los sistemas no holónomos simples que presen-
tamos en §1.1, es decir, se trata efectivamente de un sistema no d’alembertiano.
Luego, las ecuaciones de Euler-Lagrange resultan
Iψ + Mx1cosθ + x2senθ = 0
Jθ + Kε = 0 ,(1.17)
donde K la constante de elasticidad del neumático y H e I son los momentos
de inercia del neumático respecto de cualquiera de sus diámetros mayores y
respecto del eje de la rueda, respectivamente.
Encontramos, que el sistema formado por las ecuaciones (1.14), (1.15) , (1.16) y
(1.17) describe completamente la dinámica del sistema.
Otra clase de sistemas plausibles de ser descriptos mediante este formalismo es la
conformada por los sistemas mecánicos controlados mediante servomecanismos. En
estos sistemas el subespacio F al que pertenecen las fuerzas queda determinado por
la configuración de los actuadores, mientras que los movimientos del sistema pue-
den englobarse en algún Ck descripto mediante ecuaciones de vínculo cinemático.
Este procedimiento –que discutiremos en el Capítulo 2– se conoce como control me-
diante vínculos virtuales. En lo siguiente nos abocaremos exclusivamente al estudio
de estos casos, puntualizando en la metodología seguida para su análisis.
1.4. Construcción de las ecuaciones de movimiento
En esta sección describiremos el tratamiento general que se le dió a los diferentes
sistemas dinámicos que surgen de la aplicación de vínculos cinemáticos mediante
servomecanismos.
6
1. SISTEMAS NO HOLÓNOMOS Las ecuaciones de movimiento
Consideremos un sistema mecánico con n coordenadas generalizadas q = (q1, . . . , qn),
cuyo lagrangiano3 es L (q1, . . . , qn; q1, . . . , qn) y sobre el cual actúan m vínculos ci-
nemáticos lineales de primer orden
Ck : wa(q, q) = 0 1 ≤ a ≤ m . (1.18)
Para poder escribir las ecuaciones de movimiento, como ya mencionamos en la
sección anterior, es necesario determinar Cv (ver [4]). Cuando se trata con servo-
mecanismos, la forma mas natural de defir el vínculo variacional Cv, es a partir de
los actuadores sobre cada sistema particular. Es decir, se conoce el subespacio F
al que pertenecen las fuerzas generalizadas de vínculo, dada la distribución de los
actuadores en el sistema , luego Cv = F⊥ como ya vimos en §1.2 .
Para comprender mejor esto último, analicemos este procedimiento mediante un
ejemplo:
El péndulo con disco
Consideremos el sistema del péndulo con disco que se muestra en la figura 1.2,
coordinizado por (ψ,θ) y que se detalla en el Apéndice A.
md, Id
O′
mb, Ib
ψ
θ
c
`
O
g
Figura 1.2: El péndulo con disco.
Pensemos, además, en el caso en el que se monta un motor4, solidario a la barra, capaz
de hacer girar el disco de inercia respecto de su eje en O′.3Para más información sobre la construcción del lagrangiano, ver Apéndice C4Será mediante el torque entregado por este elemento que se satisfará la ecuación de
vínculo cinemático.
7
1. SISTEMAS NO HOLÓNOMOS Las fuerzas generalizadas
Así, en este caso, que la fuerza generalizada de vínculo ( fψ, fθ) será de la forma
fθ = 0 ⇒ f = ( fψ, fθ) = (1, 0)λ , (1.19)
donde λ = λ(q, q).
Luego, aplicando la ecuación (1.13), resulta
Cv = (δψ, δθ) : δψ = 0 . (1.20)
Habiendo determinado, por este procedimiento, Cv a partir del conocimiento de los actua-
dores sobre el sistema.
En general, indicaremos5 el Cv a partir de las fuerzas de vínculo –generalizando
la ec. (1.19)– :
fi = vbi λb , (1.21)
con6 1 ≤ b ≤ l.
Conocida, de esta forma, la terna (L , Ck, Cv), estamos en condiciones de plantear
las ecuaciones de movimiento del sistema (ver Apéndice D.2). Es así, que a partir
del principio de Hamilton –para sistemas no holónomos– deducimos las ecuaciones
de Euler-Lagrange. De esta forma, la resolución completa del sistema consistirá en
encontrar λ(t) y q(t), tales que verifiquen
ddt
(∂
∂qi L
)− ∂
∂qi L = vbi λb
wa(q, q) = 0 (1.22)
con 1 ≤ i ≤ n, 1 ≤ a ≤ m, 1 ≤ b ≤ l y para ti ≤ t ≤ t f .
1.5. Cálculo de las fuerzas generalizadas
Para despejar los parámetros λ del sistema de ecuaciones (1.22), reescribamos las
primeras n ecuaciones poniendo de manifiesto la dependecia de cada término con
q, q y q : Aplicando la regla de la cadena7, obtenemos
Mi, j q j + Li = vbi λb , (1.23)
5Gracias al principio de los trabajos virtuales6Más adelante veremos que para que el sistema tenga solución para λb es necesario que l = m7Dados L (x), x1(t), . . . , xn(t) ∈ C 1, dL /dt = ∂L /∂xi · dxi/dt
8
1. SISTEMAS NO HOLÓNOMOS Las fuerzas generalizadas
con8 1 ≤ i, j ≤ n y 1 ≤ b ≤ l, donde hemos definido
Li(q, q) =∂2L
∂qi∂q j q j − ∂L
∂qi y Mi, j(q, q) =∂2L
∂qi∂q j .
Luego, despejando q j de la ecuación (1.23)
q j = (M−1) j,i(
vbi λb − Li
).
Por otra parte derivando las ecuación (1.18) que determina los vínculos del sis-
tema∂wa
∂q j q j +∂wa
∂q j q j = 0
Así, a partir de las dos últimas ecuaciones, obtenemos
ϕa,bλb − ∂wa
∂q j (M−1) j,iLi +∂wa
∂q j q j = 0 ,
donde
ϕa,b =∂wa
∂q j (M−1) j,ivbi , (1.24)
con 1 ≤ a ≤ m y 1 ≤ b ≤ l. Y a partir de esta última ecuación obtenemos
λb = (ϕ−1)a,b
[∂wa
∂q j (M−1) j,iLi − ∂wa
∂q j q j]
,
donde aseguramos9 la existencia de ϕ−1 si l = m, asumiendo, además, independen-
cia en las ec. de vínculo wa = 0 y dim(F ) = l = m, donde f ∈ F . Finalmente las
fuerzas generalizadas de vínculo –aplicando la ecuación(1.21)– estarán dadas por
fk = vbk(ϕ−1)a,b
[∂wa
∂q j (M−1) j,iLi − ∂wa
∂q j q j]
, (1.25)
con 1 ≤ i, j, k ≤ n, 1 ≤ a, b ≤ m y para ti ≤ t ≤ t f .
8Durante el resto de esta deducción, obviaremos muchas veces, por simplicidad, los valores que
toman los índices i, j, a y b9Nos ocupamos unicamente de este caso debido a que en el desarrollo del trabajo sólo trataremos
con sistemas de estas características.
9
Capítulo 2
Control mediante Vínculos Virtuales
Dado un sistema no holónomo generalizado con vínculos en las velocidades co-
mo los que definimos en §1.3, tendremos que el mismo evolucionará con
(q, q) ∈ Ck ,
donde el conjunto Ck será alguna subvariedad del espacio de fases definida a partir
de las ecuaciones de vínculos cinemáticos del sistema.
Por otra parte si el mismo sistema mecánico, es controlado mediante fuerzas
externas f(u) producto de una acción de control u(q, q) tal que la evolución del
mismo se puede restringir a una subvariedad C tendremos
(q, q) ∈ C .
Ahora bien, si1 Ck ≡ C, podemos pensar a C como resultante de un vínculo
cinemático donde f será la fuerza de vínculo que lo implementa.
La idea del control mediante vínculos virtuales, consiste en asociar la acción de con-
trol u con las fuerzas necesarias para la implementación de algún vínculo cinemá-
tico que genere Ck. –El termino virtual podemos asociarlo a la inexistencia de una
vinculación física en las partes que forman el sistema, como es usual en vínculos
holónomos. Los vínculos a los que nos referimos no se implementarán mediante
rótulas, rieles, ni otros elementos materiales, responderán simplemente a una ecua-
ción matemática que no tiene por que representar alguno de estos típicos ejemplos
que generan vínculos holónomos–.1Entendemos Ck ≡ C, si q(q, q) ∈ C ⇔ (q, q) ∈ Ck ∀ (q, q) solución de cualquiera de los
sistemas, con condiciones iniciales (q0, q0) ∈ C⋂
Ck
10
2. CONTROL MEDIANTE VÍNCULOS VIRTUALES Estrategias de control
Este enfoque presenta como ventaja fundamental una forma sencilla de restrin-
gir las órbitas del sistema mediante las ecuaciones de vínculo (ver, por ejemplo [15],
[16]). Sin embargo, la forma funcional de u puede resultar complicada o de alto costo
computacional en la implementación en comparación con los métodos tradicionales
de control lineal2. Otra ventaja interesantre que presenta este enfoque es que per-
mite tratar con las ecuaciones propias del sistema sin linealizar, considerando así la
dinámica completa del problema.
La estrategia de control mediante vínculos virtuales, consiste en calcular la señal
de control u(q, q), a partir de las ecuaciones que determinan la dinámica del sis-
tema. Al realizarse la implementación de este tipo de procedimiento a partir de un
vínculo dependiente de las velocidades –factible de realizarse en servomecanismos–,
se obtiene, en general, un sistema dinámico no holónomo generalizado. Son precisamente
los sistemas con estas características, los que estudiamos en este trabajo.
En estas condiciones, para calcular la acción de control procederemos de la forma
que detallamos en §1.5. En este punto en particular, resulta de interés recordar la ec.
(1.21) que utilizamos para calcular las fuerzas generalizadas en esa sección. Esta
ecuación establecía
fi = vbi λb ,
con vbi ∈ R, 1 ≤ b ≤ l. Luego, a fin de hallar la acción de control u en este formalis-
mo, identificamos
ub = λb : fi = vbi ub ,
donde vbi ∈ R, ub = ub(q, q), con 1 ≤ b ≤ l, cumpliendo así, formalmente, la
definición de u.
2.1. Estrategias de control
Las estrategias de control, en este contexto, consisten en encontrar vínculos ci-
nemáticos y variacionales tales que se consiga controlar el sistema hacia alguna ór-
bita deseada. Para probar esto, en este trabajo, nos abocaremos a la estabilización
2Consideramos como métodos tradicionales, todos aquellos donde la señal de control es lineal en
q y q y a coeficientes contantes.
11
2. CONTROL MEDIANTE VÍNCULOS VIRTUALES Control local
de diferentes péndulos invertidos en la posición vertical superior, naturalmente de
equilibrio inestable3.
2.2. Control local
En esta sección evaluaremos el efecto de diferentes estrategias de control que
estabilizan el péndulo invertido con carro en algún entorno de la posición superior
(θ = 0). Este sistema se muestra esquematicamente4 en la Figura 2.1.
x
gm, I
O
`/2
O′
θ
Figura 2.1: El péndulo con carro
En este caso, el espacio de configuraciones Q corresponde al cilindro S1×R, que
coordinizaremos mediante (θ, x) : Q→ R2, donde −π < θ ≤ π , −∞ < x < ∞.
Para este sistema, las ecuaciones de movimiento, serán (ver deducción en Apén-
dice B)
(mx + m `
2 senθθ2 −m `
2 cosθθ)
δx +
+(
I0θ−m `2 cosθx−mg `
2 senθ)
δθ = 0
fxδx + fθδθ = 0
(2.1)
Trataremos el problema del control de este sistema para el caso subactuado, por lo
tanto, deberá cumplirse (como vimos en §D.1), dim(F ) < dim(Q) = 2⇒dim(F ) = 1.
3Se trata de un punto tipo ensilladura o saddle point. Ver caracterización de puntos fijos de sistemas
no lineales en [11].4Para una descripción más detallada sobre el sisema ver Apéndice B.
12
2. CONTROL MEDIANTE VÍNCULOS VIRTUALES Control local
Es decir, consideraremos el caso [ver ecuación (1.21)]
f = ( fθ, fx) = (vθ, vx)λ ,
con λ = λ(θ, x) y vθ, vx ∈ R.
2.2.1. Vínculo lineal a coeficientes constantes
Analicemos, primeramente, el vínculo cinemático lineal a coeficientes constantes
Ck : θ + ax = γsenθ , (2.2)
donde a, γ ∈ R. En particular, el caso donde sólo se tiene un actuador capáz de
ejercer una fuerza horizontal (en la direción x) sobre el carro (ver Figura 2.1). En
esta situación tendremos –ver ecuación (1.13)–
Cv : δx = 0, ó bien fθ = 0 . (2.3)
Derivando la ecuación (2.2), obtenemos
x =γ
aθ cosθ− θ
a(2.4)
Luego, reeplazando las ecuaciones (2.3) y (2.4) en (2.1), podemos reducir el orden
del sistema y escribir
θ = ω
ω =m`γ
2aJ(θ)ω cos2θ +
mg`
2J(θ)senθ
(2.5)
donde hemos definido ω = θ y
J(θ) = I0 +m`
2acosθ . (2.6)
De la ecuación (2.6) deducimos que esta estrategia tiene una singularidad en
θi = arc cos(−2
aI0
m`
), (2.7)
que podríamos evitar eligiendo
|a| > m`
2I0. (2.8)
13
2. CONTROL MEDIANTE VÍNCULOS VIRTUALES Control local
Por otra parte, analizando el sistema de ecuaciones (2.5), encontramos que el
sistema sólo tendrá dos puntos fijos5
(θ, ω) ≡ O = (0, 0)
(θ, ω) ≡ Π = (π , 0) .
Luego, si linealizamos el sistema en un entorno del punto O, resulta la matríz
jacobiana6
JO =
0 1mg`
2 jo
mγ`
2 joa
, (2.9)
donde
jo = J(θ=0) = I0 +m`
2a.
Analizando el polinomio característico p(λ) de la matríz JO, encontramos que para
que O sea un foco estable, deben verificarse simultaneamente
γ < 0 , −m`
2I0< a < 0 , a <
(m`
2I0
)− ∆
1/2(γ) , (2.10)
donde
∆(γ) =(
m`
2I0
)2
− m`γ2
2gI0.
Condiciones que resultan incompatibles con la ecuación (2.8).
Por lo tanto, en vistas de la contradicción entre las ecuaciones (2.10) y (2.8), con-
cluimos que no es posible encontrar parámetros a, γ tales que el punto O sea foco estable, y
atractor de órbitas con condiciones iniciales (θ0, ω0) tales que cosθ0 < −2(aI0)/(m`).
Sin embargo, eligiendo a, γ que verifiquen las condiciones (2.10), el punto O re-
sulta foco estable con una cuenca de atracción limitada por la singularidad dada por
la ecuación (2.7).
Analicemos este caso mediante un ejemplo, donde por simplicidad tomaremos
m, `, I0 unitarios7 y donde sean γ = −√g/3 · m`/I0 y a = −1/4 · I0/m`, de forma
que se verifiquen las condiciones de estabilidad dadas por (2.10).
5Definimos puntos fijos (θ,ω)∗ como aquellos puntos del espacio de fases tales que θ∗ = ω∗ = 0
(ver [11]).6Definimos, para el espacio de fases (x1, . . . , xn), la matríz jacobiana Ji
j = (∂xi)/(∂x j), con 1 ≤i, j ≤ n.
7Unitarios según la definición de unidades del Sistema Internacional (S.I.) (m, Kg, s).
14
2. CONTROL MEDIANTE VÍNCULOS VIRTUALES Control local
-π -π/2 0 π/2 ππ/3-π/3θ
-4
-2
0
2
4
ω [1
/s]
Figura 2.2: Retrato de fases resultante de la evolución del sistema dinámico del péndulo con carro al
implementar un vínculo lineal a coef. const. mediante fuerzas horizontales.
Resolviendo las ecuaciones (2.5) numericamente, para diferentes condiciones ini-
ciales, obtenemos el retrato de fases que se muestra en la Figura 2.2. –La construc-
ción de este retrato de fases (al igual que todo retrato que se muestra en este trabajo)
se realizó a partir de las salidas de pequeños programas en leguaje C que escribi-
mos para resolver los diferentes sistemas de ecuaciones [como, por ejemplo, el sis-
tema (2.5)] que surgen de la implementación del control por vínculos virtuales. En
el Apéndice F.2 se muestra el código fuente de uno de estos programas a modo de
ejemplo.–
Para la elección de parámetros de este ejemplo es de esperar una divergencia
en ω para θ → θi±, (ver ecuación 2.7), la que podemos observar8 en la Figura 2.2,
donde
θi− = −π
3θi+ =
π
3.
Cabe destacar que mediante la implementación del vínculo (2.2), hemos conse-
guido9 generar un foco estable en O , así tambien como un foco inestable en Π.
El precio que debemos pagar para esto es la formación de una variedad inestable
8En rigor en los resultados que se muestran en la Figura2.2 existen orbitas que cruzan las varieda-
des inestables θi± = ±π/3, esto se debe a errores numéricos de discretización en el cálculo.9Recordemos que para retratos de fases, en el semiplano superior las órbitas evolucionan hacia la
derecha y en el semiplano inferior hacia la izquierda (ver [11]).
15
2. CONTROL MEDIANTE VÍNCULOS VIRTUALES Control local
(asintótica y para la cual ω → ±∞) que divide el espacio de fases en dos partes
incomunicadas. Es decir,
∀(θ, ω)(t) : θi− < θ0 < θi+ sii θi− ≤ θ(t) ≤ θi+ ,
∀(θ, ω)(t) : θ0 < θi− ó θi+ < θ0 sii θ(t) ≤ θi− ó θi+ ≤ θ(t) ,
0 2 4 6 8
t[s]
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
θ
0 2 4 6 8
t[s]1
1.5
2
2.5
3
3.5
x [m
]
(a) comportamiento de la posición: θ(t), x(t)
0 2 4 6 8
t[s]-20
-10
0
10
20
30
40
v [m
/s]
0 2 4 6 8
t[s]
-2
-1
0
1
ω[1
/s]
(b) comportamiento de la velocidad: v(t),ω(t)
Figura 2.3: Evolución temporal del péndulo con carro para un vínculo lineal constante y fuerza
horizontal, a partir de condiciones iniciales (x,θ, v, ω)0 = (1m, 1, 1m/s, 1/s).
En la Figura 2.3 analizamos el comportamiento del sistema en la cuenca de atrac-
ción del punto O. En particular, se muestra la evolución [mediante sus coordenadas
en el espacio tangente de configuraciones (x,θ, v, ω) ∈ TQ], donde identificamos
16
2. CONTROL MEDIANTE VÍNCULOS VIRTUALES Control local
v = x, ω = θ. Observamos en esta figura la convergencia asintóticamente estable10 de
las órbitas en la cuenca de atracción del punto O. Se observa además, la convergen-
cia de las velocidades a cero para t ≈ 8s.
S1×R
θi− θi+
x
θ
1 1.5 2 2.5 3 3.5
x[m]-0.5
0
0.5
1
θ
Figura 2.4: Evolución del sistema en el espacio de configuraciones Q, a partir de una condición
inicial en la zona estable.
Alternativamente, en la Figura 2.4 ejemplificamos la evolución del sistema en
Q = S1 × R –mediante su cordinización (x,θ).– Aquí vemos como son las óbitas
típicas del sistema sobre la zona estable del cilindro11 de forma que la gráfica que se
muestra a la derecha en la fig.2.4 puede pensarse como arrollada sobre el cilindro.
El atractivo de esta estratégia particular, reside en que, mediante la implementa-
ción de un control adicional válido sólo en las zonas (θ, ω) : |θi| −ε < |θ| < |θi|+ε
(0 < ε ∈ R), capaz de comunicar continuamente las órbitas, podría lograrse un control
global en (θ, ω).
2.2.2. Vínculo lineal a coeficientes variables
Con el objetivo de conseguir vínculos que estabilizaran el punto O para el pén-
dulo con carro para cualquier condición inicial al azar, ensayamos varias estrategias
alternativas. La mayor parte de los vínculos propuestos a tales efectos fueron li-
neales en las velocidades y con coeficientes variables (función de las coordenadas
10Ver clasificaciones de diferentes tipos de estabilidad en [11].11La zona estable de Q está definida por el conjunto de puntos (θ, x) : θi− < θ < θi+ .
17
2. CONTROL MEDIANTE VÍNCULOS VIRTUALES Control local
generalizadas del sistema):
(A) θ + ax = γ senθ + b x ,
(B) θ + a(x) x = γ senθ + b x ,
(C) θ + ax = γ senθ + b(x) x ,
(D) θ + a(θ) x = γ senθ + b x ,
donde a(x), b(x) son funciones de x y a(θ) es función de θ. Todos en combinación con
el vínculo variacional
Cv : δx = 0 por considerarse siempre fθ = 0 .
Las familias de vínculos (A), (B) y (C) fueron tratadas genericamente para todas
las posibles constantes a, b, γ y todas las funciones continuas a(x), b(x). Sin embargo,
en estas condiciones siempre encontramos un conjunto de trayectorias –de medida
no nula– para las cuales el sistema no converge al punto O. El último tipo de vínculo
encolumnado, es decir el (D) –con a = a(θ)–, se analizó a partir de un caso particu-
lar de interés. Aunque para este vínculo también encontramos órbitas fuera de la
cuenca de atracción de O, reproduzcamos someramente el análisis realizado en es-
tas condiciones como un ejemplo que motive la aplicación de vínculos cinemáticos
lineales en las velocidades con coeficientes variables.
En la ecuación (2.2), encontramos que ω diverge para θi± [según definimos en la
ecuación (2.7)]. Ahora bien, proponiendo un vínculo
Ck : θ +cosθ
hx = γ senθ + b x ,
con h ∈ R, podemos eliminar esta divergencia de ω debida al factor J(θ) [ver ecua-
ción (2.6)]. Con sólo tomar h 6= 2I0/(m`), –de la ecuación (2.6)– resulta
2Jm`
=2I0
m`+ h 6= 0 ∀θ . (2.11)
Pero no por esto debemos cantar victoria, ya que –como ya hemos adelantado– este
método no nos permite controlar el sistema desde cualquier condición al azar y es
debido –justamente– a una divergencia en las ecuaciones de movimiento. Veamos a
continuación a que se debe este efecto.
Para estos sistemas donde los coeficientes que acompañan a las velocidades son
funciones de las coordenadas generalizadas, no es posible reducir la dinámica a un
18
2. CONTROL MEDIANTE VÍNCULOS VIRTUALES Control local
sistema de ecuaciones diferenciales de primer orden como hicimos en §2.2.1 [ver
ecuación (2.5)]. Por ejemplo, al plantear las ecuaciones de movimiento en las coor-
denadas generalizadas x y θ, para las familias (B) o (C) no es posible eliminar de las
ecuaciones la dependencia con ninguna de las coordenadas resultando un sistema
en cuatro variables acopladas. El análisis lineal de estos sistemas –cuyas matrices ja-
cobianas J ∈ R4×4– conlleva, en general, a polinomios característicos p(Λ) = 0 de
cuarto grado. Sin embargo, dada la forma particular de las matrices que resultan pa-
ra los casos (B) y (C) econtramos que Λ = 0 es una raíz de p, quedando por resolver
un polinomio de tercer grado. Esto generó la necesidad de programar un código C a
fin de determinar numericamente soluciones a problemas de este tipo. El mismo se
realizó a partir del método exacto de Bombelli-Cardano-Ferro-Tartaglia (B-C-F-T) (ver
Apéndice F.1).
Para los vínculos de la familia (D), es posible eliminar la dependencia de las
ecuaciones de movimiento con x, resultando un sistema en sólo 3 dimensiones12,
que podemos escribir13
θ = ω
ω =h m` γ cosθ
2Jω +
h2 m` senθ
2Jω v +
g m`
2Jsenθ
v =(
h γ − h2 m` γ
2J
)ω +
(1 +
h3 m`
2J
)tgθ ω v +
h g m`
2Jtgθ
(2.12)
donde J está definido por la ecuación (2.11). A partir de la introducción de esta nue-
va variable v = x en las ecuaciones de movimiento es que encontramos puntos para
los cuales las órbitas divergen. Analicemos la última ecuación del sistema (2.12).
Encontramos así, que
límθ→± π2
v = ±∞ .
Luego, del análisis de estabilidad resulta que para obtener un foco estable en O
los parámetros h, γ deben verificar14
h− < h < h− ,12Notemos que para todo a(θ), tanto el vínculo como el lagrangiano conservan la simetría en x (es
cíclica), por cual es de esperarse que no intervenga en las ecuaciones.13La ecuación x = v no forma parte del sistema porque no es necesaria para la resolución de las
demás variables: está desacoplada.14En este caso no resulta necesario el uso del método de (B-C-F-T) ya que, aunque J ∈ R3×3, el
polinomio característico puede escribirse Λ · p∗(Λ).
19
2. CONTROL MEDIANTE VÍNCULOS VIRTUALES Control local
donde
h± = η±√
η2 − η
I,
con
η =2gγ2 I =
m`2
4I0.
Así, para este caso también realizamos un programa para calcular las órbitas a
partir del sistema (2.12) (ver código típico para realizar retratos de fases en Apén-
dice F.2). Algunas de las salidas de este programa para las zonas de estabilidad
correspondientes a la ecuación anterior, se muestran en la Figura 2.5 para el caso
con g = 9,8m/s2; m = 1kg; ` = 1m; I0 = 1kg ·m2.
v[m/s]
ω[s−1]θ
v[m/s]
40
0
-40
42
0-2
-40.60.3
0-0.3
-0.6
Figura 2.5: Retrato de fases resultante de la implementación de un vínculo lineal a coeficientes
variables.Ck : θ + h−1 · cosθ · x = γ · senθ + b · x, con h = −6, γ = −1.
2.2.3. Vínculo no lineal
Como otra forma alternativa de eliminar la divergencia de ω que se tiene en θi±al implementar el vínculo lineal (2.2) [ver ecuación (2.7)], proponemos el vínculo
cinemático
Ck : x + a θ ln|cosθ| = γ senθ + c θ , (2.13)
donde a, c, γ ∈ R son constantes a ajustar según el comportamiento buscado pa-
ra el sistema. Las ecuaciónes de Euler-Lagrange pueden ser llevadas al sistema de
20
2. CONTROL MEDIANTE VÍNCULOS VIRTUALES Control local
ecuaciones
θ = ω
ω =γ
J2ω cos2θ +
g + aω2
J2senθ
(2.14)
donde
J2 =I0
m`/2+ a cosθ ln|cosθ|+ c .
Notemos que la dinámica de las variables θ y ω puede desacoplarse de x, a dife-
rencia del caso tratado en §2.2.2 donde fue necesaria la introducción de la variable
v = x. Otra característica importante del sistema (2.14) es que efectivamente se eli-
minó la divergencia de ω, notemos que
límθ→± π2
(cosθ ln|cosθ|) = 0 , (2.15)
luego tomando
|c| > |a|e− I0
m`/2(2.16)
conseguimos ω < ∞ ∀(θ, ω) ∈ Ck (donde e es número de Euler-Neper, base de ln,
e = 2,7 . . . ). Sin embargo, recordemos que x debe verificar la ecuación de vínculo
(2.13)
x = −a ln|cosθ|ω + γ senθ + c ω , (2.17)
y por lo tanto
límθ→± π2
x = −∞ , (2.18)
para a 6= 0 y 0 < lím θ→±π/2 |ω| < ∞. Es decir, el vínculo propuesto mantiene
acotadas las variables θ, x, ω y x en la zona (θ, x, ω, x):
−π
2< θ <
π
2. (2.19)
Conseguimos así diseñar, al igual que en §2.2.1, una estrategia de control local
acotada en θ, pero donde ahora θi = ±π/2, –para c y a que verifiquen (2.16)– (ver
ecuación 2.7 de define los límites de la zona estable para el vínculo lineal propuesto
en §2.2.1). Por este motivo es que en la Figura 2.6 mostramos la dinámica del siste-
ma teniendo en cuenta las tres coordenadas (θ, ω, x). Así mostramos el efecto de la
divergencia en x para θ = π/2, que debido a la discretización numerica no alcanza
valores excesivos –por lo cual vemos sólo pequeñas perturbaciones–.
21
2. CONTROL MEDIANTE VÍNCULOS VIRTUALES Control local
v[m/s]
ω[s−1]θ
v[m/s]
20
0
-20
30
-3
π/2 0 -π/2
Figura 2.6: Retrato de fases resultante de la implementación de un vínculo no lineal.Ck : x + a · θ ·ln|cosθ| = γ · senθ + cθ.
Ahora bien, escapando nuevamente a los objetivos del capítulo, se nos plantea
el interrogante de si será posible reproducir las órbitas de la Figura 2.6 median-
te un control discreto acotado para un sistema real. Esta elucubración se basa en
el hecho de que la implementación práctica de la estrategia se hace a partir de un
muestreo discreto del estado del sistema (al igual que el programa de cálculo uti-
lizado para generar la Figura2.6), luego –para las mismas condiciones iniciales– si
los tiempos de muestreo y de discretización del programa de simulación son iguales
quizás resulten evoluciones similares donde no se alcance ni velocidades ni fuerzas
excesivas. Sin embargo no contamos con la evidencia práctica ni numérica necesa-
rias para sustentar esto, de forma que sólo no limitamos a presentar esta estrategia
en un contexto local.
En este sentido el vínculo no lineal que proponemos en esta sección puede resul-
tar de utilidad para el control del péndulo invertido con carro en la zona (θ, x, θ, x) :
−π/2 < θ < π/2) , como podemos ver en la Figura 2.6 .
22
Capítulo 3
Control Cuasi-Global
En este capítulo presentaremos varios vínculos variacionales y cinemáticos, me-
diante los cuales es posible estabilizar la posición superior del péndulo invertido,
con una cuenca de atracción de todo el espacio de fases menos un conjunto de medi-
da cero. Es decir, encontraremos que los únicos puntos fuera de la cuenca de atracción
serán los pertenecientes a una subvariedad de dimensión menor a la del espacio de
fases del sistema. Entonces la probabilidad de tomar condiciones iniciales en este
conjunto es nula 1 y como la cuenca de atracción sólo excluye este conjunto:
cualquier órbita elegida a al azar convergerá al punto fijo superior O.
De allí, la denominación cuasi-global. Además para los problemas considerados, por
razones topológicas no es posible el diseño de una acción de control global y contínua en
todo TQ (ver [1]).
Para verificar si los diferentes vínculos que proponemos en este capítulo efec-
tivamete controlan cuasi-globalmente los sistemas, procederemos por dos caminos
complemetarios. Primero, analizaremos linealmente el sistema en los puntos fijos y
luego completaremos el análisis caracterizando el comportamiento global median-
te simulación numérica. Dada la discretización de la simulación numerica, resulta
evidente que no evaluaremos todas las órbitas del sistema: nos conformaremos con
evaluar aquellas que consideramos representativas y que nos permitirán estudiar el
comportamiento del sistema. Por un lado, tomaremos condiciones iniciales en las
cercanías de los puntos fijos de forma de conseguir caracterizar esta zona donde la
dinámica es importante. Y por otro lado, tomaremos condiciones iniciales suficien-
1Para una distribución uniforme sobre todo el espacio de fases
23
3. CONTROL CUASI-GLOBAL Control del péndulo con disco de inercia
temente alejadas2 que nos darán idea del comportamiento del sistema lejos de los
puntos fijos. Este último punto será muy importante para determinar la extención
de la cuenca de atracción, ya que en rigor desconocemos si condiciones iniciales
mayores a las ensayadas numericamente quedan fuera de la cuenca de atracción.
Sin embargo, si a la luz de los resultados de las simulaciones nada parece indicar la
existencia de estas órbitas fuera de la cuenca de atracción, consideraremos que las
simulaciones caracterizan el comportamiento en todo el espacio de fases.
Entonces, diremos que se consiguió el control Cuasi-Global cuando las órbitas
ensayadas –que consideramos una muestra representativa de todas las órbitas del
sistema– convergen siempre al mismo punto que se quiere estabilizar.
3.1. Control del péndulo con disco de inercia
En esta sección trataremos el problema de la estabilización del sistema del pén-
dulo invertido con disco de inercia. El sistema en cuestión, el cual ya hemos citado
en repetidas oportunidades en este trabajo, se describe en detalle en el Apéndice A.
Éste es un sistema que ha sido objeto de diferentes técnicas de control en varios
trabajos (ver, por ejemplo, [1] y referencias que allí se dan para diferentes enfoques).
Como técnica de control, en esta oportunidad, proponemos el vínculo virtual
Ck : θ + aψ = γsenθ
donde a, γ son constantes no nulas.
Derivando la ecuación (3.1) respecto del tiempo se obtiene
ψ =γ
acosθ θ− θ
a. (3.1)
Consideremos el caso subactuado no trivial donde el control se realiza sobre el disco
de inercia. A partir de las ecuaciones de Euler-Lagrange, las restricciones cinemáti-
cas Ck y variacionales Cv del sistema, encontraremos las ecuaciones de movimiento
(ver Apéndice A). Así, si se reemplaza (3.1) en (A.6) y si se reordenan conveniente-
2El criterio adoptado para establer que una condición inicial está suficientemente alejada se expli-
citará oportunamente para cada caso particular.
24
3. CONTROL CUASI-GLOBAL Control del péndulo con disco de inercia
mente los términos resulta el sistema
θ = − I2γ
a Jcosθω +
MgJ
senθ
θ + aψ = γsenθ
(3.2)
donde
J = J(a) = Ieq1 + I2
(1− 1
a
), (3.3)
con a tal que verifique
J 6= 0 . (3.4)
Dado que θ no depende explicitamente de ψ ni de sus derivadas –como se mues-
tra en (3.2)–, la dinámica de θ y ψ se puede desacoplar y estudiar por separado.
Mediante este procedimiento reducimos el problema completo a uno equivalente
unidimensional que nos permitirá simplificar la representación (para procedimien-
tos de este tipo ver [7]). Así, para θ podemos escribir el sistema dinámico3
ω = − I2γ
a Jcosθω +
MgJ
senθ
θ = ω
(3.5)
con −π < θ ≤ π , −∞ < ω < ∞ . Mientras que, además, ψ debe verificar la
ecuación de vínculo (3.1). De esta forma, el sistema (3.5) nos permitirá resolver la di-
námica y encontrar θ(t), y mediante la ecuación (3.1) obtendremos ψ = f [θ(t), θ(t)],a partir de la cual resolveremos4 el sistema completo hallando ψ(t).
Sin embargo, sin conocer las soluciones exactas del sistema, aún podemos inferir
algunas características del comportamiento del sistema en algunos puntos de inte-
rés. En particular, en la siguiente sección aplicaremos conceptos de análisis lineal de
sistemas dinámicos (ver por ejemplo [11]) –y que ya utilizamos en §2.2.1– que nos
permitirá caracterizar el sistema a primer orden.
3.1.1. Análisis lineal
Analizando el sistema (3.5), encontramos que sus únicos puntos fijos son
(θ, ω) ≡ O = (0, 0)3En (3.5) se redujo el orden de la ecuación (3.2) gracias a la introducción de la variable ω.4La resolución de las ecuaciones de movimiento se realizó por métodos numericos discretizando
el tiempo.
25
3. CONTROL CUASI-GLOBAL Control del péndulo con disco de inercia
(θ, ω) ≡ Π = (π , 0)
Luego, la dinámica a primer orden de θ en torno de estos puntos fijos podemos
escribirla, en forma matricial, como(
θ
ω
)= J
(θ
ω
)(3.6)
Donde J será la matríz Jacobiana del sistema dado por (3.5) en cada uno de los
puntos fijos:
JO =
0 1
−M gJ
+I2 γ
a J
, JΠ =
0 1M g
J− I2 γ
a J
(3.7)
Cuyos autovalores λO y λΠ en los puntos O y Π respectivamente, resultan
λO = − I2 γ
2 a J±
√(I2 γ
2 a J
)2
− M gJ
λΠ =I2 γ
2 a J±
√(I2 γ
2 a J
)2
+M g
J
(3.8)
Así, a partir del estudio de las ecuaciones (3.8), es posible elegir los valores de
los parámetros a y γ a fin de obtener diferentes comportamientos del sistema en las
cercanías de los puntos fijos, completando posteriormente el análisis globalmente
mediante simulación numérica. En particular, con vistas al control cuasi-global del
sistema requerimos que el punto O sea un atractor (y además que la cuenca de
atracción sea casi todo el espacio de fases). Consideremos el caso particular en el
que O es un foco estable.
A partir del análisis de autovalores para este punto encontramos que para obte-
ner un foco estable, a y γ deben verificar
γI2
2aJ> 0 ,
(γ I2
2aJ
)2
+Mg
J< 0 ,
Los conjuntos de puntos que verifican estas condiciones junto con la ecuación
(3.4) se calcularon numericamente y se muestran en la Figura 3.1. Para realizar este
gráfico hemos definido I = I2/Ieq1 y consideramos el caso donde Mg/I2 = 1 · s−1. En
la figura indicamos la zona del espacio de parámetros (a, γ, I) del sistema para los
26
3. CONTROL CUASI-GLOBAL Control del péndulo con disco de inercia
cuales O es un foco estable. Todos los puntos que se muestran en la figura verifican
las condiciones de estabilidad, pero para encontrar los parámetros que permiten
el control Cuasi-Global debemos, además, analizar el comportamiento global del
sistema y determinar la cuenca de atracción de O.
γ[s−1]
I a
γ[s−1]
0
-0.5
-1
3020
100
0.50
Figura 3.1: Parámetros a, I, γ que determinan un foco estable en O.
En particular si elegimos a = 0,1; I = 1/2; γ = −0,3 para Mg/I2 = 1, encontra-
mos que la cuenca de atracción del punto O es efectivamente casi todo el espacio de
fases, ver Figura 3.2. En este caso encontramos que el punto Π (que se muestra por
duplicado a ambos lados de la figura para mayor claridad), es del tipo ensilladura
(Ver [11]).
-π 0 πθ
-1
-0.5
0
0.5
1
ω [s
-1]
Figura 3.2: Retrato del sistema en el espacio de fases. Control Cuasi-Global.(a = 0,1; I = 1/2; γ =
−0,3).
27
3. CONTROL CUASI-GLOBAL Control del péndulo con disco de inercia
Para completar las condiciones que garantizan el control Cuasi-Global que men-
sionamos al comienzo de este capítulo, debemos analizar las órbitas más lejanas del
sistema. Para esto realizamos el diagrama en el espacio de las fases que se muestra
en la Figura 3.3. Allí se muestra un retrato de fases extendido donde observamos la
evolución del sistema para condiciones iniciales lejanas5.
-10π 0 10πθ
-2
0
2
ω [s
-1]
Figura 3.3: Retrato de fases extendido. Control Cuasi-Global.(a = 0,1; I = 1/2; γ = −0,3).
Mediante el vínculo propuesto logramos el control Cuasi-Global del sistema. Sin
embargo, los parámetros elegidos para esto responden sólo al caso particular don-
de Mg/I2 = 1 · s−1. Es decir, los parámetros a y γ encontrados dependen de las
características físicas del sistema (como son M ,I2 e Ieq1 ).
A fin de independizarnos de estas constantes físicas características buscaremos
una formulación alternativa para las ecuaciones (3.8), de forma tal que el análisis
resulte más general.
3.1.2. Adimensionalización
En la sección anterior encontramos ecuaciones –como la ecuación (3.8)– a par-
tir de las cuales podemos elegir los conjuntos de parámetros de control (γ, a) que
determinen el comportamiento buscado del sistema. Sin embargo, la descripción
de las condiciones de estabilidad resulta engorrosa (ver Figura 3.1 ), por esto aho-
5Consideramos condiciones iniciales lejanas a aquellas para las cuales el sistema realiza varios
giros completos antes de converger al punto O. En particular, se alcanzó a observar (numericamente)
sistemas que convergen luego de 18 giros completos.
28
3. CONTROL CUASI-GLOBAL Control del péndulo con disco de inercia
ra nos dedicaremos a realizar una adimensionalización a fin de poder generalizar
estos resultados y escribirlos, además, en forma más compacta. De esta manera se
determinarán conjuntos en el espacio de parámetros adimensionales del sistema,
independientes de las contantes del mismo –como ser: masa, geometría, etc.– para
los cuales el comportamiento del sistema en los puntos fijos es –a primer orden– del
mismo tipo6. En otras palabras, se indicarán los parámetros que deben ajustarse a
fin de conseguir el comportamiento buscado independientemente de las constan-
tes físicas del sistema. En consecuencia: Sistemas diferentes, con los mismos parámetros
adimensionales, se comportarán de manera equivalente.7
En resumen, el objetivo de este análisis es encontrar una caracterización simple
del espacio de parámetros adimensionales del sistema, identificando zonas donde
el sistema tenga un comportamiento similar.
Comencemos, entonces por adimensionalizar las ecuaciones (3.5) que dan origen
a la dinámica general del sistema. Definimos para esto la variable t que llamaremos
tiempo adimensional8
t =tτ
, (3.9)
donde
τ =
√Ieq1
M g. (3.10)
Luego, derivando la ecuación de vínculo (3.1) respecto de t, encontramos
dθdt
+ adψ
dt= Γ senθ , (3.11)
con
Γ = γτ (3.12)
Entonces ahora, reescribamos las ecuaciones de Euler-Lagrange (ver deducción
6Ver descripcion de los diferentes tipos de puntos fijos en [11].7Adimensionalmente los sistemas deben responder a las mismas ecuaciones diferenciales y de
vínculo.8 La adimensionalización del tiempo es simplemente un cambio de escala, ver (3.9): Este procedi-
mento genera un tiempo característico del sistema: τ .
29
3. CONTROL CUASI-GLOBAL Control del péndulo con disco de inercia
en ApéndiceA.2) en estos nuevos términos
d2θ
dt2+ I
(d2θ
dt2+
d2ψ
dt2
)− senθ = fθ
I(
d2θ
dt2+
d2ψ
dt2
)= fψ
(3.13)
donde el único parámetro adimensional propio del sistema es
I =I2
Ieq1
, (3.14)
y donde las fuerzas adimensionales fθ y fψ las definimos 9:
fθ =fθ
M gfθ =
fθM g
(3.15)
Así, derivando (3.11) respecto a t y reemplazando d2ψ/dt2 en (3.13), la ecuación
(3.5) puede escribirse
dω
dt=− IΓ
a cosθω + senθ
I(1− 1
a)+ 1
dθdt
= ω
(3.16)
donde a debe verificar la siguiente condición10:
a 6= II + 1
(3.17)
A fin de simplificar la descripción del espacio de parámetros, definamos los si-
guientes parámetros adimensionales (ver demostración de la validez de la recoordi-
nización del espacio de parámetros en el Apéndice E):
ε =1
I(1− 1
a)+ 1
(3.18)
2∆ =Γ
a(
1 + 1I
)− 1
(3.19)
9La ecuación (3.15) no modifica la ecuación (A.4), por lo tanto el vínculo variacional permanece
definido por la ecuación (A.5).10Notar que la ecuación (3.17) es simplemente la adimensionalización de (3.4).
30
3. CONTROL CUASI-GLOBAL Control del péndulo con disco de inercia
De forma que podemos reescribir las ecuaciones (3.16) de la siguiente manera:
dω
dt= −2∆cosθω +ε senθ
dθdt
= ω
(3.20)
Luego, las matrices (3.7) producto del análisis lineal, resultan
JO =
(0 1
−ε +2∆
)JΠ =
(0 1
ε −2∆
), (3.21)
cuyos autovalores [ver forma dimensional (3.8)] en los ptos. O y Π respectivamente,
sonλO = −∆±√∆2 +ε ,
λΠ = ∆±√∆2 −ε .(3.22)
En las ecuaciones (3.22) vemos que sólo intervienen los parámetros ∆ y ε, pu-
diendose representar los difentes comportamientos del sistema –a primer orden–
mediante estas dos únicas cantidades. Es decir, de los tres parámetros del sistema
(∆, ε, I) la dinámica depende exclusivamente de los parámetros de control (∆, ε).
Con esta descripción del espacio de parámetros, las condiciones que determinan
las zonas de comportamientos de interés del sistema podrán ser descritas median-
te sólo dos parámetros: ∆ y ε. Analicemos el comportamiento del sistema ante la
modificación de estos parámetros.
En el nuevo espacio de parámetros adimensionales (∆,ε), encontramos, a par-
tir del análisis lineal alrededor de los puntos O y Π, 8 tipos de comportamiento
bien diferenciados. Estas zonas de estabilidad11 se muestran en la Figura 3.4 y están
separadas por las ecuaciones
∆ = 0 ε = o ε = ∆2 ε = −∆2 (3.23)
11Llamamos zonas de estabilidad a aquellas para las cuales el sistema tiene el mismo tipo de com-
portamiento lineal alrededor de ambos puntos fijos.
31
3. CONTROL CUASI-GLOBAL Control del péndulo con disco de inercia
-1 0 1ε-1
0
1
∆
-1 0 1-1
0
1
1
2 3
4
5
67
8
Zona O Π
1 foco estable ensilladura
2 nodo estable ensilladura
3 ensilladura nodo inestable
4 ensilladura foco inestable
5 ensilladura foco estable
6 ensilladura nodo estable
7 nodo inestable ensilladura
8 foco inestable ensilladura
Figura 3.4: Zonas de estabilidad en el espacio de parámetros adimensionales (∆, ε).
En la Figura 3.4 se resumen los resultados de los análisis lineales dentro de ca-
da zona. Notemos cómo hemos logrado simplificar las condidiones de estabilidad
mediante esta elección de parámetros. Comparemos la Figura 3.1 (para la cual re-
querimos tres parámetros) y su versión adimensional en la Zona 1 de la Figura 3.4
(con sólo dos parámetros).
En particular, las inecuaciones que garantizan la existencia de un foco estable en
la posición superior (Zona 1), se escriben ahora de la siguiente manera:
−∆2 > ε ε < 0 ∆ > 0 (3.24)
-π -π/2 0 π/2 πθ
-4
0
4
ω ^
Figura 3.5: Retrato del sistema en el espacio adimensional de fases. Control Cuasi-Global en la Zona
1, (∆ = 1, ε = −2).
Esta condición particular, resulta de interés porque al validar numericamente los
32
3. CONTROL CUASI-GLOBAL Control del péndulo con disco de inercia
resultados del análisis lineal, no sólo se verifica la estabilidad del punto O, sino que
además no se encuentran órbitas que no converjan a él. Esta situación se muestra pa-
ra la Zona 1, en la Figura 3.5 donde reproducimos adimensionalmente los resultados
de la Figura 3.2. Numéricamente, observamos que para condiciones iniciales muy
alejadas de los puntos fijos (ω >> θ)12, el sistema evoluciona hacia O convergiendo
finalmente a este punto (ver Figura 3.6).
2π0 4πθ
0
5
10
ω
^
Figura 3.6: Retrato de fases extendido. Control Cuasi-Global en la Zona 1, (∆ = 1, ε = −2).
–Notar que en esta figura no consideramos −π < θ ≤ π . A fines esquemáticos
hemos violado esta restricción teniendo en cuenta de esta forma el número total de
giros acumulados. Vemos en la figura que, dependiendo de la velocidad inicial ω,
el sistema podrá, en general, realizar varios giros antes de converger al punto O.–
En base a los resultados obtenidos en las simulaciones numéricas y el análisis li-
neal previo conluimos que eligiendo los parámetros adimensionales ∆ = 1 y ε = −2
conseguimos el Control Cuasi-Global del sistema. Cabe mensionar que aunque no es-
temos en presencia de esta clase de control, habiendo ensayado la evolución para
condiciones iniciales tan extremas, podemos asegurar que siempre que las velocida-
des no excedan cierto límite, todas las órbitas convergerán al punto O –condición
factible en la implementación práctica–.
Por otra parte, analizando la estabilidad de los puntos fijos encontramos que
para ∆ = 0 ocurre una bifurcación en los puntos O si ε < 0, ó Π si ε > 0, ver Figura
3.7. En esta figura observamos, para el punto O, la modificación de su carácter de
12En particular, esta condición se evaluó en la simulación para ω = 100.
33
3. CONTROL CUASI-GLOBAL Control del péndulo con disco de inercia
-π -π/2 0 π/2 πθ
-5
0
5
ω
^
(a) ∆ = 0, 1 ε = −4
-π -π/2 0 π/2 πθ
-5
0
5
ω
^(b) ∆ = −0, 1 ε = −4.
-π 0 ππ/2-π/2θ
-5
0
5
ω
^
(c) ∆ = 0, 0 ε = −4.
Figura 3.7: Bifurcación en ∆ = 0 –pasaje de la zona 1 a la 8.–
atractor a repulsor, al pasar el parámetro ∆ por la semirecta ∆ = 0, ε < 0. Es decir,
vemos la transición entre las zonas 1 y 8.
El conocimientos de estos límites de los parámetros adimensionales para los cua-
les se modifica el comportamiento del sistema, resulta se suma utilidad a la hora de
elegir los valores de ∆ y ε para realizar el control, ver [1]. Conocer estos puntos de
bifurcación nos permitirá elegir los parámetros del sistema suficientemente alejados
de estos, de forma que si durante el funcionamiento del sistema alguna carácterís-
tica física se modifica (por ejemplo por calentamiento, desgaste, etc.) no se corra el
riesgo de que el sistema se comporte –cualitativamente– en forma diferente al pasar
de una zona a otra.
34
3. CONTROL CUASI-GLOBAL Control del péndulo con disco de inercia
La otra condición para la cual podríamos conseguir el control Cuasi-Global del
sistema es aquella donde O en un nodo estable (Zona 2 de la Figura 3.4). En este caso
deberán verificarse
∆2 > −ε ε < 0 ∆ > 0 (3.25)
-π π0θ
-5
0
5
ω
^
Figura 3.8: Retratos de fases. Control Cuasi-Global en la Zona 2.(∆ = 2, ε = −1).
Nuevamente, al tomar condiciones iniciales lejanas13 no encontramos órbitas que
no converjan, finalmente, al punto O. Pudiendose entonces, diseñar una estretegia
de control Cuasi-Global en la Zona 2 tomando ∆ = 2 y ε = −1.
Otro caso interesante, aunque escapa a los objetivos generales del capítulo, es el
caso de conseguir un foco inestable en el punto Π. Esta situación corresponde a la
Zona 4 del diagrama de estabilidades. La ventaja de esta elección de parámetros, es
conseguir que las órbitas se alejen del punto fijo inferior Π lentamente. En la Figura
3.9 se muestra el retrato de fases para una situación de este tipo.
Este tipo de control local puede resultar útil para alejar el péndulo del punto de
reposo natural Π y en combinación con otra estrategia local completar el control
en el caso en que no se cuente con la potencia necesaria para la implementación de
alguna de las dos técnicas de control Cuasi-Global aquí presentadas. Analicemos,
como ejemplo, las fuerzas necesarias para llevar el péndulo a θ = π/2 con una ve-
locidad ω ≈ 4 mediante el control Cuasi-Global propuesto para la Zona 2 (∆ = 2
ε = −1) y utilizando el método de control local para la Zona 4 que se muestra en
13Se ensayaron condiciones iniciales para las cales el sistema realiza 15 giros completos antes de
converger a O
35
3. CONTROL CUASI-GLOBAL Control del péndulo con disco de inercia
-π 0 πθ
-5
0
5
ω
^
Figura 3.9: Retratos de fases. Control local en Π, Zona 4. (∆ = 1, ε = 2).
la Figura 3.9(∆ = 1, ε = 2). Partiendo de las mismas condiciones iniciales encontra-
mos que ambos sistemas alcanzan θ = ±π/2 en condiciones similares14. Luego para
estas dos situaciones de efecto comparable –situaciones iniciales y finales similares–
encontramos que la fuerza fψ necesaría en cada cada caso es notoriamente diferente.
En particular, para la estrategia de control local en Π [Figura 3.10(b)] la fuerza má-
xima requerida resulta ser casi la mitad15 que la requerida en la evolución controlada
cuasi-globalmente [Figura 3.10(b)].
Gracias a la elección de parámetros adimensionales ∆ yε fue posible describir las
condiciones de estabilidad de forma realmente sencilla. Sin embargo, este espacio
de parámetros no nos servirá a la hora de la implementación práctica. Para esto el
procedimiento que debemos seguir es el siguiente:
Elegir el comportamiento que se quiere para el sistema.
Identificar la zona del diagrama de estabilidad a la que corresponde la diná-
mica buscada, ver figura 3.4.
Elegir los parámetros adimensionales (∆,ε) en esa zona.
Finalmente, reescribir estos parametros adimensionales en su forma dimensio-
14El sistema de la Figura 3.10(a) alcanza θ = ±π/2 con ω = −4,50, mientras que el que se muestra
en la Figura 3.10(b) alcanza este ángulo con ω = 3,94. Al analizar estas dos órbitas debemos tener en
cuenta la antisimetría del sistema en O y Π15La fuerza máxima en la Figura 3.10(b) es f max
ψ = −5,52, mientras que en la Figura 3.10(a) se tiene
f maxψ = 10,36.
36
3. CONTROL CUASI-GLOBAL Control del péndulo con disco de inercia
ππ/2
-4
-2
0
ω
^
ππ/2θ
-10
0
10
f ψ
(a) Zona 2 (∆ = 2 ε = −1)
-π/2π
0
2
4
ω
^
-π/2πθ
-10
0
10
f ψ
(b) Zona 4 (∆ = 1 ε = 2)
Figura 3.10: Comparación de fuerzas necesarias para alejar el sistema de la posición Π. Condiciones
iniciales: θ = 3,16, ω = −0,1.
nal, a partir de las carácterísticas particulares del sistema (de las que depende
I), mediante las transformaciones16:
a =ε
ε(
I + 1)− 1
γ · τ =2∆/ I
ε(
I + 1)− 1
(3.26)
Determinados los parámetros de control del sistema a y γ –que determinan Ck–,
nos resta calcular la acción de control u. Será esta función la que determine las fuer-
zas de vínculo necesarias para implementar el vínculo que controle el sistema.
16Ver validez de la transformación de parámetros del sistema en E
37
3. CONTROL CUASI-GLOBAL Control del péndulo con carro
3.1.3. Señal de Control
La señal de control u se calcula siguiendo el procedimiento general que ya des-
cribimos en §1.5. Recordemos que para este caso particular el vínculo variacional
determina
fθ = 0 , (3.27)
y por lo tanto, eligiendo17 vθ = 0 y vψ = 1 obtenemos:
fψ ≡ u =γ I2 Ieq
1Ja
cosθ θ +(
1− 1a
)MgI2
Jsenθ . (3.28)
Esta última ecuación nos dará la forma funcional de la señal de control u(θ, θ)que debemos implementar, para la cual será necesario medir sólo el ángulo θ del
pendulo y su velocidad ω. Es decir, para el control a lazo cerrado tendremos las
variable controlada θ y la variable manupulada fψ (ver [14]).
O′
θ
O
ψ
fψ
(θ, θ)
fψ = u
ufθ = 0 (3.28)
u(θ, θ)
(3.2) (θ, θ; ψ, ψ)
Figura 3.11: Diagrama de bloques esquemático para el control a lazo cerrado del péndulo con disco.
3.2. Control del péndulo con carro
Retomemos el sistema del péndulo con carro. En §2.2, ya discutimos el problema
del control de este sistema localmente. Sin embargo, ninguno de los vínculos cine-
máticos que presentamos allí nos ha permitido controlar el sistema con una cuenca17Recordemos que a partir de la definición de la acción de control que dimos en el Capítulo 2, las
fuerzas de vínculo en este caso resultan: fθ = vθu y fψ = vψu.
38
3. CONTROL CUASI-GLOBAL Control del péndulo con carro
de atracción para el punto O lo suficientemente grande como para ser considerado
en esta sección.
Analicemos, entonces, los efectos del vínculo variacional. Modificando el Cv pro-
puesto en §2.2, consideremos ahora el siguiente vínculo18:
Cv : fθ + c fx = 0, c δθ− δx = 0 . (3.29)
Que combinamos con el vínculo cinemático
Ck : θ + ax = γ senθ , (3.30)
que derivado respecto al tiempo resulta
θ + ax = γ cosθθ . (3.31)
Luego, para calcular las ecuaciones de movimiento seguiremos el procedimiento
general que se describe en el Apéndice B, mediante el cual obtenemos el sistema de
ecuaciones (B.4)
(mx + m l
2 senθθ2 −m l
2 cosθθ)
δx +
+(
I0θ−m l2 cosθx−mg l
2 senθ)
δθ = 0
fxδx + fθδθ = 0
Reemplazando el vínculo variacional (3.29) en este sistema de ecuaciones, elimina-
mos las fuerzas y se obtiene una ecuación diferencial de segundo orden en θ y x.
Pero, si además utilizamos la ecuación (3.31) puede eliminarse x, y mediante la in-
troducción de la nueva variable independiente ω = θ se consigue reducir el orden
de las ecuaciones de Euler-Lagrange, que ahora podemos escribir,
ω = −ω2csenθ
J(a,c,θ)−ω
γ
acosθ
J(a,c,θ)
(2cl− cosθ
)+ g
senθ
J(a,c,θ)
θ = ω
(3.32)
donde definimos
J(a,c,θ) =2I0
ml− 2c
al+
(1a− c
)cosθ . (3.33)
18Aquí debemos tener en cuenta que aunque se implementa torque en el eje y fuerza sobre el carro,
el sistema sigue siendo sub-actuado ya que se debe verificar la condición (3.29). Es decir, la ecuación
(3.29) sólo determina el subespacio F al que pertenece f = ( fθ , fx). Ver Apéndice B, en particular la
discución sobre este caso en §B.1
39
3. CONTROL CUASI-GLOBAL Control del péndulo con carro
Del sistema dinámico autónomo (3.32) deducimos inmediatamente, que si se quiere
ω < ∞ ∀θ ⇒ J(a,c,θ) 6= 0 ∀θ sii:∣∣∣∣2I0
ml− 2c
al
∣∣∣∣ >
∣∣∣∣1a− c
∣∣∣∣ . (3.34)
Como ya vimos en §3.1.2, a fin de generalizar los resultados que obtengamos
en esta sección, puede resultar conveniente reportarlos adimensionalmente. En esta
opotunidad, y teniendo como precedente el desarrollo realizado en §3.1.2, proceda-
mos directamente al análisis del sistema adimensional.
3.2.1. Adimensionalización
Para adimensionalizar la dinámica del sistema del péndulo con carro, definamos
las variables
t =tτ
x =x
`/2, (3.35)
donde
τ =
√2I0
mg`. (3.36)
Las fuerzas generalizadas adimensionales
fθ = fθτ2
I0y fx = fx
τ2
m`. (3.37)
Y los parámetros adimensionales
α = a`
2y Γ = γτ . (3.38)
Así, el sistema (3.32) tendrá su forma adimensional
dω
dt= −ω2 c
Jsenθ− ω
Γ
Jαcosθ
(c− Icosθ
)+
senθ
Jdθdt
= ω
(3.39)
donde
I =m(`/2)2
I0y J = 1− c
α+ cosθ
(Iα− c
). (3.40)
Notemos que la dinámica adimensional (3.39) depende de c,α, Γ , I, donde I es el
único parámetro característico del sistema.
40
3. CONTROL CUASI-GLOBAL Control del péndulo con carro
3.2.2. Análisis lineal
En esta sección procederemos de manera análoga al desarrollo realizado en §3.1.1.
Así, del análisis del sistema (3.39), encontramos que sus únicos puntos fijos son
O ≡ (θ, ω) = (0, 0)
Π ≡ (θ, ω) = (π , 0)
Luego, linealizando el sistema (3.39) en cada uno de estos dos puntos se obtienen
las siguientes matrices Jacobianas:
JO =
0 11
jo
AO
jo
JΠ =
0 1
− 1
jπ
AΠ
jπ
donde
jo = J(α,c,θ=0) = 1− cα
+
(Iα− c
), jπ = J(α,c,θ=π) = 1− c
α−
(Iα− c
)(3.41)
y
AO =Γ
α
(I − c
), AΠ =
Γ
α
(I + c
). (3.42)
Resulta de particular inrterés, a los efectos del control Cuasi-Global, analizar las
condiciones que hacen de O un foco estable19. Del análisis de los autovalores de la
matriz jacobiana de este punto, encontramos que para que se dé este caso, los pará-
metros α, c, Γ , I deben verificar
AO jo < 0 y(
AO
2 jo
)2
+1jo
< 0 , (3.43)
donde jo y AO fueron definidos pos las ecuaciones (3.41) y (3.42) respectivamente.
Resulta importante destacar que, a diferencia de los casos tratados en §2.2, las
ecuaciones (3.34) y (3.43) son compatibles y determinan un subconjunto en el espacio
de parámetros (α, c, Γ) dentro del cual O es un foco estable y no hay singularidades en
las ecuaciones20, ver Figura 3.12. Analicemos, como ejemplo particular, la elección
19Ver [11].20Recordemos que los parámetros adimensionales para este caso son cuatro, de forma que la Figura
3.12es una vista (en 2D) de la proyección de la zona del espacio en cuestión (4D) sobre el hiperplano
I = 1 (3D).
41
3. CONTROL CUASI-GLOBAL Control del péndulo con carro
Γ
cα
Γ
0
-1
50
-510
-1
Figura 3.12: Zonas del espacio de parámetros adimensionales del sistema α, c, Γ , con I = 1, para las
cuales O es un foco estable.
de parametros (α; c; Γ) = (0,8; 3; −0,4), correspondiente a uno de los puntos de
esta figura.
Numericamente, encontramos que para diferentes condiciones iniciales el siste-
ma evoluciona siempre hacia el punto O, ver Figura 3.13. Al igual que en el caso del
disco de inercia, medimos la cuenca de atracción de este punto tomando condiciones
iniciales lejanas21 a O.
-π 0 πθ
-2
0
2
ω
^
Figura 3.13: Retrato de fases resultante de la técnica de Control Cuasi-Global para el péndulo con
carro con(α; c; Γ) = (0,8; 3; −0,4).
21Consideramos condiciones iniciales lejanas a aquellas que generan órbitas que realizan varias
(más de 2) vueltas completas.
42
3. CONTROL CUASI-GLOBAL Control del péndulo con carro
Encontramos así, que para todas las condiciones iniciales ensayadas el sistema
converge uniformemente al punto O, como se muestra en el retrato de fases exten-
dido de la Figura 3.14.(Ver definición convergencia uniforme en [11]).
-10π 0 10πθ
-20
0
20
ω
^
Figura 3.14: Retrato de fases extendido. Control Cuasi-Global para el péndulo con carro con
(α; c; Γ) = (0,8; 3; −0,4).
Alternativamente, aquí presentamos, aunque claramente escapa a los objetivos
del capítulo, el caso de control local en Π. Al igual que en §3.1, mostramos este caso
ya que, como se discutió en esa sección, puede resultar de interés al implementar
una técnica de control local con fuerzas limitadas. En particular, en la Figura 3.15
presentamos las zonas del espacio de parámetros (para I = 1) donde se tiene un foco
inestable en Π.
En esta ocación, nos limitamos sólo a mensionar el hecho que mediante el vínculo
propuesto [ver ecuaciones (3.29) y (3.30)] también se puede lograr un control local
en Π para el péndulo con carro. Obteniendo órbitas como las que se muestran en
la Figura 3.16. Para realizar esta figura, también utilizamos un código similar al que
se muestra en al Apéndice F.2, eligiendo como parámetros uno de los puntos de la
Figura 3.15: (α; c; Γ) = (3; 1/2; 1).
Otra condición que resulta de particular interés a fines de lograr el control Cuasi-
Global, es aquella donde O es un nodo estable(Ver definición en [11]). Para que esto
suceda, analizando los autovalores del sistema linealizado alrededor de O, encon-
tramos que deben verificarse
AO jo < 0 0 >1jo≥ −
(AO
2 jo
)2
. (3.44)
43
3. CONTROL CUASI-GLOBAL Control del péndulo con carro
Γ
50
-53
0-3
-6
Γ
10
5
0
-5
c α
Figura 3.15: Zonas del espacio de parámetros adimensionales del sistema α, c, Γ , para las cuales Π es
un foco inestable.
-π 0 πθ
-2
0
2
ω
^
Figura 3.16: Retrato de fases resultante de la técnica de Control local en Π para el péndulo con carro
con (α; c; Γ) = (3; 1/2; 1) y para I = 1.
44
3. CONTROL CUASI-GLOBAL Control del péndulo con carro
De las ecuaciónes (3.44) y (3.34), encontramos que existe, nuevamente, un con-
junto de parámetros adimensionales que verifica ambas. Deducimos entonces, que
es posible encontrar un vínculo para el cual las ecuaciónes no tengan divergencias y
además el punto O resulte un nodo estable.
Γ
cα
Γ
0
-1
50
-510
-1
Figura 3.17: Zonas del espacio de parámetros del sistema α, c, Γ , para las cuales O es un nodo estable
(I = 1).
En la Figura 3.18, se muestra el retrato de fases correspondiente a una elección de
parámetros que verifica estas condiciones. Numéricamente, encontramos para este
caso particular, que la cuenca de atracción del punto O parecería ser todo el espacio
de fases excluyendo la subvariedad estable de la ensilladura en Π. Nuevamente, pa-
ra condiciones iniciales cada vez más alejadas de los puntos fijos, encontramos que
el sistema evoluciona indefectiblemente hacia O. Entonces, en vistas de la evidencia
proporcionada por la simulación suponemos que los vínculos propuestos controlan
Cuasi-Globalmente el sistema (tal como discutimos al comienzo de este capítulo).
Si bien escapa a los objetivos de esta sección, otra forma de control Cuasi-Global
que podemos mencionar, es la estabilización de una órbita en lugar de un punto fijo
(ver, por ejemplo, [15]). En particular, para los vínculos propuestos encontramos que
si, por ejemplo, se toma (α; c; Γ) = (−0,4; −1; 1) hallamos un ciclo límite atractor,
como se muestra en la Figura 3.19. Allí ejemplificamos la estabilización Cuasi-Global
de una órbita –ya que para todas las condiciones iniciales probadas el sistema tiende
a esta situación–. Para este caso particular, en lugar de converger todas las órbitas
el punto O, lo hacen a un ciclo límite del sistema. Para esta elección de parame-
45
3. CONTROL CUASI-GLOBAL Señal de Control
-π 0 πθ
-0.5
0
0.5
ω
^
Figura 3.18: Retrato de fases (α; c; Γ) = (0, 2; 4; −0, 7).
tros de control α, c y Γ , econtramos que asintóticamente el péndulo realizará giros
completos independientemente de cual fue la condición inicial de la que se partió.
–Hablamos de control Cuasi-Global debido a que la subvariedad estable asociada a
la ensilladura en el punto Π es el único conjunto que queda fuera de la cuenca de
atracción de este ciclo límite.–
0 10π 20π 30πθ
0
10
ω
^
Figura 3.19: Retrato de fases para la técnica de Control Cuasi-Global propuesta aplicada la estabili-
zación de órbita.(α; c; Γ) = (−0,4; −1; 1).
3.3. Señal de Control
Por otra parte, si en lugar de eliminar las fuerzas de las ecuaciones (2.1) se elimi-
na una de las coordenadas y sus derivadas utilizando las ecuaciones (3.29) y (3.30)
46
3. CONTROL CUASI-GLOBAL Señal de Control
–siguiendo el procedimiento general que mostramos en §1.5– se puede escribir la la
fuerza necesaria para implementar el vínculo virtual impuesto al sistema en función
de una sola de las coordenadas. Esta formulación resulta de interés a la hora de la
implementación del control a lazo cerrado. Identificando u ≡ λ (como vimos en el
Capítulo 2) en la ecuación (3.29) se tiene
fx = u
fθ = −cu
con
u =`/2
J(a,c,θ)senθ
(aI0 + m
`
2cosθ
)θ2 + (3.45)
+γm
J(a,c,θ)
[I0 −
(m
`
2cosθ
)2]
θ−
− mg`/2J(a,c,θ)
senθ
(a`
2cosθ− 1
)
donde J(a,c,γ) fue definido en la ecuación (3.33).
Notemos que además estas fuerzas ( fx, fθ) resultan acotadas, gracias a la ecuación
(3.34) que asegura que el denominador de cada término de la ecuación (3.45) es
distinto de cero para todo θ.
Luego, eligiendo las coordenadas generalizadas θ y z = −cθ + x (ver Apéndice
B.1), tenemos que θ es la variable controlada, mientras que z es la variable manipulada
(ver [14]).
47
fz
(θ, θ)
fz = u
ufy = 0 (3.45)
(θ, θ; x, x)xO
O′θ
(3.32)
u(θ, θ)
Figura 3.20: Diagrama de bloques esquemático para el control a lazo cerrado del péndulo con carro.
Capítulo 4
Contraste con Otros Métodos de
Control
4.1. Comparación con los métodos de control lineal con-
vencionales a lazo cerrado
A continuación relizaremos una comparación entre el método de control por
vínculos virtuales lineales y los métodos lineales convencionales.
Para esto, consideremos un sistema mecánico subactuado con n grados de liber-
tad (coordinizado por qi) y con n fuerzas externas1 fi, con 1 ≤ i ≤ n (pudiendo ser
nulas algunas de estas fuerzas).
Los métodos convencionales que analizaremos son aquellos que consisten en la
implementación de una acción de control u ∈ Rm –con m < n por ser subactuado2–
a partir del análisis del comportamiento del sistema linealizado a primer orden al-
rededor del punto de equilibrio O. En estos casos, la acción de control es además
lineal en las coordenadas y en la velocidad del sistema. Es decir cada componente
de u = (u1, . . . , um) es
ui = K1i jq
j + K2i jq
j, (4.1)
con 1 ≤ i ≤ m, 1 ≤ j ≤ n, donde K1i j = (K1)i j y K2
i j = (K2)i j pueden ser pensados
como elementos de matrices de K1,K2 ∈ Rm×n.1Sobre las fuerzas generalizadas externas es que actua la acción de control u, es decir fi = fi(u)2Ver Apéndice D.1
49
4. CONTRASTE CON OTROS MÉTODOS DE CONTROL Métodos lineales
Los métodos que cuadran en esta categoría son todos aquellos reductibles a una
representación de espacio-estado, como ser el control proporcional, el control Derivativo
y los métodos del lugar geométrico de las raices (de Ackerman, Graham & Lauthrop,
etc.), entre otros (ver [6] y [14]).
En esta sección mostraremos algunas condiciones a partir de las cuales es posi-
ble diseñar una familia de vínculos virtuales lineales tales que el sistema mecánico
linealizado resultante sea equivalente al generado por los métodos convencionales
considerados. Además mostraremos, constructivamente, como elegir este vínculo.
Consideraremos que tanto el Lagrangiano L como el subespacio F al que per-
tecen las fuerzas 3son los mismos para ambas representaciones.
Las ecuaciones de Euler-Lagrange para cada una de las dos representaciones son
ddt
(∂
∂q j L
)− ∂
∂q j L = vijui , (4.2)
ddt
(∂
∂q j L
)− ∂
∂q j L = vijλi , (4.3)
para el caso de control convencional o por vínculos virtuales, respentivamente.
Linealizando la ecuación (4.3) en el punto de equilibrio4 O = (q, q) = (0, 0),
resulta (ver [7])
Mq +Aq = Vλ (4.4)
donde M, A ∈ Rn×n, V ∈ Rn×m, λ ∈ Rm y q, q representan pequeños despla-
zamientos en la aceleración y la posición respectivamente, que pueden entonces,
pensarse como pertenecientes a Rn.
Consideremos además la implementación de los vínculos lineales w = 0, con
w : Rn ×Rn → Rm tal que
w(q, q)i = J1i jq
j + J2i jq
j − Ci , (4.5)
con 1 ≤ i ≤ m, 1 ≤ j ≤ n, Ci ∈ R y donde J1i j, J2
i j ∈ R son elementos de las matrices
incógnitas J1 y J2, respectivamente. Luego, derivando (4.5) y reemplazando q de
3Se considera que para los dos sistemas [(L , u) ó (L , Ck)] se tiene el mismo acceso al sistema: se
implementa el control mediante los mismos actuadores mecánicos los que determinan F .4El análisis se realiza sólo en las cercanías del punto de equlibrio, ya que los métodos tradicionales
son diseñados a partir del comportamiento del sistema en esta zona.
50
4. CONTRASTE CON OTROS MÉTODOS DE CONTROL Métodos lineales
(4.4)dwdt
= J1q + J2M−1 (Vλ−Aq) = 0Rm . (4.6)
Así, ya que para ambos modelos se tienen los mismos vínculos variacionales (Cv),
escribimos las fuerzas generalizadas: f j = vi jui para los métodos convencionales y
f ′j = vi jλi para el método de vínculos virtuales. De forma que, para conseguir el
mismo sistema ( L ,Cv,f ), debe verificarse
λi = ui ,
para 1 ≤ i ≤ m. Así, reemplazando la ecuación(4.1) en (4.6), resulta el siguiente
sistema de ecuaciones para los elementos de J1 y J2 :
J1q + J2M−1 (VK1q +VK2q−Aq) = 0Rm ∀(q, q) ∈ Rn ×Rn .
Luego, considerando la ecuación anterior válida para todo5 (q, q), resultan las
ecuaciones
J1 + J2M−1VK2 = 0Rm×n , (4.7)
J2C = 0Rm×n ,
donde
C =M−1 (VK1 −A) .
Transponiendo ambos miembros tenemos
C>J>2 = 0Rn×m (4.8)
Sea, F =< f > el espacio generado por las fuerzas generalizadas de control
–o de vínculo– (ver Apéndice D.1), tal que dim(F ) = m (es decir, [K1K2] de rango
completo). Luego, como vimos en §1.5 para poder obtener las fuerzas de vínculo
es necesario contar con m ecuaciones de vínculo independientes6. Como w(q, q) =[J1J2] [qq]>, será necesario que
rango[J1J2] = m .
5Se piden condiciones válidas para todo (q, q), pero bastaría con considerar (q, q) ∈ TQ, ver [8].6En otras palabras, dim(F ) + dim(w−1(0)) = dim(TQ)⇒ dim(w−1(0)) = 2n−m.
51
4. CONTRASTE CON OTROS MÉTODOS DE CONTROL Métodos energéticos
En particular, si rango(J2) = m se verifica automaticamente la ecuación anterior
independientemente de J1. Luego, teniendo en cuenta la ecuación (4.8) –y conside-
rando queM es de rango completo–, encontramos que
rango (VK1 −A) = n−m⇒ rango(C) = n−m⇒ rango(J2) = m
Así, una condición suficiente es:
rango (VK1 −A) = n−m (4.9)
Destaquemos que la ecuación anterior –aunque quizas excesivamente restrictiva–
impone condiciones sólo sobre la la señal de control (mediante K1) a partir de las
características del sistema (V y A). –No interviene ninguna de las incógnitas J1 o
J2.–
De esta manera, para sistemas convencionales que verifiquen la ecuación (4.9),
calculamos las posibles soluciones J2 mediante la ecuación (4.8). Luego, J1 queda-
rá univocamente determinada para cada J2 solución de (4.8) y la obtenemos de la
ecuación (4.7)
J1 = −J2M−1VK2 . (4.10)
Finalmente las constantes Ci que determinan el vínculo podremos elegirlas en fun-
ción de las condiciones iniciales. Este último punto establece otra restricción: los sis-
temas serán equivalentes sólo para las condiciones iniciales que verifiquen el víncu-
lo, es decir deben existir las constantes reales Ci : w(q0, q0) = 0.
Aquí hemos formulado condiciones suficientes, no necesarias, es decir podrá ha-
ber casos más generales de sistemas tradicionales que no cumplan con las condi-
ciones aquí descriptas pero que sin embargo factibles de ser reproducidos mediante
este tipo de vínculos virtuales lineales. En particular estas condiciones más genera-
les se tratan en [8].
4.2. Comparación con los métodos de lagrangianos con-
trolados mediante Kinetic Shapping
En esta sección compararemos el método de control mediante vínculos virtuales
no holónomos y el de lagrangianos controlados que se describe en [2]. En esta publi-
52
4. CONTRASTE CON OTROS MÉTODOS DE CONTROL Métodos energéticos
cación Bloch, Leonard y Marden describen, entre otras cosas, las condiciones7 que
se deben cumplir para poder implementar la técnica de lagrangianos controlados
que proponen. Es justamente en estas condicones en las que enfocaremos nuestro
análisis.
En §I-B. de la publicación se analiza el caso del pendulo con carro. Analicemos en-
tonces este caso ya que además representa un ejemplo recurrente en nuestro propio
trabajo. En este sentido podemos establecer una equivalencia entre las descripciones
del sistema que se hacen en [2] y la el modelo que planteamos para nuestro análisis
(ver Apéndice B) si redefinimos las variables que se utilizan en la publicación según:
γ = m, α = I0, β = m`/2, D = −mg`/2, φ = θ, s = x ,
donde m, I0, `, g, θ y x se definen en el Apéndice B para nuestro péndulo con carro.
En la publicación se propone, a paritr del sistema actuado
ddt
(∂L
∂θ
)− ∂L
∂θ= 0
ddt
(∂L
∂x
)= fx
(4.11)
–donde (∂L )/(∂x) = 0 (x es cíclica)–, construir el sistema
ddt
(∂Lσ ,τ
∂θ
)− ∂Lσ ,τ
∂θ= 0
ddt
(∂Lσ ,τ
∂x
)= 0
(4.12)
donde x sigue siendo una variable cíclica. El procedimiento general consiste en asi-
milar la señal de control fx dentro de una modificación sólo8 en la energía cinética
del sistema original –de forma que redefiniendo esta cantidad se consigue el sistema
(4.12)– .Para esto se define una expresión general para el nuevo lagrangiano
Lσ ,τ =12
[mθ2 + m` cosθ(x + kθ)θ + m(x + kθ)2
]+
σ
2m k2 θ− mg`
2cosθ , (4.13)
siendo σ una constante y k una función a determinar. Luego comparando la primer
ecuación de los sistemas (4.12) y (4.11) –ecuaciones en θ– se tiene la primera condición
7En [3] se relajan algunas de las condiciones necesarias, gracias a la implementación de lo que se
denomina potencial shapping.8En [3] se admite una redefinición tanto de la energía cinética como de la potencial.
53
4. CONTRASTE CON OTROS MÉTODOS DE CONTROL Métodos energéticos
de compatibiliad(matching conditions, ver [2].)
σm(
k(θ)
)2= −m`/2 k(θ) cosθ . (4.14)
Por otro lado, comparando las segundas ecuaciones de estos mismos sistemas –
ecuaciones en x– se tiene la segunda condición de compatibilidad
fx = − ddt
(m k(θ)
), (4.15)
que determina la acción de control a implementar en el modelo de lazo cerrado en
función de σ y k. De la ecuación (4.14) se tiene
k(θ) =`
2σcosθ . (4.16)
Luego, la constante libre σ se ajusta de forma de obtener la dinámica buscada, en
particular para que O sea estable debe verificarse
σ−1 >4I0
m`2 − 1 ,
para 4I0/(m`2)− 1 > 0.
Ahora bien, analicemos la segunda ecuación –en x– del sistema (4.12). Si reem-
plazamos la ecuación (4.13) obtenemos
ddt
(∂Lσ ,τ
∂x
)=
ddt
[m`/2 cosθ θ + m(x + k(θ)θ)
]= 0 . (4.17)
Particularizando en el valor de k(θ) dado por la ecuación (4.16), encontramos
ξ cosθ θ + m x− Cα = 0 , (4.18)
donde ξ es una constante y donde Cα es una función de las condicones iniciales
dadas por
ξ = m`
2
(1 +σ−1
), Cα = ξ cosθ0 θ0 + m x0 .
Notemos entonces que la ecuación (4.18) es de la forma w(q, q) = 0, verificando
la definición de vínculos no holónomos de la ecuación (1.10). Encontramos así una
familia de vínculos (para diferentes conjuntos de condiciones iniciales), a partir de
las condiciones de compatibilidad. Por otra parte, dado que por hipótesis fθ = 0,
aplicando el principio de los trabajos virtuales generalizado, resulta
Cv : δx = 0 . (4.19)
54
4. CONTRASTE CON OTROS MÉTODOS DE CONTROL Métodos energéticos
Luego el sistema no holónomo formado por la terna (L , Ck, Cv), donde L es el
lagrangiano original del sistema dado por (C.11), Ck el vínculo cinemático indicado
en la ecuación (4.18) y Cv está definido por (4.19), reproduce la dinámica alcanzada
mediante el método de lagrangianos controlados que analizamos aquí. Es decir, son
equivalentes los sistemas
(L , Cv, fx) ≡ (Lσ ,τ , k(θ),σ) ≡ (L , Cv, Ck) ,
siempre que se verifiquen las condiciones de compatibilidad (4.14) y (4.15).
Ahora demos un paso más en el analisis. Con el ejemplo del péndulo con carro
que acabamos de analizar vimos que para encontrar un sistema no holónomo que
describa adecuadamente las ecuaciones de un lagrangiano controlado, el mayor in-
conveniente se presenta en la determinación del vínculo cinemático (Ck), ya que el
lagrangiano L y el Cv son heredados del sistema original. Pero reviendo el procedi-
miento mediante el cual obtuvimos la expresión para Ck que damos en la ecuación
(4.18) a partir de (4.17), encontramos que fácilmente podemos generalizarlo
Ck :ddt
(∂Lσ ,τ
∂s
)= 0 ,
siempre que exista en el sistema original –y en el controlado– una variable cíclica s
–que como se muetra en [2] siempre genera una cantidad conservada9–.
Así, concluimos que siempre podemos encontrar un sistema no holónomo generalizado
equivalente a los sistemas resultantes del método de lagrangianos controlados, siempre que
exista alguna coordenada cíclica.
Este resultado –al igual que el de §4.1–, se analiza para condiciones más genera-
les en [8].
9Esta cantidad conservada es justamente la que determina el Ck, cuyo orden dependerá de las
derivadas involucradas en la ecuación (4.17): En general, para lagrangianos dependientes sólo de la
posición y velocidad, resulta un vínculo de primer orden.
55
Capítulo 5
Conclusiones
En este trabajo describimos la dinámica resultante de la implementación de la
técnica de control por vínculos virtuales mediante sistemas no holónomos generaliza-
dos. Valiendonos de este formalismo calculamos diferentes vínculos que permiten
la estabilización de puntos inestables para diferentes sistemas no lineales . Para es-
to realizamos un análisis de las órbitas y de los parámetros que generan el control
buscado. Por este camino conseguimos diseñar estrategias que permiten alcanzar
el control cuasi-global de los sistemas. Llevando luego estos resultados a la estructu-
ra usual de control por retroalimentación, al indicar la forma funcional de la señal
de control que se debe implementar a tales fines. Alternativamente, presentamos
vínculos lineales y no-lineales que generan la estabilización local. Finalmente –y en
forma accesoria– contrastamos la técnica de control mediante vínculos cinemáticos
con otros métodos conocidos como son los métodos lineales en el espacio de estados y
los métodos energéticos.
56
Apéndice A
El péndulo con disco
O′
θ
mb, I2g
ψmd, I1
O
`
c
Figura A.1: El péndulo con disco.
Este modelo mecánico consiste en un péndulo invertido capaz de girar libremen-
te respecto de O y con un disco de inercia adosado en su extremo móvil O′, como
el que se muestra en la Figura A.1. Para describir la posición de este sistema utili-
zamos las coordenadas generalizadas θ (para el ángulo del péndulo respecto de la
vertical superior) y ψ (el ángulo de giro del disco respecto de alguna posición arbi-
traria cualquiera) que se indican en la figura. Así un punto genérico q del espacio
57
A. EL PÉNDULO CON DISCO
de configaraciones1 Q resulta q = (θ, ψ) ∈ Q. El Lagrangiano del sistema es2
L =12
Ieq1 θ2 +
12
I2(θ + ψ
)2 −Mg (1 + cosθ) . (A.1)
Para el cual se han definido
Ieq1 = mbc2 + md`
2 + I1 y M = mbc + md`
donde mb, I1 y md, I2 son las masas y momentos de inercia baricéntricos de la barra y
disco de inercia, respectivamente; c y ` son las distancias desde el eje de rotación de
la barra a los centros de masa de la barra y disco, respectivamente; g la aceleración
de la gravedad; y donde los ángulos θ y ψ son medidos respecto de la vertical, ver
figura A.1.
A partir de (A.1) se desprenden las Ecuaciones de Euler-Lagrange3
Ieq1 θ + I2
(θ + ψ
)−Mgsenθ = fθI2
(θ + ψ
)= fψ
(A.2)
Luego, combinando las ecuaciones del sistema (A.2)
[Ieq1 θ + I2
(θ + ψ
)−Mgsenθ]δθ +
+[I2
(θ + ψ
)]δψ = fθδθ + fψδψ (A.3)
donde δθ, δψ deben elegirse tales que se verifique
fθδθ + fψδψ = 0 . (A.4)
Así, si se cumple la ecuación (A.4) se eliminan las fuerzas de vínculo. En par-
ticular si el único control que es posible realizar sobre el sistema es a través de fψ( fθ = 0), es decir torque en el disco, la ecuación (A.4) se reduce a
δψ = 0 . (A.5)
Luego, reemplazando (A.5) en (A.3) resulta
Ieq1 θ + I2
(θ + ψ
)−Mgsenθ = 0
fθ = 0(A.6)
1Ver definición de espacio de configuraciones en [7]2ver decucción en §C.13Ver deducción de este procedimiento en D.2
58
Apéndice B
El péndulo con carro
O′
m, I
x
g
θ
O
`/2
Figura B.1: El péndulo con carro.
Este modelo consiste en un péndulo invertido montado sobre un carro que es
capaz de moverse horizontalmente y sobre una linea recta (ver Figura B.1). El pén-
dulo puede girar libremente alrededor del punto O, sin hacer contacto con el carro
en ningun punto excepto O′, para toda posición. Para describir la posición de este
sistema utilizamos las coordenadas generalizadas θ, x que se indican en la figura.
59
B. EL PÉNDULO CON CARRO
Notemos que el origen de coordenadas de x puede ser cualquier punto del piso y el
origen de θ corresponde a la posicón vertical superior. Así un punto genérico q del
espacio de configaraciones1 Q resulta q = (θ, x) ∈ Q. El lagrangiano de este sistema
es2:
L =12
mx2 +12
I0θ2 −m
l2
cosθ(
g + θx)
. (B.1)
donde m es la masa del péndulo, I0 = I + `2/4 es su momento de inercia respecto
de O′, dado el momento de inercia I baricéntrico. –Aquí hemos considerado nula la
masa del carro a fin de simplificar la descripción.–
A partir de (B.1) se desprenden las Ecuaciones de Euler-Lagrange3
(mx + m l
2 senθθ2 −m l
2 cosθθ)
δx +
+(
I0θ−m l2 cosθx−mg l
2 senθ)
δθ = fxδx + fθδθ ,(B.2)
donde, (δx, δθ) ∈ Cv.
Además, aplicando el principio de los trabajos virtuales generalizado para siste-
mas no-holónomos (ver [4]),
fxδx + fθδθ = 0 . (B.3)
Así, si se toman δx, δθ tales que se verifique la ecuación (B.3) se consigue eliminar
las fuerzas de vínculo, mediante un procedimiento equivalente a la formulación de
D’Alambert. Se obtiene de ésta manera el sistema de ecuaciones
(mx + m l
2 senθθ2 −m l
2 cosθθ)
δx +
+(
I0θ−m l2 cosθx−mg l
2 senθ)
δθ = 0
fxδx + fθδθ = 0
(B.4)
Recordemos que, a diferencia de los sistemas que verifican el principio de D’Alambert
–donde la relación entre δx y δθ se desprende del vínculo cinématico– el sistema
(B.4) requiere por separado la restricción dada por el vínculo cinemático (se reali-
zarán sólo sobre la velocidad y posición del sistema, para los casos estudiados) y la
limitación del vínculo variacional, es decir la vinculación entre δx y δθ.
1Ver definición de espacio de configuraciones en [7]2Ver contrucción del lagrangiano para este sistema en particular en Apéndice C.23Ver deducción de este procedimiento en D.2
60
B. EL PÉNDULO CON CARRO Análisis de la expresión gral. de Cv
Dado que la implementación del vínculo será a través de servomecanismos, en
general definimos el vínculo variacional a partir del conocimiento de los actuadores
(ver §1.4).
Por ejemplo si la acción de control se implementa mediante una fuerza horizontal
sobre el carrito, el vínculo variacional resultará: Cv : fθ = 0 ó alternativa-
mente, a partir de la ecuación (B.3): Cv : δx = 0.
Si, por el contrario, sólo se puede ejercer un torque sobre la barra del péndulo, el
vínculo será: Cv : fx = 0 ó Cv : δθ = 0
Finalmente, en una forma más general puede admitirse el siguiente vínculo:
Cv : fθ + c fx = 0, c δθ− δx = 0 . (B.5)
B.1. Análisis de la ecuación (B.5) en el marco de los sis-
temas subactudos
La ecuación (B.5), que dá una expresión general para los vínculos variacionales
que tratamos en este trabajo, implica que –para c 6= 0– el control del sistema debe
hacerse mediante dos fuerzas. Luego, dado que los sistemas que tratamos (tanto el
péndulo con carro como con disco de inercia) tiene dos coordenadas generalizadas
independientes (dim Q = 2), se plantea la duda de si este vínculo realmente repre-
senta un sistema subactuado.
Recordemos, entonces la definición de sistemas subactuados (ver Apéndice D.1)
dim(F ) < dim(Q) ,
donde F =< f > es el espacio generado por las fuerzas de vínculo. Luego, de la
ecuación (B.5) tenemos
f = ( fθ, fx) = (−c, 1)λ ,
donde λ es alguna función de las coordenadas y velocidades del sistema. De forma
que
dim(F ) = 1 < dim(Q) = 2 .
61
B. EL PÉNDULO CON CARRO Análisis de la expresión gral. de Cv
Es decir, se trata de un sistema subactuado ya que las fuerzas de vínculo son siempre
en la dirección4 (−c, 1).
Para visualizar mejor esto último, hagamos el siguiente cambio de coordenada
generaliza:
z = −c θ + x , (B.6)
donde θ y z son independientes. Ahora en estas nuevas coordenadas (θ, z), de la
ecuación (B.5) tenemos5
fθ = 0 , (B.7)
de modo que
fz = ξλ, (B.8)
donde ξ2 = c2 + 1. En estas nuevas coordenadas hemos encontrado la descripción
clásica de sistemas subactuados donde θ es la variable controlada y fz es la variable
manipulada, ver [14].
4Hablamos de dirección (realizando, quizás, un abuso de notación) en el espacio dual al tangente
del de configuraciones T∗Q, no fisicamente (ver [12]).5Ahora < fy, fz > 6=< fθ , fx >= 0, y es por esto que fθ = 0.
62
Apéndice C
Lagrangianos de sistemas articulados
Para calcular el lagrangiano L de cualquier sistema mecánico, es necesario co-
nocer las expresiones de la energía cinética T y potencial V del mismo (ver [7]).
Recordemos que
L = T−V . (C.1)
La energía potencial V, en general no presenta demasiados inconvenientes. Pero
la energía cinética de los sistemas tratados a lo largo de este trabajo pueden presen-
tar algunas sutilezas que vale la pena tener en cuenta.
Al tratar con sistemas articulados, es común tomar como origen de alguna coor-
denada el punto O′ que articula dos partes del sistema.Es por esto que, para escribir
el lagrangiano en las coordenadas generalizadas elegidas, nos interesará calcular la
énergia cinética en estas mismas coordenadas.
Resulta útil, entonces, conocer una expresión general de la energía cinética para
cada una de las partes del sistema en función de la descomposición de su movimien-
to respecto de un punto cualquiera, generalmente acelerado.
El objetivo de este apartado es sistematizar un procedimiento general, que per-
mita obtener la energía cinética de cuerpos arbitrarios en movimiento plano, que
son la clase considerada en este trabajo. Para esto, procederemos por aproximacio-
nes sucesivas.
Primera aproximación: Sistema Discreto.
Consideremos el sistema compuesto por N masas puntuales δmi.
La energía cinética TO del sistema respecto del punto inercial O –para un dado
63
C. LAGRANGIANOS DE SISTEMAS ARTICULADOS
O
O′
rr
R
r
Figura C.1: Descomposición de la posición de los puntos de un cuerpo arbitrario.
instante– estará dada por1
TO =12δmi(ri)2 , (C.2)
con 1 ≤ i ≤ N. Donde a cada masa diferencial –por ser puntual– le corresponde una
única velocidad ri (respecto del punto O).
Reescribiendo la posición ri = R + rir (ver figura C.1) de cada masa diferencial,
respecto de algún punto arbitrario O’ –en general no inercial (perteneciente ó no al
sistema)– resulta (ri)2 = ri · ri = R2 +(rir)2 + 2R · ri
r, donde rir es la velocidad de cada
punto relativa a O′. Así, podemos reescribir la energía cinética en estos términos,
TO =12
[MR2 + (ri
r)2δmi + 2R · ri
rδmi
],
donde M = ∑Ni=0 δmi es la masa total del volumen V considerado.
Segunda aproximación: Sistema Continuo.
Tomando el límite de la ecuación anterior, para N tendiendo a infinito y mante-
niendo la masa total M = ∑Ni=0 δmi → M =
∫V dm, generalizamos, así, la expresión
obtenida para TO, a un sistema continuo:
TO =12
MR2 + TO′ +∫
VR · rrdm , (C.3)
1Índices repetidos indican sumatoria
64
C. LAGRANGIANOS DE SISTEMAS ARTICULADOS
donde TO′ = 1/2∫(rr)2dm es la energía cinética total respecto a un sistema coorde-
nado inercial en O′ –coincidente en posición y velocidad con O′ solo por un instante
(O′ puede ser acelerado)–.
Tercera aproximación: Cuerpo Rígido (CR) en movimiento plano.
La condición de CR impone un vínculo entre cada dm –en este análisis manten-
dremos la hipótesis anterior de sistema continuo– que podemos escribir,
rr = r− R = Ω× rr , (C.4)
con Ω ∈ R, uniforme para todo punto perteneciente al CR.
Si ahora, además, consideramos que el cuerpo tiene restringido su movimiento a
un plano Π⊥Ω, rr y R resultan coplanares y R ·Ω = rr ·Ω = 0. Teniendo en cuen-
ta esto –y aplicando la definición de producto escalar– podemos escribir el último
término de la ecuación (C.3) como∫
VR · rrdm = −RΩ
∫
Vrrsenϑdm ,
donde ϑ es el ángulo entre las proyecciones de rr y R sobre Π.
Notar que este resultado podemos interpretarlo como un momento de primer
orden de la masa del cuerpo respecto de un plano Λ⊥Π tal que R ∈ Λ y que deno-
taremos
IΛ =∫
Vrrsenϑdm .
–Cabe destacar que esta integral no es una propiedad propia del cuerpo ya que que-
da definida por la dirección de R (ésta es una de las sutilizas a las que nos referíamos
al comienzo de este apéndice).–
Para las aplicaciones nos interesará reescribir IΛ considerando la descomposi-
ción rr = rcmr + rcm, donde rcm
r es la posición del centro de masa relativa a O′ y rcm
es la posición de cada punto relativa al centro de masa. Así, reescribimos
IΛ = rcmr senϑcmM + Icm
Λ , donde IcmΛ =
∫
Vrcmsenϑdm = 0 ,
con ϑcm el ángulo entre las proyecciones sobre Π de rcmr y R. Aquí hemos identicado
IcmΛ = 0 por realizarse la integración respecto del CM, ver [7]. Por otra parte, el tér-
mino TO′ de la ecuación (C.3), podemos reescribirlo, teniendo en cuenta la ecuación
65
C. LAGRANGIANOS DE SISTEMAS ARTICULADOS El péndulo con disco.
(C.4), de la forma
TO′ =12
∫
V(rr)2dm =
12
∫
VΩ2r2
r dm =12Ω2 IO′
donde IO′ =∫
r2r dm.
Finalmente, la energía cinética, respecto de un pto. inercial O, de un cuerpo rígi-
do arbitrario en movimiento plano, es en general
TO =12
MR2 +12Ω2 IO′ − RΩIΛ . (C.5)
A continuación nos valdremos de la ecuación (C.5) para escribir la energía ciné-
tica de los sistemas que son citados en este trabajo.
C.1. El péndulo con disco.
Consideremos el sistema que denominamos péndulo con disco y que se muestra
en la figura A.1. Esta cadena cinemática está constituida por dos cuerpos rígidos
articulados entre sí y vínculados al bastidor2 (representado por el rayado diagonal
en la figura).
De la ecuación (C.2) se deduce, inmediatamente (ver, por ejemplo, [7]) que TO =Tb
O + TdO, donde TO es la energía cinética total, Tb
O es la de la barra y TdO es la del
disco.
Aplicando la ecuación (C.5) a la barra –de masa mb y momento de inercia bari-
céntrico Ib (ver figura A.1)–, identificando O′ de la ecuación(C.5) con el centro de
masa de la barra, obtenemos
TbO =
12
mb(θc
)2 +12
Ibθ2 , (C.6)
donde IΛ = 0 ya que rCMr = 0 –debido a que CM ≡ O′–. Por otra parte, si aplicamos
la ecuación (C.5) al disco de inercia –de masa md y momento de inercia baricéntrico
Id ≡ IbO′ (ver figura A.1)–, obtenemos
TdO =
12
md(θ`
)2 +12
IdO′
(θ + ψ
)2 , (C.7)
2El bastidor constituye el tercer elemento de la cadena cinemática y actúa como marco de referen-
cia inercial. Dada la vinculación entre la barra y el bastidor, se deduce, y es importante destacar, que
O pertenece a ambos.
66
C. LAGRANGIANOS DE SISTEMAS ARTICULADOS El péndulo con carro.
donde ahora consideramos coincidentes al punto O′ y el centro de masas del disco.
Aquí, al igual que en la ecuación anterior, IΛ = 0 dado que CM ≡ O′ ⇒ rCMr = 0.
La energía cinética total del sistema completo la obtenemos, como ya vimos, su-
mando TbO y Td
O –dadas por las ecuaciones (C.6) y (C.7) respectivamente–. Así calcu-
lamos,
TO = TbO + Td
O =12
Ieqθ2 +12
IdO′
(θ + ψ
)2 , (C.8)
donde hemos definido, un momento de inercia equivalente (respecto de O′)
Ieq = mbc2 + md`2 + Ib
CM .
Por otro lado, la energía potencial V del sistema completo, podemos escribirla
V = Mg (1 + cosθ) ,
donde hemos definido
M = mbc + md` .
Finalmente el lagrangiano para el péndulo con disco (aplicando la ecuación C.1)
resulta
L =12
Ieqθ2 +12
IdO′
(θ + ψ
)2 −Mg (1 + cosθ) . (C.9)
C.2. El péndulo con carro.
Este sitema constituye el otro ejemplo recurrente a lo largo de este trabajo. Se
trata de un péndulo –de masa m y momento de inercia IO′ respecto del eje de ro-
tación3– montado sobre un carro capaz de desplazarse horizontalmente (ver figura
B.1). Para aplicar la ecuación (C.5) a este modelo, debemos considerar al punto O
fijo al bastidor –indicado por el rayado diagonal en la figura B.1, mientras que el
punto O′ se mueve con el carro y pertenece tanto al carro como al péndulo. En el
modelo estudiado, por simplicidad, se consideró nula4 la masa del carro, por lo tan-
3Dado el momento de inercia ICM respecto del centro de masas, el correspondiente a un eje para-
lelo por O′ es IO′ = IO + m(`/2)2, donde `/2 es la distancia entre O y O′4 Puede generalizarse facilmente las ecuaciones de movimiento, resultantes de las ecuaciones de
Euler-Lagrange, teniendo en cuenta la masa del carro, incluyendola en un término extra en la fuerza
horizontal sobre el carro. De esta manera redefinimos la fuerza horizontal Fx = F′x + mc x, donde mc
es la masa del carro, F′x es la fuerza horizontal en el modelo de mc = 0 y Fx es la fuerza horizontal en
el modelo con mc 6= 0.
67
C. LAGRANGIANOS DE SISTEMAS ARTICULADOS El péndulo con carro.
to la energía cinética total se deberá unicamente al movimiento del péndulo. Así, al
aplicar la ecuación (C.5), la energía cinética resulta
TO =12
mx2 +12
IO′ − xθm`
2cosθ , (C.10)
ya que IΛ = m(`/2)cosθ, pues rCMr = `/2.
Por otro lado, la energía potencial V podemos escribirla
V = mg`
2cosθ .
Finalmente el lagrangiano para el péndulo con carro (aplicando la ecuación C.1)
resulta
L =12
mx2 +12
IO′ − xθm`
2cosθ−mg
`
2cosθ . (C.11)
68
Apéndice D
Sistemas subactuados
D.1. Definición
Definimos sistemas subactuados a aquellos que verifican
dim(F ) < dim(Q) ,
con F =< f > –espacio generado por las fuerzas de vínculo–
donde f = ⊕i fi representa las fuerzas generalizadas actuantes sobre el sistema1 y Q
es el espacio de configuraciones del sistema2 (ver [7]).
D.2. Deducción de las ecuaciones de Euler-Lagrange pa-
ra sistemas no holónomos a partir del principio de
Hamilton.
Consideremos el sistema No Holónomo Generalizado subactuado de lagrangiano
L y con n coordenadas generalizadas. Aplicando el principio de Hamilton se tiene
δ
∫ t1
t0
L (q(t), q(t)) dt = 0
sii q(t) es una trayectoria del sistema, al realizar variaciones a extremos fijos.
1Notemos que f(q, q) ⊆ TQ es una distribución –un subespacio asociado a cada punto (q, q)–.2Por ejemplo para un sistema con dos coordenadas generalizas independientes q1 y q2, Q =<
(q1, q2) >⇒ dim(Q) = 2
69
D. SISTEMAS SUBACTUADOS Deducción de las ecuaciones de E −L
A partir de la ecuación anterior, derivando según la regla de la cadena e inte-
grando por partes (ver [7]), obtenemos∫ t1
t0
[ddt
(∂
∂q j L
)− ∂
∂q j L
]δqi dt = 0 (D.1)
con 1 ≤ j ≤ n.
Como se muestra en [4] estos sistemas cumplen con el principio de los trabajos
virtuales generalizado a los desplazamientos δqi (no ∆qi), que podemos escribir
fi δqi = 0 .
–Notemos que las fuerzas de vínculo sí realizan trabajo en desplazamientos infini-
tesimales del sistema ∆q–. Luego, reescribimos (sin perder generalidad) la ecuación
anterior de la forma ∫ t1
t0
fi δqi dt = 0 . (D.2)
Combinando las ecuaciones (D.1) y (D.2)∫ t1
t0
[ddt
(∂
∂q j L
)− ∂
∂q j L − fi
]δqi dt = 0 (D.3)
Así, aplicando el lema fundamental del cálculo variacional (ver [7]), resulta
ddt
(∂
∂q j L
)− ∂
∂q j L = fi , (D.4)
que son justamente las ecuaciones de Euler-Lagrange del sistema.
–Escribiendo de esta forma las ecuaciones, la información acerca del vínculo va-
riacional (Cv) la incluiremos en el término fi, lo cual resultará más cómodo al tratar
con servomecanismos–.
De esta manera, a partir de los principios de Hamilton y de los trabajos virtua-
les –en su versión generalizada– dedujimos las ecuaciones de Euler-Lagrange sólo a
partir del lagrangiano L del sistema. Es decir, al igual que en los casos d’alambertianos,
podemos considerar la dinámica del sistema contenida en L , si aceptamos el cum-
plimiento de algunos principios fundamentales.
Entonces ahora, podemos redefinir los sistemas no holónomos generalizados –
que definimos en §1.3– como aquellos dados por la terna (L , Ck, Cv) para los cuales
vale el principio de Hamilton y el principio generalizado de los trabajos virtuales.3
3Ya que en tal caso podremos deducir las ecuaciones de Euler-Legrange siguiendo el procedi-
miento aquí mostrado y arribar al sistema que define los sistemas no holónomos generalizados en
§1.3.
70
Apéndice E
Reparametrización del péndulo con
disco.
En §3.1.2 recurrimos a un cambio de coordenadas en el espacio de parámetros
adimensionales para el sistema del péndulo con disco de inercia. Gracias a esta
nueva descripción conseguimos simplificar notoriamente las zonas de estabilidad
–como discutimos en §3.1.2–.
Sin embargo, notemos que las ecuaciones (3.18) y (3.19) que definen ∆ y ε no son
combinaciones lineales de a, I y Γ y por lo tanto la validez de los parámetros ε y ∆
no es trivial y merece ser analizada con un poco de detenimiento.
Consideremos las funciones de reparametrización f1 = (∆,ε, I, τ) y f2 = (Γ , a, I, τ)dadas por
f1 :
ε =1
I (1− a−1) + 1
∆ =12· Γ
a(
1 + I−1)− 1
y
f2 :
Γ =2∆
ε(
I + 1)− 1
a =ε I
ε(
I + 1)− 1
Donde, tanto para f1 como para f2, I y τ permanecen invariantes (es decir la trasfor-
71
E. REPARAMETRIZACIÓN DEL PÉNDULO CON DISCO.
mación para estos parámetros es la identidad). Notemos que ∆ yε están definidas de
la misma forma que en las ecuaciones (3.18) y (3.19), siendo f1 la reparametrización
usada en §3.1.2 y f2 la función que nos permite volver a los parámetros originales.
Dados los puntos singulares de las funciones f1 y f2, definimos los dominios
D1 : formado por los puntos (Γ , a, I, τ), tales que
I 6= 0 , (E.1)
a 6= 0 y (E.2)
a(
1 +1
I
)6= 1 . (E.3)
y D2 : formado por los puntos (ε, ∆, I, τ), tales que1
I 6= 0 y
ε(
I + 1)6= 1 . (E.4)
De manera que
f1 : D1 → R4 ,
f2 : D2 → R4 .
Para que realmente los dos conjuntos de parámetros sea equivates2 debe cumplirse:
Im( f1) ⊆ D2 , (E.5)
Im( f2) ⊆ D1 , (E.6)
f1 f2 = ID2 (E.7)
1Las condiones que se dan aquí son suficientes para la no divergencia de las ecuaciones (3.18) y
(3.19), esto se vé más claramente para (3.19) reescribiendo 2∆ = IΓ/a[ I(1− a−1) + 1]−1.2Los parámetros son equivalentes si permiten representar los mismos puntos.
72
E. REPARAMETRIZACIÓN DEL PÉNDULO CON DISCO.
f1 f2 = ID2 (E.8)
Comencemos por verificar la condición (E.5), y analicemos Im( f1). Las ecuaciones
(E.1) y (E.2) se cumplen por hipótesis, resta entonces considerar (E.3) la cual, al apli-
car f2, resulta
a(
1 +1
I
)=
ε(
I + 1)
ε(
I + 1)− 16= 1 ⇒ ε
(I + 1
)6= ε
(I + 1
)− 1 , (E.9)
lo cual es cierto para todo ε, I ∈ D2, cumpliendo así la condición (E.5).
Para demostrar el cumplimiento de (E.6), reescribamos la ecuación (E.4) median-
te la transformación f1, así obtenemos
ε(
I + 1)
=I + 1
I + 1− I/a6= 1 ⇒ I
a6= 0 ⇒ I 6= 0 (E.10)
lo cual se verifica para todo a, I ∈ D1 –gracias a las ecuaciones (E.1) y (E.2)–, cum-
pliendose de esta manera la condición (E.5).
Analicemos ahora la condición (E.7),
f1 f2 =
ε =1
I(
1− [ε( I + 1)− 1]/(ε I))
+ 1=
1
I − I − 1 +ε−1 + 1= ε
∆ =12
2∆
ε I(1 + I−1)−ε( I + 1) + 1=
∆
ε I +ε−ε I −ε + 1= ∆
que es lo que buscabamos.
De igual manera verifiquemos la condición (E.8)
f2 f1 =
a =ε I
ε( I + 1)− 1=
1
1 + I−1 − (ε I−1)=
1
1 + I−1(1− I + I/a− 1)= a
Γ =2∆( I − I/a + 1)
I/a= 2∆
[a(
1 + I−1)− 1
]= Γ
encontrandose así el resultado esperado.
De esta forma, habiendo demostrado las condiciones (E.5), (E.6), (E.7) y (E.8)
podemos asegurar que los parámetros adimensionales ∆, ε son una adecuada des-
cripción del espacio de parámetros.
(Γ , a, I, τ)←→ (∆,ε, I, τ) (E.11)
73
Apéndice F
Códigos de cálculo
En este Apéndice mostramos algunos ejemplos de los cödigos de cálculo más
relevantes que se utilizaron en el trabajo.
F.1. Cálculo de las zonas de estabilidadPara resolver algunos polinomios característicos que surgieron a lo largo del tra-
bajo resultó necesaria la resolución de polinomios de tercer grado. Para esto, se si-guió el procedimiento que R. Bombelli ideó a partir del trabajo de S. dal Ferro y N.Tartaglia publicado en Ars Magna por G. Cardano en 1545 (ver [17]). Esta soluciónque denominamos B-F-T-C nos permite obtener valores exactos para las raices rea-les i complejas del polinómio. Sin embargo, dadas las inecuaciones que definen laszonas de estabilidad se optó por la resolución numerica de forma tal de poder ca-racterizar estas zonas evaluando estas soluciones para diferentes parámetros puntoa punto. A continuación presentamos el código más relevante que se formuló a talesfines, se trata justamente de la implementación del procedimiento de B-F-T-C:// se resue lve l a ecuacion cubica : x ^ 3 + a x ^ 2 + bx + c = 0//se sigue e l metodo de Cardano# include < s t d i o . h># include < s t d l i b . h># include <math . h>
s t r u c t complejo
double rea l , // parte r e a limag ; // parte imaginaria
;
void c2p ( s t r u c t complejo∗ x ) ;void p2c ( s t r u c t complejo∗ x ) ;void omega ( double p , double q , s t r u c t complejo x [ 2 ] ) ;void ca lc_u ( s t r u c t complejo w[ 2 ] , s t r u c t complejo x [ 6 ] ) ;void inversa ( s t r u c t complejo∗ x , s t r u c t complejo∗ r ) ;void potencia ( s t r u c t complejo∗ x , i n t exp , s t r u c t complejo∗ r ) ;void root_p3 ( s t r u c t complejo x [ 6 ] , double coef [ 3 ] ) ;
main ( )
74
F. CÓDIGOS DE CÁLCULO Cálculo de las zonas de estabilidad
i n t i ;s t r u c t complejo x [ 6 ] ,
e r r o r [ 6 ] , cubo , cuadrado ;double pi=4∗atan ( 1 ) , c o e f i c i e n t e s [ 3 ] ;
// c o e f i c i e n t e s [0 ]= a , coef . [ 1 ] = b , . . .c o e f i c i e n t e s [0]=−1;c o e f i c i e n t e s [ 1 ] = 2 0 ;c o e f i c i e n t e s [ 2 ] = 0 . 3 ;root_p3 ( x , c o e f i c i e n t e s ) ;// V e r i f i c a c i o n :f o r ( i = 0 ; i < 6 ; i ++)potencia (&x [ i ] ,2 ,& cuadrado ) ;potencia (&x [ i ] ,3 ,& cubo ) ;e r r o r [ i ] . r e a l = cubo . r e a l + c o e f i c i e n t e s [0 ]∗ cuadrado . r e a l + c o e f i c i e n t e s [1 ]∗ x [ i ] . r e a l + c o e f i c i e n t e s [ 2 ] ;e r r o r [ i ] . imag=cubo . imag+ c o e f i c i e n t e s [0 ]∗ cuadrado . imag+ c o e f i c i e n t e s [1 ]∗ x [ i ] . imag ;p r i n t f ( " e r r[ %d ] : ( % f , % f )\n " , i , e r r o r [ i ] . rea l , e r r o r [ i ] . imag ) ;
void c2p ( s t r u c t complejo∗ x ) /∗pasar l a d i r e c c i o n de mem. apuntada por x [ i ]∗/
//se guarda e l modulo en l a parte r e a l y e l arg en l a imaginariadouble mod , ang ;mod= s q r t (pow( x−>rea l , 2 ) +pow( x−>imag , 2 ) ) ;ang=atan2 ( x−>imag , x−>r e a l ) ;// p r i n t f ( " modulo: %f \n angulo : % f pi\n " ,mod, ang ) ;x−>r e a l =mod;x−>imag=ang ;
void p2c ( s t r u c t complejo∗ x ) /∗pasar l a d i r e c c i o n de mem. apuntada por x [ i ]∗/
//presupone e l modulo en l a parte r e a l y e l arg en l a imaginariadouble re , im ;re=x−>r e a l∗cos ( x−>imag ) ;im=x−>r e a l∗s i n ( x−>imag ) ;x−>r e a l =re ;x−>imag=im ;
void omega ( double p , double q , s t r u c t complejo x [ 2 ] )
double d e l t a ;d e l t a =pow( q , 2 ) / 4 . 0 +pow( p , 3 ) / 2 7 . 0 ;i f ( del ta >0)
x [ 0 ] . r e a l =q/2.0+ s q r t ( d e l t a ) ;x [ 1 ] . r e a l =q/2.0− s q r t ( d e l t a ) ;x [ 0 ] . imag = 0 . 0 ;x [ 1 ] . imag = 0 . 0 ;
i f ( del ta <0)
p r i n t f ( " d e l t a= %f \n " , d e l t a ) ;d e l t a =pow( q , 2 ) / 4 . 0 +pow(−p , 3 ) / 2 7 . 0 ;x [ 0 ] . r e a l =q / 2 . 0 ;x [ 1 ] . r e a l =x [ 0 ] . r e a l ;x [ 0 ] . imag= s q r t ( d e l t a ) ;x [ 1 ] . imag=−x [ 0 ] . imag ;
i f ( d e l t a ==0)
x [ 0 ] . r e a l =q / 2 . 0 ;x [ 1 ] . r e a l =x [ 0 ] . r e a l ;x [ 0 ] . imag = 0 . 0 ;x [ 1 ] . imag = 0 . 0 ;
75
F. CÓDIGOS DE CÁLCULO Cálculo de las zonas de estabilidad
void calc_u ( s t r u c t complejo w[ 2 ] , s t r u c t complejo x [ 6 ] )
i n t i , j ;double mod;double pi=4∗atan ( 1 ) ;f o r ( i = 0 ; i < 2 ; i ++)
c2p(&w[ i ] ) ; /∗di r . de mem apuntada por w∗/p r i n t f ( "w modulo: %f \n angulo : % f \n " ,w[ i ] . rea l , w[ i ] . imag ) ;mod=pow(w[ i ] . rea l , 1 . 0 / 3 ) ;f o r ( j = 0 ; j < 3 ; j ++)
x [ j + i ∗3 ] . r e a l =mod;x [ j + i ∗3 ] . imag=w[ i ] . imag/3.0+ j ∗2/3.0∗pi ;
i f ( x [ j ] . imag>2∗pi ) x [ j ] . imag−=2∗pi ;
void inversa ( s t r u c t complejo∗x , s t r u c t complejo∗r )
// l a entrada debe e s t a r en CARTESIANA y l a s a l i d a es en CARTESIANAc2p ( x ) ;r−>r e a l =1.0/x−>r e a l ; /∗ modulo del resu l tado∗/r−>imag=−x−>imag ; /∗ angulo del resu l tado∗/p2c ( x ) ;p2c ( r ) ;
void potencia ( s t r u c t complejo∗ x , i n t exp , s t r u c t complejo∗ r )
// l a entrada debe e s t a r en CARTESIANA y l a s a l i d a es en CARTESIANAc2p ( x ) ;r−>r e a l =pow( x−>rea l , exp ) ; /∗ modulo del resu l tado∗/r−>imag=exp∗x−>imag ; /∗ angulo del resu l tado∗/p2c ( x ) ;p2c ( r ) ;
void root_p3 ( s t r u c t complejo x [ 6 ] , double coef [ 3 ] )
i n t i ;double p , q ,
a , b , c ;s t r u c t complejo inv , w[ 2 ] , u [ 6 ] ;
p r i n t f ( " coef 0 % f " , coef [ 0 ] ) ;a=coef [ 0 ] ;b=coef [ 1 ] ;c=coef [ 2 ] ;p=b−pow( a , 2 ) / 3 . 0 ;q=c +(2∗pow( a ,3)−9∗a∗b ) / 2 7 . 0 ;omega ( p , q , w) ;p r i n t f ( " w1: ( % f %f )\n w2: ( % f %f )\n " ,w[ 0 ] . rea l ,w[ 0 ] . imag ,w[ 1 ] . rea l ,w[ 1 ] . imag ) ;ca lc_u (w, u ) ;p r i n t f ( " RAICES\n " ) ;f o r ( i = 0 ; i < 6 ; i ++)
p2c(&u [ i ] ) ;// p r i n t f ( " u[ %d ] : % f %f \n " , i , u [ i ] . rea l , u [ i ] . imag ) ;
inversa (&u [ i ] ,& inv ) ;x [ i ] . r e a l =p/3.0∗ inv . rea l−u [ i ] . rea l−a / 3 . 0 ;x [ i ] . imag=p/3.0∗ inv . imag−u [ i ] . imag ;p r i n t f ( " x[ %d ] : % f %f \n " , i , x [ i ] . rea l , x [ i ] . imag ) ;
76
F. CÓDIGOS DE CÁLCULO Cálculo de las zonas de estabilidad
A modo de ejemplo, a continuación mostramos el código de cálculo usado paradeterminar una de las zonas de estabilidad que se tratan en el cuerpo principal deltrabajo. En particular atenderemos al caso del control global con foco en O para elpéndulo con carro ya que para este caso el programa resulta de reducido tamaño.La salida de este código se puede ver en la Figura 3.12//se e s c r i b e un archivo parametros . dat con t r e s columnas alpha , c , Gamma coord . de l o s//puntos para l o s cua les e l s is tema t i e n e focos e s t a b l e s en l a pos ic ion v e r t i c a l//e i n e s t a b l e en l a i n f e r i o r# inc lude < s t d i o . h># include < s t d l i b . h># include <math . h>
# def ine N 3# def ine I 1 . 0 /∗ I ( param . adim . del s is tema )∗/# def ine X_MAX 3 . 0 /∗a∗ l /2∗/# def ine Y_MAX 5 . 0 /∗c∗/# def ine Z_MAX 1 0 . 0 /∗Gamma= gamma ∗ TAU ∗/# def ine X_MIN −6.0# def ine Y_MIN −5.0# def ine Z_MIN −1.0# def ine CANT_PTOS 1 E6 /∗cantidad de puntos del g r a f i c o∗/
void gra f ( double ∗x ) ;FILE ∗ out ;
i n t main ( )
i n t i , j , k ;double A, B , j0 , j p i , a , c , gamma , x [N] , rango [N] ;
rango [ 0 ] = (X_MAX−X_MIN ) ;rango [ 1 ] = (Y_MAX−Y_MIN ) ;rango [ 2 ] = (Z_MAX−Z_MIN ) ;srand ( time (NULL ) ) ;
f o r ( i = 0 ; i <CANT_PTOS ; i ++)
x [ 0 ] = rand ( ) ;x [ 0 ] = x [ 0 ] /RAND_MAX∗rango [0 ] +X_MIN ;x [ 1 ] = rand ( ) ;x [ 1 ] = x [ 1 ] /RAND_MAX∗rango [1 ] +Y_MIN ;x [ 2 ] = rand ( ) ;x [ 2 ] = x [ 2 ] /RAND_MAX∗rango [2 ] +Z_MIN ;
a=x [ 0 ] ; c=x [ 1 ] ; gamma=x [ 2 ] ;
A= gamma∗( I−c )/ a ;B= gamma∗( I +c )/ a ;j 0 = 1.0− c/a+ I /a−c ;j p i = 1.0− c/a−I /a+c ;
i f ( fabs (1.0− c/a ) > fabs ( I /a−c ) ) /∗condicion de no divergenc ia∗/
i f ( ( A/ j 0 < 0 . 0 ) & & ( (A/2./ j 0 )∗ (A/2./ j 0 )+1 ./ j 0 < 0 . 0 ) ) /∗ para tener un foco e s t a b l e super ior∗/
gra f ( x ) ;
re turn 0 ;
void gra f ( double ∗x )
out = fopen ( " foco_a_c_g . dat " , " a " ) ;//imprime y s a l e por cada paso de t por eso append , en caso de que por alguna eventual idad se interrumpa l a e j e c u c i o n//no se pierden l o s datos ca lcu lados
77
F. CÓDIGOS DE CÁLCULO Resolución numérica de la dinámica
f p r i n t f ( out ," % l f % l f % l f \n " , x [ 0 ] , x [ 1 ] , x [ 2 ] ) ;f c l o s e ( out ) ;
F.2. Resolución numérica de la dinámica
En esta sección mostramos otro de los códigos de cálculo típicos realizados pa-
ra este trabajo, en este caso detallamos un de los encargados de resolver las órbitas
del sistema. Este programa calcula la evolución de un conjunto de condiciones ini-
ciales ordenadas sobre un rectángulo en el espacio de fases. A este rectángulo lo
llamaremos marco del retrato de fases aunque puede o no coincidir con los limites
que elegimos para mostrar en las figuras. Las salidas consisten en una serie de ar-
chivos (tantos como condiciones iniciales se hayan elegido) conformados por tantas
columnas como variables tenga el sistema de ecuaciones autónomas al que se redujo
la dinámica. El método de cálculo utilizado es el de Runge-Kutta 4. Aquí mostramos
un ejemplo de este tipo de código para la resolución de uno de los casos que se des-
criben en este trabajo. En particular, se trata del caso del control global del péndulo
con disco mediante el vínculo dado por la ecuación (3.1), que en definitiva resulta
en el sistema
d2θ
dt2+ I
(d2θ
dt2+
d2ψ
dt2
)− senθ = fθ
I(
d2θ
dt2+
d2ψ
dt2
)= fψ
A continuación presentamos el código de cálculo de este sistema:// e s t e programa t i e n e por s a l i d a l o s r e t r a t o s de f a s e s del pendulo i n v e r t i d o//qo , wo toman l o s va lores del marco del r e t r a t o
# include < s t d i o . h># include < s t d l i b . h># include <math . h># def ine N 2 /∗dimensiones del r e t r a t o∗/# def ine t f 0 . 5 0# def ine t i 0 . 0# def ine DTA 0 . 0 1 /∗paso de tiempo adimensional∗/# def ine cota 1 E−10# def ine CI 4 /∗cantidad de condic iones i n i c i a l e s sobre cada e j e∗/# def ine WCOTA 1 E6# def ine Qmin 4 /∗ ñTamao del r e t r a t o∗/# def ine Qmax 3 . 6# def ine Wmin −0.3# def ine Wmax −0.9
void Func ( double ∗x ) ;void gra f ( double t , double ∗x ) ;void RK4( double x [ ] , void (∗ F ) ( ) ) ;double J ( double del ta , double E , double q , double w) ;
78
F. CÓDIGOS DE CÁLCULO Resolución numérica de la dinámica
void curva ( double x [ ] , void (∗RK4 ) ( ) , void (∗ Func ) ( ) ) ;//x [ 0 ] = velocidad angular (w)//x [ 1 ] = angulo ( t i t a )FILE ∗ out ;char nombre1 [ 1 5 ] ;double dta ;
i n t main ( )
i n t i , v e r t i c e ;double x [N] , paso_q , paso_w ;i f ( CI==0)
x [ 0 ] =Wmax;x [ 1 ] =Qmax;s p r i n t f ( nombre1 , " disc_ad_esp %d . dat " , 0 ) ;curva ( x , RK4 , Func ) ;
e l s epaso_q =(Qmax−Qmin)/ CI ;paso_w=(Wmax−Wmin)/ CI ;f o r ( i = 0 ; i <4∗CI ; i ++)
v e r t i c e = i /CI ;switch ( v e r t i c e )case 0 :
x [0 ] =Wmax;x [1 ] =Qmin+ i∗paso_q ;break ;
case 1 :x [0 ] =Wmax−( i−CI )∗paso_w ;x [1 ] =Qmax;break ;
case 2 :x [0 ] =Wmin;x [1 ] =Qmax−( i−2∗CI )∗paso_q ;break ;
case 3 :x [0 ] =Wmin+( i−3∗CI )∗paso_w ;x [1 ] =Qmin ;break ;
s p r i n t f ( nombre1 , " disc_adim %d . dat " , i ) ;curva ( x , RK4 , Func ) ;
void curva ( double x [ ] , void (∗metodo ) ( ) , void (∗ pendiente ) ( ) )
i n t i , j ,MAX;double ant [N] , Dq , Dw, t =0;MAX= 100∗ ( t f−t i )/DTA;Dw=cota +1;Dq=Dw;f o r ( i = 0 ; ( i <MAX)&&((Dq>cota )||(Dw>cota ))&&( fabs ( x [ 0 ] ) <WCOTA) ; i ++)/∗parada s i ( q ,w) − > a pto . f i j o , w > WCOTA∗/
dta=DTA∗exp(− fabs ( x [0]/8.0)− fabs ( s i n ( x [ 1 ] ) ) ) ; /∗paso v a r i a b l e para mejor dens de ptos en q ,w∗/graf ( t , x ) ;t +=dta ;f o r ( j = 0 ; j <N; j ++)
ant [ j ]= x [ j ] ;metodo ( x , pendiente ) ;Dw=fabs ( ant [0]−x [ 0 ] ) ;Dq=fabs ( ant [1]−x [ 1 ] ) ;
79
F. CÓDIGOS DE CÁLCULO Resolución numérica de la dinámica
void RK4( double x [ ] , void (∗ F ) ( ) )
double k1 [N] , k2 [N] , k3 [N] , k4 [N] ;i n t i ;f o r ( i = 0 ; i <N; i ++)
k1 [ i ]= x [ i ] ;F ( k1 ) ;f o r ( i = 0 ; i <N; i ++)
k1 [ i ]∗= dta ;k2 [ i ]= x [ i ]+ k1 [ i ] / 2 ;
F ( k2 ) ;f o r ( i = 0 ; i <N; i ++)
k2 [ i ]∗= dta ;k3 [ i ]= x [ i ]+ k2 [ i ] / 2 ;
F ( k3 ) ;f o r ( i = 0 ; i <N; i ++)
k3 [ i ]∗= dta ;k4 [ i ]= x [ i ]+ k3 [ i ] ;
F ( k4 ) ;f o r ( i = 0 ; i <N; i ++)
k4 [ i ]∗= dta ;x [ i ]+=( k1 [ i ]+2 .∗k2 [ i ]+2 .∗k3 [ i ]+ k4 [ i ] ) / 6 . ;
void gra f ( double t , double ∗x )
out = fopen ( nombre1 , " a " ) ;/∗imprime y s a l e por cada paso de t por eso append en caso de i n t e r r u p c i o n no se pierden l o s c a l c u l o s∗/
f p r i n t f ( out ," % l f % l f \n " , x [ 1 ] , x [ 0 ] ) ; /∗ q ,w∗/f c l o s e ( out ) ;
void Func ( double ∗x )
double F [N] ,w, q ,del ta , E ;
i n t i ;
w=x [ 0 ] ;q=x [ 1 ] ;
d e l t a = 2 . 0 0 ;E= −1.0;
F [ 0 ] = J ( del ta , E , q ,w) ;F [ 1 ] = w;
f o r ( i = 0 ; i <N; i ++)x [ i ]=F [ i ] ;
double J ( double del ta , double E , double q , double w)
re turn (−2.0∗ d e l t a∗cos ( q)∗w + E∗s i n ( q ) ) ;
80
Apéndice G
Evaluación económica.
G.1. Distribución de Tareas
Las tares realizadas durante este proyecto integrador pueden ser divididas según
se muestra en la Figura G.1.
(IWGVMTGMzR8EVIE
)WXYHMSHIGSRGITXSWFjWMGSW
0IGXYVEHITYFPMGEGMRIWVIPEGMSREHEWGSRIPXIQEHIPTVS]IGXS
%RjPMWMWMRXIKVEPHIPTVSFPIQEHIGSRXVSP]VIWSPYGMzREREPuXMGEHIWMWXIQEWRSLSPzRSQSWKIRIVEPM^EHSW
4VSKVEQEGMzR]GEPGYPSRYQqVMGSHIPEW^SREWHIIWXEFMPMHEH]PEWzVFMXEWHIPWMWXIQE
)WGVMXYVEHIVIWYPXEHSW]TVIWIRXEGMzR
Figura G.1: Descripción de tareas.
Por otra parte, el tiempo empleado en cada una se muestra en el diagrama de
Gantt aproximado de la Figura G.2.
8EVIE@1IW
Figura G.2: Diagrama de Gantt del proyecto.
81
G. EVALUACIÓN ECONÓMICA. Estimación de Costos
G.2. Estimación de Costos
Para la realización de este proyecto fueron necesarias aproximadamente 16 horas
de consulta mensuales a los directores, estimando un costo de $20 por hora por cada
uno, resulta un costo mensual de $640. Además se utilizó una PC durante todo el
proyecto, asumiendo un costo aproximado de $ 2000 y un período de amortización
de 10 años, y un factor de uso del % 50, resulta un costo mensual de $8.3 . En esta
evaluación no se consideran los gastos de mantenimiento, beca, infraestructura ni
servicios. Resulta entonces un gasto mensual c = $648, 3
Adoptando una tas descuento anual ianual del 12 %, resulta una tasa mensual
imensual del 0.95 % dada por
(1 + ianual) = (1 + imensual)12 .
Luego el costo del proyecto al día de su inicio resulta
C = cn=N
∑n=1
(1 + i)n ,
donde N = 10. Obtenemos así un costo inicial C = $6831, 58 al mes de agosto.
Sumando el costo de oficina que se utilizó durante el último mes que estimamos de
$ 500, teniendo en cuenta la misma tasa de descuento, resulta un costo total
C = $7381, 16 (G.1)
al 08/2005.
82
Referencias
[1] D. M. Alonso, E. E. Paolini, J. L. Moiola, Global Bifurcation Analysis of a Controlled
Underactuated Mechanical System, Nonlineart Dynamics, 40: 205-225, 2005
[2] A. Bloch, N. Leonard, J. Marsden, Controlled Lagrangians and Stabilization of Me-
chanical Systems I: The first Matching Theorem, IEEE Transactions on Automatic
Control, Vol. 45, 12, 2253-2270, 2000.
[3] A. Bloch, D. Chang, N. Leonard, J. Marsden, Controlled Lagrangians and Stabiliza-
tion of Mechanical Systems II: Potencial Shapping, IEEE Transactions on Automatic
Control, Vol. 46, 10, 1556-1571, 2001.
[4] H. Cendra, S. Grillo, Generalized Nonholonomic Mechanics, Servomechanisms and
Related Brackets J. Math. Phys. 47, 1-29, 2006.
[5] H. Cendra, A. Ibort, M. de León, D. M. de Diego, A generalization of Chetaev’s
principle for a class of higher order nonholonomic constraints, J. Math. Phys. 45 (7),
2785-2801, 2004.
[6] G. F. Franklin, D. J. Powell, A. Emami-Naeini, Feedback Control of Dynamic Sys-
tems, (5th ed.), Prentic Hall PTR, Upper Saddle River, New Jersey, 2005.
[7] H. Goldstein, Classical Mechanics, Second Edition, Addison-Wesley, Reading,
Massachusetts, 1980.
[8] S. Grillo, F. Maciel, D. Pérez, Closed-loop Systems and Generalized Nonholonomic
Mechanics. En preparación.
[9] Y. Rocard, Dynamique Générale des Vibrations, Masson et Cie Éditeurs, Chap. XV,
p. 246, Paris, 1949.
83
REFERENCIAS
[10] Y. Rocard, L’instabilité en mécanique; automobiles, avions, ponts suspendus, Masson,
Paris, 1954.
[11] J. K. Hendrick, H. M. Paynter, Nonlinear System Analysis and Synthesis: vol. 1
–Fundamental Principles, The American Society of Mechanical Engineers, New
York, diciembre, 1976.
[12] M. Nacahara, Geometry, Topology and Physics, Graduate Students Series in Phy-
sics, 1990.
[13] C.-M. Marle, Kinematic and Geometric Constraints, Servomechanism and Control of
Mechanical Systems, Geom. Struc. for Phys. Theories, II, Vol. 54, 4: 353-364, 1996.
[14] K. Ogata, Modern Control Engineering, 3er ed., Prentice Hall, Upper Saddle River,
New Jersey, 1997.
[15] A. Shiriaev, C. Canudas-de-Wit, Virtual Constraints a Constructive Tool for Orbital
Stabilization of Underactuated Nonlinear Systems,6th IFAC International Sympo-
sium on Nonlinear Control Systems, NOLCOS’04, Stuttgart, septiembre, 2004.
[16] A. Shiriaev, J. W. Perram, A.Robertsson, A. Sandberg, Explicit Formulae for Ge-
neral Integral of Motion for a Class of Mechanical Systems subjects to Virtual Cons-
traints, proc. IEEE Conf. Decision and Control (CDC’04), 1158-1163, diciembre,
2004.
[17] http://en.wikipedia.org/wiki/Cubic_equation
84
Agradecimientos
Antes de comenzar a agradecer a todas las personas que de una forma u otra hizo posible
la realización de este trabajo, me gustaría aclarar que este trabajo es en realidad el cierre de
un ciclo que comenzó hace tres años. Por lo tanto, antes de agradecer a todos aquellos que
influyeron directamente en este esrito, voy a empezar por los que siempre estubieron. Los
que me bancaron desde el principio, durante los tiempos más dificiles, cuando este momento
en que termino la carrera parecía extremadamente remoto. Los que supieron estar cuando
se los necesitaba, los que pusieron lo mejor de sí, los que me dieron todo.
A mis viejos (Fernando y Marta). A quienes no pienso agradecer por darme la vida, sino
por todo lo que vino después. Por su apoyo incondicional siempre y en especial en estos
tres últimos años. A mis hemanos (Dany, Matias y Fede), quienes siempre estuvieron y me
hicieron el aguante cuando los necesitaba. Por el contacto permanente por mail y en el chat
que resultaron una inyección anímica fundamental que siempre me mantuvo cerca de casa.
A mi familia, toda. A mis abuelas, que fueron una fuente de cariño costante. A mis tíos
que siempre estubieron al tanto de su sobrino del sur y lo ayudaron en todo. A mis primos,
que aunque no lo sepan, me simplificaron la vida enormemente. A los pibes, con los que
compartí estos últimos años y con los que nunca dejamos de ser uno sólo. Acá va mi muy
especial agradecimiento a Bruno, a Edu, a Gabriel, al Pela, a Rubén, a Tincho, a Tito y la
Vieja. Que aunque no todos son mecánicos supieron ganarse su lugar honoris causa.
A Paul, que estuvo siepre dispuesto a darme un techo para dormir en las interminables
noches de escritura. A mis correctores en este trabajo. A Bruno, Jeremy y Fernandito que
se animaron a leer versiones preliminares encontrando siempre algo que mejorar o algún
acento y aunque –a veces– no alcanzó el tiempo: vale la inteción. Tambien, al soporte técnico
–indispensable– en LATEXde Martín.
Finalmente a mis directores por los viernes de consulta, por el tiempo dedicado y la ex-
celente predisposición. Por la preocupación y dedicación, por el asesoramiento y por haber
sabido siempre marcar el rumbo del proyecto.
D .G .P .
85