Download pdf - PROYECTO INTEGRADOR DE LA CARRERA DE …ricabib.cab.cnea.gov.ar/69/1/1PerezD.pdf · proyecto integrador de la carrera de ingenierÍa mecÁnica sistemas no holÓnomos generalizados

PROYECTO INTEGRADOR DE LA

CARRERA DE INGENIERÍA MECÁNICA

SISTEMAS NO HOLÓNOMOS GENERALIZADOS Y SU

APLICACIÓN A LA TEORÍA DE CONTROL

AUTOMÁTICO MEDIANTE VÍNCULOS CINEMÁTICOS

Diego Gastón Pérez

Autor

Dr. Sergio Grillo

Co-Director

Ing. Félix Maciel

Co-Director

San Carlos de Bariloche

Junio 2006

Instituto Balseiro

UNIVERSIDAD NACIONAL DE CUYO

Comisión Nacional de Energía Atómica

– Argentina –

A mis viejos.

Resumen

En trabajos recientes [4, 13, 15, 16], se trata el control de sistemas subacutados

mediante la técnica de vínculos virtuales, dando lugar a una dinámica que puede

ser descripta a paritr de sistemas no holónomos generalizados. Este procedimiento

consiste en la imposición virtual de un vínculo cinemático sobre las coordenadas

generalizadas del sistema de forma de conseguir la estabilización puntos del siste-

ma naturalmente inestables. El objetivo central de este trabajo es resolver el control

cuasi-global de diferentes sistemas simples como son los péndulos invertidos con

carro y con disco de inercia. Así, presentaremos los vínculos que posibilitan esto,

las condiciones que fueron necesarias para su diseño y la señal de control que de-

be implementarse para el esquema de control a lazo cerrado. Alternativamente al

control cuasi-global, presentaremos diferentes vínculos que también permiten con-

trolar el sistema pero para un rango limitado de condiciones iniciales, a lo que de-

nominaremos control local. Finalmente, en forma accesoria, analizaremos algunas

condiciones bajo las cuales resulta factible la reproducción mediante vínculos vir-

tuales no holónomos de otras técnicas de control conocidas como son los métodos

energéticos [2, 3] y los convencionales [6, 14].

Palabras clave: Control Cuasi Global, Control Local, Sistemas No Holónomos

Generalizados, Sistemas Subactuados, Vínculos Virtuales.

III

Abstract

In recent works [4, 13, 15, 16], underactuated systems are dealt by means of vir-

tual constraints technics giving rise to dynamics wich can be described using gene-

ralized nonholonomic systems. This procedure consists of the imposition of a virtual

kinematic constraint on the genelalized coordinates in a way that stabilization of ot-

herwise unstable points of the system is acheived. The main objective of this work is

to solve the almost-global control for several siple systems such as the inverted pen-

dulum on a cart and the inertia wheel pendulum. Thus, we will show the constraints

which asure this, as well as the conditions necessary for their design and their ana-

log control signal for a closed loop system description. Alternatively to the almost-

global control strategy, we will introduce several other constraints that also allow

us to control the system but for a more restricted set of initial conditions, which will

be denominated local control. Finally, in an accessory form, we will analyze some

conditions under which results feasible the reproduction by means of nonholono-

mic virtual constraints control, of other well-known techniques of control such as

the energy shapping [2, 3] and the conventional methods [6, 14].

Keyword: Almost-Global Control, Generalized Nonholonomic Systems, Local

Control, Underactuated Systems, Virtual Constraints.

IV

Introducción

El estudio de los sistemas mecánicos con vínculos cinemáticos tiene sus origenes

a fines del siglo XIX (ver [13]), en particular los sistemas con vínculos no holónomos

fueron tratados en varios trabajos de fines de ese siglo y principios del siguiente [ver

trabajos de P. Appell (1911), H. Hertz (1881)], sin embargo su estudio sistemático se

vio luego interrumpido por un largo período de tiempo. Con la llegada de la me-

cánica cuántica y la relativista a principios del siglo XX el análisis formal de estos

sistemas fue relegado durante casi cincuenta años. Recién a fines del siglo pasado se

retoma su tratamiento sistemático, con aportes en este sentido de A. Bloch, H. Cen-

dra, A. Fufaev, M. de León, J. Marsden y C.-M. Marle, entre otros1, –encontrando

muchas veces en la geometría diferencial las herramientas necesarias para forma-

lizar su tratamiento–. Aparentemente, la descripción a través este formalismo de

sistemas controlados mediante servomecanismos, generó un renovado interés por los

sistemas no holónomos. Necesidades de la ingeniería de resolver estos casos que

pueden ser tratados mediante este formalismo –en aplicaciones de robótica y con-

trol automático en general–, son las que habrían despertado el interés actual por su

estudio. Trabajos recientes confirman esto último tratando de sistematizar el estudio

del control de sistemas no lineales mediante diferentes métodos. Algunas de estas

técnicas, cuyo estudio se extiende hasta el día de hoy, son los médotos energéticos

–por ejemplo [2] (2000) y [3] (2001)– y los métodos de control por vínculos virtuales

–[15] (2004) y [16] (2004)–. En particular, si bien ambos métodos son plausibles de

ser representados mediante el formalismo lagrangiano, esta última técnica de con-

trol es la que naturalmente conduce a sistemas no holónomnos generalizados. En este

marco, este proyecto integrador de ingeniería mecánica se enfoca, justamente, en el

estudio de este tipo de aplicaciones al control de sistemas mecánicos que podemos

1ver referencias en [3, 5, 13]

V

describir mediante la mecánica no holonoma generalizada, que se detalla en [5] y [4].

Cabe destacar que aquí no utilizaremos el formalismo de la geometría diferencial, a

excepción de algunos resultados y comentarios accesorios.

Al aplicar servomecanismos encontramos que estos permiten la implementación

sencilla de los vínculos no clásicos como los que se describen en [13], así mediante es-

tos vínculos no integrables en las velocidades nos proponemos estabilizar posiciones

del sistema naturalmente inestables. Sin embargo, los sitemas mecánicos resultantes

no cumplen con el principo de D’Alambert, uno de los puntos básicos del formalismo

de Lagrange (ver [4]). Así, las ecuaciones de movimiento no pueden ser deducidas

mediante el procedimiento lagrangiano usual, de forma que debemos ser cuidado-

sos en los pasos que realizaremos a tales fines. Trataremos así con sistemas para los

cuales las fuerzas de vínculo realizan trabajo, y donde los desplazamientos virtuales no

son necesariamente compatibles con los vínculos. No obstante, en [4] se presentan las

bases para resolver estos inconvenientes, de las cuales haremos uso en este trabajo.

Para esto será necesario ampliar la definición de vínculo que se tiene para sistemas

d’alambertianos donde los desplazamientos virtuales2 se desprenden de las ecua-

ciones de vínculo. Al tratar con sistemas no holónomos generalizados veremos que

resulta necesario considerar a los vínculos variacionales3 y cinemáticos como concep-

tos independientes y separados. Tambien, discutiremos el principio de los trabajos

virtuales generalizado (ver [4]) y su aplicación a los servomecanismos con el objeti-

vo de determinar los vínculos variacionales que consideraremos sobre el sistema.

Especificamente nos enfocaremos en la aplicación del método de control median-

te vínculos virtuales (como el que se describe[15]) sobre diferentes sistemas mecáni-

cos simples. Al igual que en [1, 2, 3, 13, 15, 16], entre muchos otros, recurriremos

a diferentes tipos de péndulos invertidos como ejemplos de estudio para sistemas

no lineales. –Este tipo de sistemas, aunque sencillos, dan lugar (en general) a ecua-

ciones diferenciales no integrables que deberemos resolver numericamente.– En este

sentido, nuestro objetivo principal es lograr estabilizar la posición superior (natural-

mente inestable) del péndulo invertido. Encontraremos así, vínculos que permitirán

tener un Control Cuasi-Global del sistema, como los que presentamos en el Capítulo

2Nos referimos a los desplazamientos virtuales que se realizan sobre el sistema en el principio de

Hamilton (ver[7]).3Seguiremos la definición de vínculo variacional que se dá en [5]

VI

3.

A continuación daremos un breve resumen de los contenidos de cada capítulo

en que se haya dividido este trabajo.

Capítulo 1:

Comenzaremos por definir los sistemas no holómos generalizados y los

rudimentos que necesitaremos para su estudio. Aquí presentaremos los

vínculos variacionales y su relación con las fuerzas de vínculo (o la ac-

ción de control en el formalismo de control a lazo cerrado). En este capí-

tulo motivaremos la aplicación de este formalismo mediante un ejemplo

sencillo como es el modelo de neumático de Rocad (ver [9]). Ejemplifica-

remos los procedimientos generales que seguiremos para la construcción

de las ecuaciones de movimiento y el cálculo de las fuerzas de vínculo

dentro de este formalismo.

Capítulo 2:

Luego, introduciremos el método de control mediante vínculos virtuales

que dará lugar sistemas no holónomos como los descriptos en el capí-

tulo anterior. En §2.2 presentaremos el comportamiento del péndulo con

carro ante la aplicación de diferentes vínculos cinemáticos, cuya imple-

mentación se reliza únicamente mediante una fuerza horizontal sobre el

carro. Encontraremos el valor al cual deben ajustarse los parámetros que

definen el vínculo de manera de estabilizar localmente la posición supe-

rior del péndulo.

Capítulo 3:

En este capítulo presentaremos varios vínculos variacionales y cinemá-

ticos, mediante los cuales es posible estabilizar la posición superior del

péndulo invertido, de forma que para cualquier condición inicial al azar

se tienda indefectiblemente a esta posición. A esta situación la llamare-

mos Control Cuasi-Global. Este es un capítulo central del trabajo, ya que

allí daremos, tanto para el sistema del péndulo con carro como para el

VII

del disco de inercia, un par de vínculos variacionales y cinemáticos me-

diante los cuales conseguiremos el control cuasi-global de los mismos.

Analizaremos las condiciones que se deben cumplir a fin de conseguir la

dinámica buscada, determinando así zonas de estabilidad para los pará-

metros. Finalmente daremos la expresión de la señal de control que debe

implementarse de acuerdo al formalismo de control a lazo cerrado.

Capítulo 4:

En este capítulo realizamos una comparación entre el método de control

mediante vínculos virtuales que proponemos en este trabajo y algunos

de los otros métodos conocidos.

En particular, en §4.1 contrastaremos los métodos lineales convenciona-

les en el espacio-estado4 con el método de control mediante vínculos vir-

tuales lineales. Por este camino encontraremos una serie de condiciones

suficientes para las cuales el sistema convencional puede ser reproducido

mediante un vínculo virtual lineal y mostraremos además, como cons-

truirlo.

Por otra parte, en §4.2 reproduciremos la dinámica de control lograda

mediante una técnica de control de desarrollo reciente como es la de la-

grangianos controlados que se propone en [2]. En este caso encontraremos

que, siempre que exista alguna variable cíclica5 en el sistema, este méto-

do puede ser reproducido mediante el control por vínculos virtuales. En

particular, mostraremos además cual es la familia de vínculos virtuales

mediante la cual se consigue el mismo control del sistema.

Capítulo 5:

En este capítulo, a modo de cierre, resumiremos las conclusiones más

relevantes que habremos obtenido en cada uno de los anteriores.

La distribución del trabajo se completa con una serie de apéndices con cálculos,

4Por espacio-estado entenderemos space state según se define en [14, 6].5Se dice que s es una variable cíclica si ∂L /∂s = 0, ver [7].

VIII

descripciones y discuciones complementarias que decidimos no colocar en el cuepo

principal a fin de no entorpecer la lectura.

IX

Índice general

Índice general X

Índice de Figuras XII

1. Sistemas No Holónomos 1

1.1. Sistemas estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2. Sistemas no d’alembertianos . . . . . . . . . . . . . . . . . . . . . . . . 2

1.3. Sistemas generalizados . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.4. Las ecuaciones de movimiento . . . . . . . . . . . . . . . . . . . . . . 6

1.5. Las fuerzas generalizadas . . . . . . . . . . . . . . . . . . . . . . . . . 8

2. Control mediante Vínculos Virtuales 10

2.1. Estrategias de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.2. Control local . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.2.1. Vínculo lineal a coeficientes constantes . . . . . . . . . . . . . 13

2.2.2. Vínculo lineal a coeficientes variables . . . . . . . . . . . . . . 17

2.2.3. Vínculo no lineal . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3. Control Cuasi-Global 23

3.1. Control del péndulo con disco de inercia . . . . . . . . . . . . . . . . . 24

3.1.1. Análisis lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3.1.2. Adimensionalización . . . . . . . . . . . . . . . . . . . . . . . . 28

3.1.3. Señal de Control . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.2. Control del péndulo con carro . . . . . . . . . . . . . . . . . . . . . . . 38

3.2.1. Adimensionalización . . . . . . . . . . . . . . . . . . . . . . . . 40

3.2.2. Análisis lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

X

ÍNDICE GENERAL

3.3. Señal de Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

4. Contraste con Otros Métodos de Control 49

4.1. Métodos lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.2. Métodos energéticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

5. Conclusiones 56

A. El péndulo con disco 57

B. El péndulo con carro 59

B.1. Análisis de la expresión gral. de Cv . . . . . . . . . . . . . . . . . . . . 61

C. Lagrangianos de sistemas articulados 63

C.1. El péndulo con disco. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

C.2. El péndulo con carro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

D. Sistemas subactuados 69

D.1. Definición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

D.2. Deducción de las ecuaciones de E −L . . . . . . . . . . . . . . . . . 69

E. Reparametrización del péndulo con disco. 71

F. Códigos de cálculo 74

F.1. Cálculo de las zonas de estabilidad . . . . . . . . . . . . . . . . . . . . 74

F.2. Resolución numérica de la dinámica . . . . . . . . . . . . . . . . . . . 78

G. Evaluación económica. 81

G.1. Distribución de Tareas . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

G.2. Estimación de Costos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

Referencias 83

Agradecimientos 85

XI

Índice de Figuras

1.1. Deformación de la zona de contacto del neumático –vista superior–. . 5

1.2. El péndulo con disco. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.1. El péndulo con carro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.2. Retrato de fases: Ck con coef. constantes. . . . . . . . . . . . . . . . . . 15

2.3. Evolución temporal del péndulo con carro . . . . . . . . . . . . . . . . 16

2.4. Evolución del péndulo con carro en TQ. . . . . . . . . . . . . . . . . . 17

2.5. Retrato de fases para vínculos con coef. variables . . . . . . . . . . . . 20

2.6. Retrato de fases para vínculos no lineales . . . . . . . . . . . . . . . . 22

3.1. Zona de estabilidad: foco en O . . . . . . . . . . . . . . . . . . . . . . 27

3.2. Retrato de fases: foco en O. . . . . . . . . . . . . . . . . . . . . . . . . 27

3.3. Retrato de fases extendido: foco en O. . . . . . . . . . . . . . . . . . . 28

3.4. Zonas de estabilidad en ∆−ε. . . . . . . . . . . . . . . . . . . . . . . . 32

3.5. Retrato de fases: nodo en O. . . . . . . . . . . . . . . . . . . . . . . . . 32

3.6. Retrato de fases extendido: nodo en O. . . . . . . . . . . . . . . . . . . 33

3.7. Bifurcación en ∆ = 0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.8. Retratos de fases: control Cuasi-Global para un nodo en O. . . . . . . 35

3.9. Retratos de fases: control local en Π. . . . . . . . . . . . . . . . . . . . 36

3.10. Comparación de potencia necesaria. . . . . . . . . . . . . . . . . . . . 37

3.11. Diagrama de bloques: el péndulo con disco . . . . . . . . . . . . . . . 38

3.12. Parámetros adimensionales: foco en O. . . . . . . . . . . . . . . . . . 42

3.13. Retrato de fases: foco en O . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.14. Retrato de fases extendido: foco en O . . . . . . . . . . . . . . . . . . 43

3.15. Parámetros adimensionales: foco inestable en Π. . . . . . . . . . . . . 44

3.16. Retrato de fases: foco en O . . . . . . . . . . . . . . . . . . . . . . . . . 44

XII

ÍNDICE DE FIGURAS

3.17. Parámetros adimensionales: nodo en O. . . . . . . . . . . . . . . . . . 45

3.18. Retrato de fases: nodo en O . . . . . . . . . . . . . . . . . . . . . . . . 46

3.19. Retrato de fases: Estabilización de Órbitas. . . . . . . . . . . . . . . . 46

3.20. Diagrama de bloques: el péndulo con carro . . . . . . . . . . . . . . . 48

A.1. El péndulo con disco. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

B.1. El péndulo con carro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

C.1. Descomposición de la posición. . . . . . . . . . . . . . . . . . . . . . . 64

G.1. Descripción de tareas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

G.2. Diagrama de Gantt del proyecto. . . . . . . . . . . . . . . . . . . . . . 81

XIII

Capítulo 1

Sistemas No Holónomos

Generalizados

1.1. Sistemas no holónomos estándar

Llamaremos Sistemas No Holónomos Estándar a aquellos sistemas lagrangianos

con m vínculos de la forma1

wai qi = 0 , a = 1, . . . , m, (1.1)

donde los qi son las coordenadas generalizadas y los coeficientes wai pueden ser

funciones, a lo sumo, de los qi. Notar que, si pensamos a los wai como vectores wa,

los vínculos de arriba dicen que las velocidades del sistema deben ser ortogonales

al espacio generado por los wa. Si L = L (q, q) es el lagrangiano del sistema,

sus ecuaciones de movimiento resultan de extremar la acción∫

L (q, q) dt para

variaciones ∆qi, es decir, desplazamientos virtuales, que cumplan

wai ∆qi = 0. (1.2)

En consecuencia, las ecuaciones que los definen son (1.1) y[

ddt

(∂

∂qi L

)− ∂

∂qi L

]∆qi = 0

con ∆qi cumpliendo (1.2). Estas últimas, mediante los multiplicadores indeterminados

de Lagrange λa –siguiendo el procedimiento que se detalla en [7]–, pueden llevarse a

1Índices repetidos indican sumatoria.

1

1. SISTEMAS NO HOLÓNOMOS Sistemas no d’alembertianos

la formaddt

(∂

∂qi L

)− ∂

∂qi L = fi , (1.3)

donde las fi son componentes de las fuerzas f que implementan los vínculos, y están

dadas por

fi = wai λa . (1.4)

Explícitamente, las ecuaciones resultan

ddt

(∂

∂qi L

)− ∂

∂qi L = wai λa

wai qi = 0

(1.5)

Volviendo a (1.4), podemos decir que las fuerzas de vínculo f pertenecen al es-

pacio generado por los wa. Como consecuencia de ello

< f, q >= fi qi = 0 , (1.6)

es decir, las fuerzas de vínculo son ortogonales a las velocidades generalizadas, afir-

mación que se conoce como Principio de D’Alembert. Es claro también que

< f, ∆q >= fi ∆qi = 0 , (1.7)

lo cual implica el cumplimiento del Principio de los Trabajos Virtuales: «las fuerzas de

vínculo no realizan trabajo en la dirección de los desplazamientos virtuales».

1.2. Violación del Principio de D’Alembert

Existen sistemas con vínculos [como los dados por (1.1)] para los cuales las fuer-

zas que implementan estos últimos no son ortogonales a las velocidades generaliza-

das: las fuerzas de vínculo de tales sistemas no satisfacen el Principio de D’Alembert

(ver [5] y [13]). En particular, las fuerzas de vínculo no toman valores en el espacio

generado por los wa, sino en otro espacio F que debe ser especificado como parte

de la definición del sistema. Sus ecuaciones de movimiento están dadas por (1.1) y

(1.3), pero con

fi = vai λa , (1.8)

2

1. SISTEMAS NO HOLÓNOMOS Sistemas no d’alembertianos

donde cada vai difiere de los wa

i asociado a los vínculos. (Los coeficientes vai pue-

den, en general, ser funciones de q y q.) Más precisamente [comparar con (1.5)], las

ecuaciones sonddt

(∂

∂qi L

)− ∂

∂qi L = vai λa

wai qi = 0 .

(1.9)

Las ecuaciones de vínculo que aparecen en estos sistemas pueden ser no lineales

en las velocidades, es decir, dadas por ecuaciones

wa (q, q) = 0, a = 1, . . . , m. (1.10)

De nuevo, si pensamos a los vai como vectores va, la ecuación (1.8) dice que las

fuerzas de vínculo toman valores en el espacio F generado por los vectores va.

Luego, si llamamos

Ck = q : wa (q, q) = 0al espacio de velocidades definido por los vínculos, los sistemas mencionados están

definidos por los datos L, Ck y F , a diferencia del caso estándar, para el cual sólo

basta especificar L y Ck.

La primera parte de (1.9) podemos obtenerla en forma variacional. De hecho,

extremando la acción para variaciones δqi cumpliendo

vai δqi = 0 , (1.11)

obtenemos (ddt

(∂

∂qi L

)− ∂

∂qi L

)δqi = 0,

y utilizando multiplicadores de Lagrange, arribamos precisamente a

ddt

(∂

∂qi L

)− ∂

∂qi L = vai λa. (1.12)

La observación anterior nos dice que estos sistemas pueden alternativamente ser

descriptos en términos de los datos L , Ck y Cv, en lugar de F . De todos modos,

conociendo unos datos puden determinarse los otros, ya que Cv = F⊥, es decir, Cv

es el ortogonal de F .

3

1. SISTEMAS NO HOLÓNOMOS Sistemas generalizados

1.3. Sistemas no holónomos generalizados

Motivado por lo discutido en la sección anterior, vamos a definir, tal como se ha-

ce en [4], una clase de sistemas dinámicos que contiene a los sistemas no holónomos

estándar como caso particular, y que llamaremos Sistemas no Holónomos Generaliza-

dos. Se trata de sistemas definidos por ternas (L , Ck, Cv), siendo L el lagrangiano,

Ck = q : wb (q, q) = 0los vínculos cinemáticos y

Cv = δq : vbi (q, q) δqi = 0

los vínculos variacionales. Las tayectorias de tales sistemas serán curvas q (t) que cum-

plen (ddt

(∂

∂qi L

)− ∂

∂qi L

)δqi = 0; δq ∈ Cv y q ∈ Ck,

o en forma equivalente

(ddt

(∂

∂qi L

)− ∂

∂qi L

)δqi = 0

vbi (q, q) δqi = 0

wai (q, q) = 0.

Utilizando multiplicadores de Lagrange –como ya hemos hecho para las ecua-

ciones (1.5) y (1.9)–obtenemos

(ddt

(∂

∂qi L

)− ∂

∂qi L

)= va

i (q, q) λa

wai (q, q) = 0.

Luego, las cantidades fi = vai λa representan las fuerzas necesarias para implemen-

tar los vínculos Ck, y cumplen

< f, δq >= fi δqi = 0. (1.13)

Es decir, las fuerzas de vínculo definen un espacio F dado por el ortogonal a Cv.

Si llamamos desplazamientos virtuales a los elemenentos de Cv, tendremos para estos

sistemas una generalización de la idea del Principio de los Trabajos Virtuales: las

fuerzas de vínculo no realizan trabajo en las direcciones definidas por los desplazamientos

virtuales.

A continuación veremos un ejemplo de sistema no holónomo generalizado.

4

1. SISTEMAS NO HOLÓNOMOS Sistemas generalizados

El modelo de neumático de Rocard

Consideremos el sistema simplificado para un neumático de masa M que rue-

da sin resbalar sobre un plano como el que se describe en [9], [10]. Por simpli-

cidad veamos el caso de un sólo neumático perfectamente elástico cuyo plano

de movimiento debe permanecer perpendicular al piso. El centro de la zona de

contacto del neumático con el piso lo indicaremos mediante el par (x1, x2) y lo

consideraremos centrado en el ancho del neumático. Sin embargo, admitiremos

una pequeña deformación angularε en esta zona que posibilita un desfasaje igual

entre la velocidad x del centro del neumático y el plano de la rueda (ver Figura

1.1). El ángulo entre el plano de la rueda y el eje x1 es θ, entonces el ángulo entre

x y x1 es θ − ε. El ángulo de rotación de la rueda respecto de su propio eje es

ψ. En resumen, un punto genérico del espacio de configuración2 Q del sistema

será q = (ψ,θ,ε, x1, x2).

F

xε

θ

(x1, x2)

x

θ

(x1, x2)

Figura 1.1: Deformación de la zona de contacto del neumático –vista superior–.

Ahora asociemos la descripción de este sistema con un sistema no holónomo

generalizado, tal y como se hace en [5]. Para esto consideremos el vínculo cine-

mático (Ck) dado por las ecuaciones

x1 = ψcos(θ−ε) , x2 = ψsen(θ−ε) , (1.14)

que describen la condición de rodadura, y

ψ(θ− ε

)=

aM

ε , (1.15)

que tiene en cuenta el efecto de la fuerza F = aε que hace el piso sobre el

sistema, donde a es una contante de proporcionalidad. Y donde el vínculo va-

2Ver definición de Q en [7]

5

1. SISTEMAS NO HOLÓNOMOS Las ecuaciones de movimiento

riacional (Cv) está definido por

δx1 − δψ cos(θ−ε) = 0 ,

δx2 − δψ sen(θ−ε) = 0 ,

δθ− δε = 0 .

(1.16)

Notemos que la ecuación (1.15) es cuadrática en las velocidades por lo cual este

sistema escapa a los alcances de los sistemas no holónomos simples que presen-

tamos en §1.1, es decir, se trata efectivamente de un sistema no d’alembertiano.

Luego, las ecuaciones de Euler-Lagrange resultan

Iψ + Mx1cosθ + x2senθ = 0

Jθ + Kε = 0 ,(1.17)

donde K la constante de elasticidad del neumático y H e I son los momentos

de inercia del neumático respecto de cualquiera de sus diámetros mayores y

respecto del eje de la rueda, respectivamente.

Encontramos, que el sistema formado por las ecuaciones (1.14), (1.15) , (1.16) y

(1.17) describe completamente la dinámica del sistema.

Otra clase de sistemas plausibles de ser descriptos mediante este formalismo es la

conformada por los sistemas mecánicos controlados mediante servomecanismos. En

estos sistemas el subespacio F al que pertenecen las fuerzas queda determinado por

la configuración de los actuadores, mientras que los movimientos del sistema pue-

den englobarse en algún Ck descripto mediante ecuaciones de vínculo cinemático.

Este procedimiento –que discutiremos en el Capítulo 2– se conoce como control me-

diante vínculos virtuales. En lo siguiente nos abocaremos exclusivamente al estudio

de estos casos, puntualizando en la metodología seguida para su análisis.

1.4. Construcción de las ecuaciones de movimiento

En esta sección describiremos el tratamiento general que se le dió a los diferentes

sistemas dinámicos que surgen de la aplicación de vínculos cinemáticos mediante

servomecanismos.

6

1. SISTEMAS NO HOLÓNOMOS Las ecuaciones de movimiento

Consideremos un sistema mecánico con n coordenadas generalizadas q = (q1, . . . , qn),

cuyo lagrangiano3 es L (q1, . . . , qn; q1, . . . , qn) y sobre el cual actúan m vínculos ci-

nemáticos lineales de primer orden

Ck : wa(q, q) = 0 1 ≤ a ≤ m . (1.18)

Para poder escribir las ecuaciones de movimiento, como ya mencionamos en la

sección anterior, es necesario determinar Cv (ver [4]). Cuando se trata con servo-

mecanismos, la forma mas natural de defir el vínculo variacional Cv, es a partir de

los actuadores sobre cada sistema particular. Es decir, se conoce el subespacio F

al que pertenecen las fuerzas generalizadas de vínculo, dada la distribución de los

actuadores en el sistema , luego Cv = F⊥ como ya vimos en §1.2 .

Para comprender mejor esto último, analicemos este procedimiento mediante un

ejemplo:

El péndulo con disco

Consideremos el sistema del péndulo con disco que se muestra en la figura 1.2,

coordinizado por (ψ,θ) y que se detalla en el Apéndice A.

md, Id

O′

mb, Ib

ψ

θ

c

`

O

g

Figura 1.2: El péndulo con disco.

Pensemos, además, en el caso en el que se monta un motor4, solidario a la barra, capaz

de hacer girar el disco de inercia respecto de su eje en O′.3Para más información sobre la construcción del lagrangiano, ver Apéndice C4Será mediante el torque entregado por este elemento que se satisfará la ecuación de

vínculo cinemático.

7

1. SISTEMAS NO HOLÓNOMOS Las fuerzas generalizadas

Así, en este caso, que la fuerza generalizada de vínculo ( fψ, fθ) será de la forma

fθ = 0 ⇒ f = ( fψ, fθ) = (1, 0)λ , (1.19)

donde λ = λ(q, q).

Luego, aplicando la ecuación (1.13), resulta

Cv = (δψ, δθ) : δψ = 0 . (1.20)

Habiendo determinado, por este procedimiento, Cv a partir del conocimiento de los actua-

dores sobre el sistema.

En general, indicaremos5 el Cv a partir de las fuerzas de vínculo –generalizando

la ec. (1.19)– :

fi = vbi λb , (1.21)

con6 1 ≤ b ≤ l.

Conocida, de esta forma, la terna (L , Ck, Cv), estamos en condiciones de plantear

las ecuaciones de movimiento del sistema (ver Apéndice D.2). Es así, que a partir

del principio de Hamilton –para sistemas no holónomos– deducimos las ecuaciones

de Euler-Lagrange. De esta forma, la resolución completa del sistema consistirá en

encontrar λ(t) y q(t), tales que verifiquen

ddt

(∂

∂qi L

)− ∂

∂qi L = vbi λb

wa(q, q) = 0 (1.22)

con 1 ≤ i ≤ n, 1 ≤ a ≤ m, 1 ≤ b ≤ l y para ti ≤ t ≤ t f .

1.5. Cálculo de las fuerzas generalizadas

Para despejar los parámetros λ del sistema de ecuaciones (1.22), reescribamos las

primeras n ecuaciones poniendo de manifiesto la dependecia de cada término con

q, q y q : Aplicando la regla de la cadena7, obtenemos

Mi, j q j + Li = vbi λb , (1.23)

5Gracias al principio de los trabajos virtuales6Más adelante veremos que para que el sistema tenga solución para λb es necesario que l = m7Dados L (x), x1(t), . . . , xn(t) ∈ C 1, dL /dt = ∂L /∂xi · dxi/dt

8

1. SISTEMAS NO HOLÓNOMOS Las fuerzas generalizadas

con8 1 ≤ i, j ≤ n y 1 ≤ b ≤ l, donde hemos definido

Li(q, q) =∂2L

∂qi∂q j q j − ∂L

∂qi y Mi, j(q, q) =∂2L

∂qi∂q j .

Luego, despejando q j de la ecuación (1.23)

q j = (M−1) j,i(

vbi λb − Li

).

Por otra parte derivando las ecuación (1.18) que determina los vínculos del sis-

tema∂wa

∂q j q j +∂wa

∂q j q j = 0

Así, a partir de las dos últimas ecuaciones, obtenemos

ϕa,bλb − ∂wa

∂q j (M−1) j,iLi +∂wa

∂q j q j = 0 ,

donde

ϕa,b =∂wa

∂q j (M−1) j,ivbi , (1.24)

con 1 ≤ a ≤ m y 1 ≤ b ≤ l. Y a partir de esta última ecuación obtenemos

λb = (ϕ−1)a,b

[∂wa

∂q j (M−1) j,iLi − ∂wa

∂q j q j]

,

donde aseguramos9 la existencia de ϕ−1 si l = m, asumiendo, además, independen-

cia en las ec. de vínculo wa = 0 y dim(F ) = l = m, donde f ∈ F . Finalmente las

fuerzas generalizadas de vínculo –aplicando la ecuación(1.21)– estarán dadas por

fk = vbk(ϕ−1)a,b

[∂wa

∂q j (M−1) j,iLi − ∂wa

∂q j q j]

, (1.25)

con 1 ≤ i, j, k ≤ n, 1 ≤ a, b ≤ m y para ti ≤ t ≤ t f .

8Durante el resto de esta deducción, obviaremos muchas veces, por simplicidad, los valores que

toman los índices i, j, a y b9Nos ocupamos unicamente de este caso debido a que en el desarrollo del trabajo sólo trataremos

con sistemas de estas características.

9

Capítulo 2

Control mediante Vínculos Virtuales

Dado un sistema no holónomo generalizado con vínculos en las velocidades co-

mo los que definimos en §1.3, tendremos que el mismo evolucionará con

(q, q) ∈ Ck ,

donde el conjunto Ck será alguna subvariedad del espacio de fases definida a partir

de las ecuaciones de vínculos cinemáticos del sistema.

Por otra parte si el mismo sistema mecánico, es controlado mediante fuerzas

externas f(u) producto de una acción de control u(q, q) tal que la evolución del

mismo se puede restringir a una subvariedad C tendremos

(q, q) ∈ C .

Ahora bien, si1 Ck ≡ C, podemos pensar a C como resultante de un vínculo

cinemático donde f será la fuerza de vínculo que lo implementa.

La idea del control mediante vínculos virtuales, consiste en asociar la acción de con-

trol u con las fuerzas necesarias para la implementación de algún vínculo cinemá-

tico que genere Ck. –El termino virtual podemos asociarlo a la inexistencia de una

vinculación física en las partes que forman el sistema, como es usual en vínculos

holónomos. Los vínculos a los que nos referimos no se implementarán mediante

rótulas, rieles, ni otros elementos materiales, responderán simplemente a una ecua-

ción matemática que no tiene por que representar alguno de estos típicos ejemplos

que generan vínculos holónomos–.1Entendemos Ck ≡ C, si q(q, q) ∈ C ⇔ (q, q) ∈ Ck ∀ (q, q) solución de cualquiera de los

sistemas, con condiciones iniciales (q0, q0) ∈ C⋂

Ck

10

2. CONTROL MEDIANTE VÍNCULOS VIRTUALES Estrategias de control

Este enfoque presenta como ventaja fundamental una forma sencilla de restrin-

gir las órbitas del sistema mediante las ecuaciones de vínculo (ver, por ejemplo [15],

[16]). Sin embargo, la forma funcional de u puede resultar complicada o de alto costo

computacional en la implementación en comparación con los métodos tradicionales

de control lineal2. Otra ventaja interesantre que presenta este enfoque es que per-

mite tratar con las ecuaciones propias del sistema sin linealizar, considerando así la

dinámica completa del problema.

La estrategia de control mediante vínculos virtuales, consiste en calcular la señal

de control u(q, q), a partir de las ecuaciones que determinan la dinámica del sis-

tema. Al realizarse la implementación de este tipo de procedimiento a partir de un

vínculo dependiente de las velocidades –factible de realizarse en servomecanismos–,

se obtiene, en general, un sistema dinámico no holónomo generalizado. Son precisamente

los sistemas con estas características, los que estudiamos en este trabajo.

En estas condiciones, para calcular la acción de control procederemos de la forma

que detallamos en §1.5. En este punto en particular, resulta de interés recordar la ec.

(1.21) que utilizamos para calcular las fuerzas generalizadas en esa sección. Esta

ecuación establecía

fi = vbi λb ,

con vbi ∈ R, 1 ≤ b ≤ l. Luego, a fin de hallar la acción de control u en este formalis-

mo, identificamos

ub = λb : fi = vbi ub ,

donde vbi ∈ R, ub = ub(q, q), con 1 ≤ b ≤ l, cumpliendo así, formalmente, la

definición de u.

2.1. Estrategias de control

Las estrategias de control, en este contexto, consisten en encontrar vínculos ci-

nemáticos y variacionales tales que se consiga controlar el sistema hacia alguna ór-

bita deseada. Para probar esto, en este trabajo, nos abocaremos a la estabilización

2Consideramos como métodos tradicionales, todos aquellos donde la señal de control es lineal en

q y q y a coeficientes contantes.

11

2. CONTROL MEDIANTE VÍNCULOS VIRTUALES Control local

de diferentes péndulos invertidos en la posición vertical superior, naturalmente de

equilibrio inestable3.

2.2. Control local

En esta sección evaluaremos el efecto de diferentes estrategias de control que

estabilizan el péndulo invertido con carro en algún entorno de la posición superior

(θ = 0). Este sistema se muestra esquematicamente4 en la Figura 2.1.

x

gm, I

O

`/2

O′

θ

Figura 2.1: El péndulo con carro

En este caso, el espacio de configuraciones Q corresponde al cilindro S1×R, que

coordinizaremos mediante (θ, x) : Q→ R2, donde −π < θ ≤ π , −∞ < x < ∞.

Para este sistema, las ecuaciones de movimiento, serán (ver deducción en Apén-

dice B)

(mx + m `

2 senθθ2 −m `

2 cosθθ)

δx +

+(

I0θ−m `2 cosθx−mg `

2 senθ)

δθ = 0

fxδx + fθδθ = 0

(2.1)

Trataremos el problema del control de este sistema para el caso subactuado, por lo

tanto, deberá cumplirse (como vimos en §D.1), dim(F ) < dim(Q) = 2⇒dim(F ) = 1.

3Se trata de un punto tipo ensilladura o saddle point. Ver caracterización de puntos fijos de sistemas

no lineales en [11].4Para una descripción más detallada sobre el sisema ver Apéndice B.

12


Es decir, consideraremos el caso [ver ecuación (1.21)]

f = ( fθ, fx) = (vθ, vx)λ ,

con λ = λ(θ, x) y vθ, vx ∈ R.

2.2.1. Vínculo lineal a coeficientes constantes

Analicemos, primeramente, el vínculo cinemático lineal a coeficientes constantes

Ck : θ + ax = γsenθ , (2.2)

donde a, γ ∈ R. En particular, el caso donde sólo se tiene un actuador capáz de

ejercer una fuerza horizontal (en la direción x) sobre el carro (ver Figura 2.1). En

esta situación tendremos –ver ecuación (1.13)–

Cv : δx = 0, ó bien fθ = 0 . (2.3)

Derivando la ecuación (2.2), obtenemos

x =γ

aθ cosθ− θ

a(2.4)

Luego, reeplazando las ecuaciones (2.3) y (2.4) en (2.1), podemos reducir el orden

del sistema y escribir

θ = ω

ω =m`γ

2aJ(θ)ω cos2θ +

mg`

2J(θ)senθ

(2.5)

donde hemos definido ω = θ y

J(θ) = I0 +m`

2acosθ . (2.6)

De la ecuación (2.6) deducimos que esta estrategia tiene una singularidad en

θi = arc cos(−2

aI0

m`

), (2.7)

que podríamos evitar eligiendo

|a| > m`

2I0. (2.8)

13


Por otra parte, analizando el sistema de ecuaciones (2.5), encontramos que el

sistema sólo tendrá dos puntos fijos5

(θ, ω) ≡ O = (0, 0)

(θ, ω) ≡ Π = (π , 0) .

Luego, si linealizamos el sistema en un entorno del punto O, resulta la matríz

jacobiana6

JO =

0 1mg`

2 jo

mγ`

2 joa

, (2.9)

donde

jo = J(θ=0) = I0 +m`

2a.

Analizando el polinomio característico p(λ) de la matríz JO, encontramos que para

que O sea un foco estable, deben verificarse simultaneamente

γ < 0 , −m`

2I0< a < 0 , a <

(m`

2I0

)− ∆

1/2(γ) , (2.10)

donde

∆(γ) =(

m`

2I0

)2

− m`γ2

2gI0.

Condiciones que resultan incompatibles con la ecuación (2.8).

Por lo tanto, en vistas de la contradicción entre las ecuaciones (2.10) y (2.8), con-

cluimos que no es posible encontrar parámetros a, γ tales que el punto O sea foco estable, y

atractor de órbitas con condiciones iniciales (θ0, ω0) tales que cosθ0 < −2(aI0)/(m`).

Sin embargo, eligiendo a, γ que verifiquen las condiciones (2.10), el punto O re-

sulta foco estable con una cuenca de atracción limitada por la singularidad dada por

la ecuación (2.7).

Analicemos este caso mediante un ejemplo, donde por simplicidad tomaremos

m, `, I0 unitarios7 y donde sean γ = −√g/3 · m`/I0 y a = −1/4 · I0/m`, de forma

que se verifiquen las condiciones de estabilidad dadas por (2.10).

5Definimos puntos fijos (θ,ω)∗ como aquellos puntos del espacio de fases tales que θ∗ = ω∗ = 0

(ver [11]).6Definimos, para el espacio de fases (x1, . . . , xn), la matríz jacobiana Ji

j = (∂xi)/(∂x j), con 1 ≤i, j ≤ n.

7Unitarios según la definición de unidades del Sistema Internacional (S.I.) (m, Kg, s).

14


-π -π/2 0 π/2 ππ/3-π/3θ

-4

-2

0

2

4

ω [1

/s]

Figura 2.2: Retrato de fases resultante de la evolución del sistema dinámico del péndulo con carro al

implementar un vínculo lineal a coef. const. mediante fuerzas horizontales.

Resolviendo las ecuaciones (2.5) numericamente, para diferentes condiciones ini-

ciales, obtenemos el retrato de fases que se muestra en la Figura 2.2. –La construc-

ción de este retrato de fases (al igual que todo retrato que se muestra en este trabajo)

se realizó a partir de las salidas de pequeños programas en leguaje C que escribi-

mos para resolver los diferentes sistemas de ecuaciones [como, por ejemplo, el sis-

tema (2.5)] que surgen de la implementación del control por vínculos virtuales. En

el Apéndice F.2 se muestra el código fuente de uno de estos programas a modo de

ejemplo.–

Para la elección de parámetros de este ejemplo es de esperar una divergencia

en ω para θ → θi±, (ver ecuación 2.7), la que podemos observar8 en la Figura 2.2,

donde

θi− = −π

3θi+ =

π

3.

Cabe destacar que mediante la implementación del vínculo (2.2), hemos conse-

guido9 generar un foco estable en O , así tambien como un foco inestable en Π.

El precio que debemos pagar para esto es la formación de una variedad inestable

8En rigor en los resultados que se muestran en la Figura2.2 existen orbitas que cruzan las varieda-

des inestables θi± = ±π/3, esto se debe a errores numéricos de discretización en el cálculo.9Recordemos que para retratos de fases, en el semiplano superior las órbitas evolucionan hacia la

derecha y en el semiplano inferior hacia la izquierda (ver [11]).

15


(asintótica y para la cual ω → ±∞) que divide el espacio de fases en dos partes

incomunicadas. Es decir,

∀(θ, ω)(t) : θi− < θ0 < θi+ sii θi− ≤ θ(t) ≤ θi+ ,

∀(θ, ω)(t) : θ0 < θi− ó θi+ < θ0 sii θ(t) ≤ θi− ó θi+ ≤ θ(t) ,

0 2 4 6 8

t[s]

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

θ

0 2 4 6 8

t[s]1

1.5

2

2.5

3

3.5

x [m

]

(a) comportamiento de la posición: θ(t), x(t)

0 2 4 6 8

t[s]-20

-10

0

10

20

30

40

v [m

/s]

0 2 4 6 8

t[s]

-2

-1

0

1

ω[1

/s]

(b) comportamiento de la velocidad: v(t),ω(t)

Figura 2.3: Evolución temporal del péndulo con carro para un vínculo lineal constante y fuerza

horizontal, a partir de condiciones iniciales (x,θ, v, ω)0 = (1m, 1, 1m/s, 1/s).

En la Figura 2.3 analizamos el comportamiento del sistema en la cuenca de atrac-

ción del punto O. En particular, se muestra la evolución [mediante sus coordenadas

en el espacio tangente de configuraciones (x,θ, v, ω) ∈ TQ], donde identificamos

16


v = x, ω = θ. Observamos en esta figura la convergencia asintóticamente estable10 de

las órbitas en la cuenca de atracción del punto O. Se observa además, la convergen-

cia de las velocidades a cero para t ≈ 8s.

S1×R

θi− θi+

x

θ

1 1.5 2 2.5 3 3.5

x[m]-0.5

0

0.5

1

θ

Figura 2.4: Evolución del sistema en el espacio de configuraciones Q, a partir de una condición

inicial en la zona estable.

Alternativamente, en la Figura 2.4 ejemplificamos la evolución del sistema en

Q = S1 × R –mediante su cordinización (x,θ).– Aquí vemos como son las óbitas

típicas del sistema sobre la zona estable del cilindro11 de forma que la gráfica que se

muestra a la derecha en la fig.2.4 puede pensarse como arrollada sobre el cilindro.

El atractivo de esta estratégia particular, reside en que, mediante la implementa-

ción de un control adicional válido sólo en las zonas (θ, ω) : |θi| −ε < |θ| < |θi|+ε

(0 < ε ∈ R), capaz de comunicar continuamente las órbitas, podría lograrse un control

global en (θ, ω).

2.2.2. Vínculo lineal a coeficientes variables

Con el objetivo de conseguir vínculos que estabilizaran el punto O para el pén-

dulo con carro para cualquier condición inicial al azar, ensayamos varias estrategias

alternativas. La mayor parte de los vínculos propuestos a tales efectos fueron li-

neales en las velocidades y con coeficientes variables (función de las coordenadas

10Ver clasificaciones de diferentes tipos de estabilidad en [11].11La zona estable de Q está definida por el conjunto de puntos (θ, x) : θi− < θ < θi+ .

17


generalizadas del sistema):

(A) θ + ax = γ senθ + b x ,

(B) θ + a(x) x = γ senθ + b x ,

(C) θ + ax = γ senθ + b(x) x ,

(D) θ + a(θ) x = γ senθ + b x ,

donde a(x), b(x) son funciones de x y a(θ) es función de θ. Todos en combinación con

el vínculo variacional

Cv : δx = 0 por considerarse siempre fθ = 0 .

Las familias de vínculos (A), (B) y (C) fueron tratadas genericamente para todas

las posibles constantes a, b, γ y todas las funciones continuas a(x), b(x). Sin embargo,

en estas condiciones siempre encontramos un conjunto de trayectorias –de medida

no nula– para las cuales el sistema no converge al punto O. El último tipo de vínculo

encolumnado, es decir el (D) –con a = a(θ)–, se analizó a partir de un caso particu-

lar de interés. Aunque para este vínculo también encontramos órbitas fuera de la

cuenca de atracción de O, reproduzcamos someramente el análisis realizado en es-

tas condiciones como un ejemplo que motive la aplicación de vínculos cinemáticos

lineales en las velocidades con coeficientes variables.

En la ecuación (2.2), encontramos que ω diverge para θi± [según definimos en la

ecuación (2.7)]. Ahora bien, proponiendo un vínculo

Ck : θ +cosθ

hx = γ senθ + b x ,

con h ∈ R, podemos eliminar esta divergencia de ω debida al factor J(θ) [ver ecua-

ción (2.6)]. Con sólo tomar h 6= 2I0/(m`), –de la ecuación (2.6)– resulta

2Jm`

=2I0

m`+ h 6= 0 ∀θ . (2.11)

Pero no por esto debemos cantar victoria, ya que –como ya hemos adelantado– este

método no nos permite controlar el sistema desde cualquier condición al azar y es

debido –justamente– a una divergencia en las ecuaciones de movimiento. Veamos a

continuación a que se debe este efecto.

Para estos sistemas donde los coeficientes que acompañan a las velocidades son

funciones de las coordenadas generalizadas, no es posible reducir la dinámica a un

18


sistema de ecuaciones diferenciales de primer orden como hicimos en §2.2.1 [ver

ecuación (2.5)]. Por ejemplo, al plantear las ecuaciones de movimiento en las coor-

denadas generalizadas x y θ, para las familias (B) o (C) no es posible eliminar de las

ecuaciones la dependencia con ninguna de las coordenadas resultando un sistema

en cuatro variables acopladas. El análisis lineal de estos sistemas –cuyas matrices ja-

cobianas J ∈ R4×4– conlleva, en general, a polinomios característicos p(Λ) = 0 de

cuarto grado. Sin embargo, dada la forma particular de las matrices que resultan pa-

ra los casos (B) y (C) econtramos que Λ = 0 es una raíz de p, quedando por resolver

un polinomio de tercer grado. Esto generó la necesidad de programar un código C a

fin de determinar numericamente soluciones a problemas de este tipo. El mismo se

realizó a partir del método exacto de Bombelli-Cardano-Ferro-Tartaglia (B-C-F-T) (ver

Apéndice F.1).

Para los vínculos de la familia (D), es posible eliminar la dependencia de las

ecuaciones de movimiento con x, resultando un sistema en sólo 3 dimensiones12,

que podemos escribir13

θ = ω

ω =h m` γ cosθ

2Jω +

h2 m` senθ

2Jω v +

g m`

2Jsenθ

v =(

h γ − h2 m` γ

2J

)ω +

(1 +

h3 m`

2J

)tgθ ω v +

h g m`

2Jtgθ

(2.12)

donde J está definido por la ecuación (2.11). A partir de la introducción de esta nue-

va variable v = x en las ecuaciones de movimiento es que encontramos puntos para

los cuales las órbitas divergen. Analicemos la última ecuación del sistema (2.12).

Encontramos así, que

límθ→± π2

v = ±∞ .

Luego, del análisis de estabilidad resulta que para obtener un foco estable en O

los parámetros h, γ deben verificar14

h− < h < h− ,12Notemos que para todo a(θ), tanto el vínculo como el lagrangiano conservan la simetría en x (es

cíclica), por cual es de esperarse que no intervenga en las ecuaciones.13La ecuación x = v no forma parte del sistema porque no es necesaria para la resolución de las

demás variables: está desacoplada.14En este caso no resulta necesario el uso del método de (B-C-F-T) ya que, aunque J ∈ R3×3, el

polinomio característico puede escribirse Λ · p∗(Λ).

19


donde

h± = η±√

η2 − η

I,

con

η =2gγ2 I =

m`2

4I0.

Así, para este caso también realizamos un programa para calcular las órbitas a

partir del sistema (2.12) (ver código típico para realizar retratos de fases en Apén-

dice F.2). Algunas de las salidas de este programa para las zonas de estabilidad

correspondientes a la ecuación anterior, se muestran en la Figura 2.5 para el caso

con g = 9,8m/s2; m = 1kg; ` = 1m; I0 = 1kg ·m2.

v[m/s]

ω[s−1]θ

v[m/s]

40

0

-40

42

0-2

-40.60.3

0-0.3

-0.6

Figura 2.5: Retrato de fases resultante de la implementación de un vínculo lineal a coeficientes

variables.Ck : θ + h−1 · cosθ · x = γ · senθ + b · x, con h = −6, γ = −1.

2.2.3. Vínculo no lineal

Como otra forma alternativa de eliminar la divergencia de ω que se tiene en θi±al implementar el vínculo lineal (2.2) [ver ecuación (2.7)], proponemos el vínculo

cinemático

Ck : x + a θ ln|cosθ| = γ senθ + c θ , (2.13)

donde a, c, γ ∈ R son constantes a ajustar según el comportamiento buscado pa-

ra el sistema. Las ecuaciónes de Euler-Lagrange pueden ser llevadas al sistema de

20


ecuaciones

θ = ω

ω =γ

J2ω cos2θ +

g + aω2

J2senθ

(2.14)

donde

J2 =I0

m`/2+ a cosθ ln|cosθ|+ c .

Notemos que la dinámica de las variables θ y ω puede desacoplarse de x, a dife-

rencia del caso tratado en §2.2.2 donde fue necesaria la introducción de la variable

v = x. Otra característica importante del sistema (2.14) es que efectivamente se eli-

minó la divergencia de ω, notemos que

límθ→± π2

(cosθ ln|cosθ|) = 0 , (2.15)

luego tomando

|c| > |a|e− I0

m`/2(2.16)

conseguimos ω < ∞ ∀(θ, ω) ∈ Ck (donde e es número de Euler-Neper, base de ln,

e = 2,7 . . . ). Sin embargo, recordemos que x debe verificar la ecuación de vínculo

(2.13)

x = −a ln|cosθ|ω + γ senθ + c ω , (2.17)

y por lo tanto

límθ→± π2

x = −∞ , (2.18)

para a 6= 0 y 0 < lím θ→±π/2 |ω| < ∞. Es decir, el vínculo propuesto mantiene

acotadas las variables θ, x, ω y x en la zona (θ, x, ω, x):

−π

2< θ <

π

2. (2.19)

Conseguimos así diseñar, al igual que en §2.2.1, una estrategia de control local

acotada en θ, pero donde ahora θi = ±π/2, –para c y a que verifiquen (2.16)– (ver

ecuación 2.7 de define los límites de la zona estable para el vínculo lineal propuesto

en §2.2.1). Por este motivo es que en la Figura 2.6 mostramos la dinámica del siste-

ma teniendo en cuenta las tres coordenadas (θ, ω, x). Así mostramos el efecto de la

divergencia en x para θ = π/2, que debido a la discretización numerica no alcanza

valores excesivos –por lo cual vemos sólo pequeñas perturbaciones–.

21


v[m/s]

ω[s−1]θ

v[m/s]

20

0

-20

30

-3

π/2 0 -π/2

Figura 2.6: Retrato de fases resultante de la implementación de un vínculo no lineal.Ck : x + a · θ ·ln|cosθ| = γ · senθ + cθ.

Ahora bien, escapando nuevamente a los objetivos del capítulo, se nos plantea

el interrogante de si será posible reproducir las órbitas de la Figura 2.6 median-

te un control discreto acotado para un sistema real. Esta elucubración se basa en

el hecho de que la implementación práctica de la estrategia se hace a partir de un

muestreo discreto del estado del sistema (al igual que el programa de cálculo uti-

lizado para generar la Figura2.6), luego –para las mismas condiciones iniciales– si

los tiempos de muestreo y de discretización del programa de simulación son iguales

quizás resulten evoluciones similares donde no se alcance ni velocidades ni fuerzas

excesivas. Sin embargo no contamos con la evidencia práctica ni numérica necesa-

rias para sustentar esto, de forma que sólo no limitamos a presentar esta estrategia

en un contexto local.

En este sentido el vínculo no lineal que proponemos en esta sección puede resul-

tar de utilidad para el control del péndulo invertido con carro en la zona (θ, x, θ, x) :

−π/2 < θ < π/2) , como podemos ver en la Figura 2.6 .

22

Capítulo 3

Control Cuasi-Global

En este capítulo presentaremos varios vínculos variacionales y cinemáticos, me-

diante los cuales es posible estabilizar la posición superior del péndulo invertido,

con una cuenca de atracción de todo el espacio de fases menos un conjunto de medi-

da cero. Es decir, encontraremos que los únicos puntos fuera de la cuenca de atracción

serán los pertenecientes a una subvariedad de dimensión menor a la del espacio de

fases del sistema. Entonces la probabilidad de tomar condiciones iniciales en este

conjunto es nula 1 y como la cuenca de atracción sólo excluye este conjunto:

cualquier órbita elegida a al azar convergerá al punto fijo superior O.

De allí, la denominación cuasi-global. Además para los problemas considerados, por

razones topológicas no es posible el diseño de una acción de control global y contínua en

todo TQ (ver [1]).

Para verificar si los diferentes vínculos que proponemos en este capítulo efec-

tivamete controlan cuasi-globalmente los sistemas, procederemos por dos caminos

complemetarios. Primero, analizaremos linealmente el sistema en los puntos fijos y

luego completaremos el análisis caracterizando el comportamiento global median-

te simulación numérica. Dada la discretización de la simulación numerica, resulta

evidente que no evaluaremos todas las órbitas del sistema: nos conformaremos con

evaluar aquellas que consideramos representativas y que nos permitirán estudiar el

comportamiento del sistema. Por un lado, tomaremos condiciones iniciales en las

cercanías de los puntos fijos de forma de conseguir caracterizar esta zona donde la

dinámica es importante. Y por otro lado, tomaremos condiciones iniciales suficien-

1Para una distribución uniforme sobre todo el espacio de fases

23

3. CONTROL CUASI-GLOBAL Control del péndulo con disco de inercia

temente alejadas2 que nos darán idea del comportamiento del sistema lejos de los

puntos fijos. Este último punto será muy importante para determinar la extención

de la cuenca de atracción, ya que en rigor desconocemos si condiciones iniciales

mayores a las ensayadas numericamente quedan fuera de la cuenca de atracción.

Sin embargo, si a la luz de los resultados de las simulaciones nada parece indicar la

existencia de estas órbitas fuera de la cuenca de atracción, consideraremos que las

simulaciones caracterizan el comportamiento en todo el espacio de fases.

Entonces, diremos que se consiguió el control Cuasi-Global cuando las órbitas

ensayadas –que consideramos una muestra representativa de todas las órbitas del

sistema– convergen siempre al mismo punto que se quiere estabilizar.

3.1. Control del péndulo con disco de inercia

En esta sección trataremos el problema de la estabilización del sistema del pén-

dulo invertido con disco de inercia. El sistema en cuestión, el cual ya hemos citado

en repetidas oportunidades en este trabajo, se describe en detalle en el Apéndice A.

Éste es un sistema que ha sido objeto de diferentes técnicas de control en varios

trabajos (ver, por ejemplo, [1] y referencias que allí se dan para diferentes enfoques).

Como técnica de control, en esta oportunidad, proponemos el vínculo virtual

Ck : θ + aψ = γsenθ

donde a, γ son constantes no nulas.

Derivando la ecuación (3.1) respecto del tiempo se obtiene

ψ =γ

acosθ θ− θ

a. (3.1)

Consideremos el caso subactuado no trivial donde el control se realiza sobre el disco

de inercia. A partir de las ecuaciones de Euler-Lagrange, las restricciones cinemáti-

cas Ck y variacionales Cv del sistema, encontraremos las ecuaciones de movimiento

(ver Apéndice A). Así, si se reemplaza (3.1) en (A.6) y si se reordenan conveniente-

2El criterio adoptado para establer que una condición inicial está suficientemente alejada se expli-

citará oportunamente para cada caso particular.

24


mente los términos resulta el sistema

θ = − I2γ

a Jcosθω +

MgJ

senθ

θ + aψ = γsenθ

(3.2)

donde

J = J(a) = Ieq1 + I2

(1− 1

a

), (3.3)

con a tal que verifique

J 6= 0 . (3.4)

Dado que θ no depende explicitamente de ψ ni de sus derivadas –como se mues-

tra en (3.2)–, la dinámica de θ y ψ se puede desacoplar y estudiar por separado.

Mediante este procedimiento reducimos el problema completo a uno equivalente

unidimensional que nos permitirá simplificar la representación (para procedimien-

tos de este tipo ver [7]). Así, para θ podemos escribir el sistema dinámico3

ω = − I2γ

a Jcosθω +

MgJ

senθ

θ = ω

(3.5)

con −π < θ ≤ π , −∞ < ω < ∞ . Mientras que, además, ψ debe verificar la

ecuación de vínculo (3.1). De esta forma, el sistema (3.5) nos permitirá resolver la di-

námica y encontrar θ(t), y mediante la ecuación (3.1) obtendremos ψ = f [θ(t), θ(t)],a partir de la cual resolveremos4 el sistema completo hallando ψ(t).

Sin embargo, sin conocer las soluciones exactas del sistema, aún podemos inferir

algunas características del comportamiento del sistema en algunos puntos de inte-

rés. En particular, en la siguiente sección aplicaremos conceptos de análisis lineal de

sistemas dinámicos (ver por ejemplo [11]) –y que ya utilizamos en §2.2.1– que nos

permitirá caracterizar el sistema a primer orden.

3.1.1. Análisis lineal

Analizando el sistema (3.5), encontramos que sus únicos puntos fijos son

(θ, ω) ≡ O = (0, 0)3En (3.5) se redujo el orden de la ecuación (3.2) gracias a la introducción de la variable ω.4La resolución de las ecuaciones de movimiento se realizó por métodos numericos discretizando

el tiempo.

25


(θ, ω) ≡ Π = (π , 0)

Luego, la dinámica a primer orden de θ en torno de estos puntos fijos podemos

escribirla, en forma matricial, como(

θ

ω

)= J

(θ

ω

)(3.6)

Donde J será la matríz Jacobiana del sistema dado por (3.5) en cada uno de los

puntos fijos:

JO =

0 1

−M gJ

+I2 γ

a J

, JΠ =

0 1M g

J− I2 γ

a J

(3.7)

Cuyos autovalores λO y λΠ en los puntos O y Π respectivamente, resultan

λO = − I2 γ

2 a J±

√(I2 γ

2 a J

)2

− M gJ

λΠ =I2 γ

2 a J±

√(I2 γ

2 a J

)2

+M g

J

(3.8)

Así, a partir del estudio de las ecuaciones (3.8), es posible elegir los valores de

los parámetros a y γ a fin de obtener diferentes comportamientos del sistema en las

cercanías de los puntos fijos, completando posteriormente el análisis globalmente

mediante simulación numérica. En particular, con vistas al control cuasi-global del

sistema requerimos que el punto O sea un atractor (y además que la cuenca de

atracción sea casi todo el espacio de fases). Consideremos el caso particular en el

que O es un foco estable.

A partir del análisis de autovalores para este punto encontramos que para obte-

ner un foco estable, a y γ deben verificar

γI2

2aJ> 0 ,

(γ I2

2aJ

)2

+Mg

J< 0 ,

Los conjuntos de puntos que verifican estas condiciones junto con la ecuación

(3.4) se calcularon numericamente y se muestran en la Figura 3.1. Para realizar este

gráfico hemos definido I = I2/Ieq1 y consideramos el caso donde Mg/I2 = 1 · s−1. En

la figura indicamos la zona del espacio de parámetros (a, γ, I) del sistema para los

26


cuales O es un foco estable. Todos los puntos que se muestran en la figura verifican

las condiciones de estabilidad, pero para encontrar los parámetros que permiten

el control Cuasi-Global debemos, además, analizar el comportamiento global del

sistema y determinar la cuenca de atracción de O.

γ[s−1]

I a

γ[s−1]

0

-0.5

-1

3020

100

0.50

Figura 3.1: Parámetros a, I, γ que determinan un foco estable en O.

En particular si elegimos a = 0,1; I = 1/2; γ = −0,3 para Mg/I2 = 1, encontra-

mos que la cuenca de atracción del punto O es efectivamente casi todo el espacio de

fases, ver Figura 3.2. En este caso encontramos que el punto Π (que se muestra por

duplicado a ambos lados de la figura para mayor claridad), es del tipo ensilladura

(Ver [11]).

-π 0 πθ

-1

-0.5

0

0.5

1

ω [s

-1]

Figura 3.2: Retrato del sistema en el espacio de fases. Control Cuasi-Global.(a = 0,1; I = 1/2; γ =

−0,3).

27


Para completar las condiciones que garantizan el control Cuasi-Global que men-

sionamos al comienzo de este capítulo, debemos analizar las órbitas más lejanas del

sistema. Para esto realizamos el diagrama en el espacio de las fases que se muestra

en la Figura 3.3. Allí se muestra un retrato de fases extendido donde observamos la

evolución del sistema para condiciones iniciales lejanas5.

-10π 0 10πθ

-2

0

2

ω [s

-1]

Figura 3.3: Retrato de fases extendido. Control Cuasi-Global.(a = 0,1; I = 1/2; γ = −0,3).

Mediante el vínculo propuesto logramos el control Cuasi-Global del sistema. Sin

embargo, los parámetros elegidos para esto responden sólo al caso particular don-

de Mg/I2 = 1 · s−1. Es decir, los parámetros a y γ encontrados dependen de las

características físicas del sistema (como son M ,I2 e Ieq1 ).

A fin de independizarnos de estas constantes físicas características buscaremos

una formulación alternativa para las ecuaciones (3.8), de forma tal que el análisis

resulte más general.

3.1.2. Adimensionalización

En la sección anterior encontramos ecuaciones –como la ecuación (3.8)– a par-

tir de las cuales podemos elegir los conjuntos de parámetros de control (γ, a) que

determinen el comportamiento buscado del sistema. Sin embargo, la descripción

de las condiciones de estabilidad resulta engorrosa (ver Figura 3.1 ), por esto aho-

5Consideramos condiciones iniciales lejanas a aquellas para las cuales el sistema realiza varios

giros completos antes de converger al punto O. En particular, se alcanzó a observar (numericamente)

sistemas que convergen luego de 18 giros completos.

28


ra nos dedicaremos a realizar una adimensionalización a fin de poder generalizar

estos resultados y escribirlos, además, en forma más compacta. De esta manera se

determinarán conjuntos en el espacio de parámetros adimensionales del sistema,

independientes de las contantes del mismo –como ser: masa, geometría, etc.– para

los cuales el comportamiento del sistema en los puntos fijos es –a primer orden– del

mismo tipo6. En otras palabras, se indicarán los parámetros que deben ajustarse a

fin de conseguir el comportamiento buscado independientemente de las constan-

tes físicas del sistema. En consecuencia: Sistemas diferentes, con los mismos parámetros

adimensionales, se comportarán de manera equivalente.7

En resumen, el objetivo de este análisis es encontrar una caracterización simple

del espacio de parámetros adimensionales del sistema, identificando zonas donde

el sistema tenga un comportamiento similar.

Comencemos, entonces por adimensionalizar las ecuaciones (3.5) que dan origen

a la dinámica general del sistema. Definimos para esto la variable t que llamaremos

tiempo adimensional8

t =tτ

, (3.9)

donde

τ =

√Ieq1

M g. (3.10)

Luego, derivando la ecuación de vínculo (3.1) respecto de t, encontramos

dθdt

+ adψ

dt= Γ senθ , (3.11)

con

Γ = γτ (3.12)

Entonces ahora, reescribamos las ecuaciones de Euler-Lagrange (ver deducción

6Ver descripcion de los diferentes tipos de puntos fijos en [11].7Adimensionalmente los sistemas deben responder a las mismas ecuaciones diferenciales y de

vínculo.8 La adimensionalización del tiempo es simplemente un cambio de escala, ver (3.9): Este procedi-

mento genera un tiempo característico del sistema: τ .

29


en ApéndiceA.2) en estos nuevos términos

d2θ

dt2+ I

(d2θ

dt2+

d2ψ

dt2

)− senθ = fθ

I(

d2θ

dt2+

d2ψ

dt2

)= fψ

(3.13)

donde el único parámetro adimensional propio del sistema es

I =I2

Ieq1

, (3.14)

y donde las fuerzas adimensionales fθ y fψ las definimos 9:

fθ =fθ

M gfθ =

fθM g

(3.15)

Así, derivando (3.11) respecto a t y reemplazando d2ψ/dt2 en (3.13), la ecuación

(3.5) puede escribirse

dω

dt=− IΓ

a cosθω + senθ

I(1− 1

a)+ 1

dθdt

= ω

(3.16)

donde a debe verificar la siguiente condición10:

a 6= II + 1

(3.17)

A fin de simplificar la descripción del espacio de parámetros, definamos los si-

guientes parámetros adimensionales (ver demostración de la validez de la recoordi-

nización del espacio de parámetros en el Apéndice E):

ε =1

I(1− 1

a)+ 1

(3.18)

2∆ =Γ

a(

1 + 1I

)− 1

(3.19)

9La ecuación (3.15) no modifica la ecuación (A.4), por lo tanto el vínculo variacional permanece

definido por la ecuación (A.5).10Notar que la ecuación (3.17) es simplemente la adimensionalización de (3.4).

30


De forma que podemos reescribir las ecuaciones (3.16) de la siguiente manera:

dω

dt= −2∆cosθω +ε senθ

dθdt

= ω

(3.20)

Luego, las matrices (3.7) producto del análisis lineal, resultan

JO =

(0 1

−ε +2∆

)JΠ =

(0 1

ε −2∆

), (3.21)

cuyos autovalores [ver forma dimensional (3.8)] en los ptos. O y Π respectivamente,

sonλO = −∆±√∆2 +ε ,

λΠ = ∆±√∆2 −ε .(3.22)

En las ecuaciones (3.22) vemos que sólo intervienen los parámetros ∆ y ε, pu-

diendose representar los difentes comportamientos del sistema –a primer orden–

mediante estas dos únicas cantidades. Es decir, de los tres parámetros del sistema

(∆, ε, I) la dinámica depende exclusivamente de los parámetros de control (∆, ε).

Con esta descripción del espacio de parámetros, las condiciones que determinan

las zonas de comportamientos de interés del sistema podrán ser descritas median-

te sólo dos parámetros: ∆ y ε. Analicemos el comportamiento del sistema ante la

modificación de estos parámetros.

En el nuevo espacio de parámetros adimensionales (∆,ε), encontramos, a par-

tir del análisis lineal alrededor de los puntos O y Π, 8 tipos de comportamiento

bien diferenciados. Estas zonas de estabilidad11 se muestran en la Figura 3.4 y están

separadas por las ecuaciones

∆ = 0 ε = o ε = ∆2 ε = −∆2 (3.23)

11Llamamos zonas de estabilidad a aquellas para las cuales el sistema tiene el mismo tipo de com-

portamiento lineal alrededor de ambos puntos fijos.

31


-1 0 1ε-1

0

1

∆

-1 0 1-1

0

1

1

2 3

4

5

67

8

Zona O Π

1 foco estable ensilladura

2 nodo estable ensilladura

3 ensilladura nodo inestable

4 ensilladura foco inestable

5 ensilladura foco estable

6 ensilladura nodo estable

7 nodo inestable ensilladura

8 foco inestable ensilladura

Figura 3.4: Zonas de estabilidad en el espacio de parámetros adimensionales (∆, ε).

En la Figura 3.4 se resumen los resultados de los análisis lineales dentro de ca-

da zona. Notemos cómo hemos logrado simplificar las condidiones de estabilidad

mediante esta elección de parámetros. Comparemos la Figura 3.1 (para la cual re-

querimos tres parámetros) y su versión adimensional en la Zona 1 de la Figura 3.4

(con sólo dos parámetros).

En particular, las inecuaciones que garantizan la existencia de un foco estable en

la posición superior (Zona 1), se escriben ahora de la siguiente manera:

−∆2 > ε ε < 0 ∆ > 0 (3.24)

-π -π/2 0 π/2 πθ

-4

0

4

ω ^

Figura 3.5: Retrato del sistema en el espacio adimensional de fases. Control Cuasi-Global en la Zona

1, (∆ = 1, ε = −2).

Esta condición particular, resulta de interés porque al validar numericamente los

32


resultados del análisis lineal, no sólo se verifica la estabilidad del punto O, sino que

además no se encuentran órbitas que no converjan a él. Esta situación se muestra pa-

ra la Zona 1, en la Figura 3.5 donde reproducimos adimensionalmente los resultados

de la Figura 3.2. Numéricamente, observamos que para condiciones iniciales muy

alejadas de los puntos fijos (ω >> θ)12, el sistema evoluciona hacia O convergiendo

finalmente a este punto (ver Figura 3.6).

2π0 4πθ

0

5

10

ω

^

Figura 3.6: Retrato de fases extendido. Control Cuasi-Global en la Zona 1, (∆ = 1, ε = −2).

–Notar que en esta figura no consideramos −π < θ ≤ π . A fines esquemáticos

hemos violado esta restricción teniendo en cuenta de esta forma el número total de

giros acumulados. Vemos en la figura que, dependiendo de la velocidad inicial ω,

el sistema podrá, en general, realizar varios giros antes de converger al punto O.–

En base a los resultados obtenidos en las simulaciones numéricas y el análisis li-

neal previo conluimos que eligiendo los parámetros adimensionales ∆ = 1 y ε = −2

conseguimos el Control Cuasi-Global del sistema. Cabe mensionar que aunque no es-

temos en presencia de esta clase de control, habiendo ensayado la evolución para

condiciones iniciales tan extremas, podemos asegurar que siempre que las velocida-

des no excedan cierto límite, todas las órbitas convergerán al punto O –condición

factible en la implementación práctica–.

Por otra parte, analizando la estabilidad de los puntos fijos encontramos que

para ∆ = 0 ocurre una bifurcación en los puntos O si ε < 0, ó Π si ε > 0, ver Figura

3.7. En esta figura observamos, para el punto O, la modificación de su carácter de

12En particular, esta condición se evaluó en la simulación para ω = 100.

33


-π -π/2 0 π/2 πθ

-5

0

5

ω

^

(a) ∆ = 0, 1 ε = −4

-π -π/2 0 π/2 πθ

-5

0

5

ω

^(b) ∆ = −0, 1 ε = −4.

-π 0 ππ/2-π/2θ

-5

0

5

ω

^

(c) ∆ = 0, 0 ε = −4.

Figura 3.7: Bifurcación en ∆ = 0 –pasaje de la zona 1 a la 8.–

atractor a repulsor, al pasar el parámetro ∆ por la semirecta ∆ = 0, ε < 0. Es decir,

vemos la transición entre las zonas 1 y 8.

El conocimientos de estos límites de los parámetros adimensionales para los cua-

les se modifica el comportamiento del sistema, resulta se suma utilidad a la hora de

elegir los valores de ∆ y ε para realizar el control, ver [1]. Conocer estos puntos de

bifurcación nos permitirá elegir los parámetros del sistema suficientemente alejados

de estos, de forma que si durante el funcionamiento del sistema alguna carácterís-

tica física se modifica (por ejemplo por calentamiento, desgaste, etc.) no se corra el

riesgo de que el sistema se comporte –cualitativamente– en forma diferente al pasar

de una zona a otra.

34


La otra condición para la cual podríamos conseguir el control Cuasi-Global del

sistema es aquella donde O en un nodo estable (Zona 2 de la Figura 3.4). En este caso

deberán verificarse

∆2 > −ε ε < 0 ∆ > 0 (3.25)

-π π0θ

-5

0

5

ω

^

Figura 3.8: Retratos de fases. Control Cuasi-Global en la Zona 2.(∆ = 2, ε = −1).

Nuevamente, al tomar condiciones iniciales lejanas13 no encontramos órbitas que

no converjan, finalmente, al punto O. Pudiendose entonces, diseñar una estretegia

de control Cuasi-Global en la Zona 2 tomando ∆ = 2 y ε = −1.

Otro caso interesante, aunque escapa a los objetivos generales del capítulo, es el

caso de conseguir un foco inestable en el punto Π. Esta situación corresponde a la

Zona 4 del diagrama de estabilidades. La ventaja de esta elección de parámetros, es

conseguir que las órbitas se alejen del punto fijo inferior Π lentamente. En la Figura

3.9 se muestra el retrato de fases para una situación de este tipo.

Este tipo de control local puede resultar útil para alejar el péndulo del punto de

reposo natural Π y en combinación con otra estrategia local completar el control

en el caso en que no se cuente con la potencia necesaria para la implementación de

alguna de las dos técnicas de control Cuasi-Global aquí presentadas. Analicemos,

como ejemplo, las fuerzas necesarias para llevar el péndulo a θ = π/2 con una ve-

locidad ω ≈ 4 mediante el control Cuasi-Global propuesto para la Zona 2 (∆ = 2

ε = −1) y utilizando el método de control local para la Zona 4 que se muestra en

13Se ensayaron condiciones iniciales para las cales el sistema realiza 15 giros completos antes de

converger a O

35


-π 0 πθ

-5

0

5

ω

^

Figura 3.9: Retratos de fases. Control local en Π, Zona 4. (∆ = 1, ε = 2).

la Figura 3.9(∆ = 1, ε = 2). Partiendo de las mismas condiciones iniciales encontra-

mos que ambos sistemas alcanzan θ = ±π/2 en condiciones similares14. Luego para

estas dos situaciones de efecto comparable –situaciones iniciales y finales similares–

encontramos que la fuerza fψ necesaría en cada cada caso es notoriamente diferente.

En particular, para la estrategia de control local en Π [Figura 3.10(b)] la fuerza má-

xima requerida resulta ser casi la mitad15 que la requerida en la evolución controlada

cuasi-globalmente [Figura 3.10(b)].

Gracias a la elección de parámetros adimensionales ∆ yε fue posible describir las

condiciones de estabilidad de forma realmente sencilla. Sin embargo, este espacio

de parámetros no nos servirá a la hora de la implementación práctica. Para esto el

procedimiento que debemos seguir es el siguiente:

Elegir el comportamiento que se quiere para el sistema.

Identificar la zona del diagrama de estabilidad a la que corresponde la diná-

mica buscada, ver figura 3.4.

Elegir los parámetros adimensionales (∆,ε) en esa zona.

Finalmente, reescribir estos parametros adimensionales en su forma dimensio-

14El sistema de la Figura 3.10(a) alcanza θ = ±π/2 con ω = −4,50, mientras que el que se muestra

en la Figura 3.10(b) alcanza este ángulo con ω = 3,94. Al analizar estas dos órbitas debemos tener en

cuenta la antisimetría del sistema en O y Π15La fuerza máxima en la Figura 3.10(b) es f max

ψ = −5,52, mientras que en la Figura 3.10(a) se tiene

f maxψ = 10,36.

36


ππ/2

-4

-2

0

ω

^

ππ/2θ

-10

0

10

f ψ

(a) Zona 2 (∆ = 2 ε = −1)

-π/2π

0

2

4

ω

^

-π/2πθ

-10

0

10

f ψ

(b) Zona 4 (∆ = 1 ε = 2)

Figura 3.10: Comparación de fuerzas necesarias para alejar el sistema de la posición Π. Condiciones

iniciales: θ = 3,16, ω = −0,1.

nal, a partir de las carácterísticas particulares del sistema (de las que depende

I), mediante las transformaciones16:

a =ε

ε(

I + 1)− 1

γ · τ =2∆/ I

ε(

I + 1)− 1

(3.26)

Determinados los parámetros de control del sistema a y γ –que determinan Ck–,

nos resta calcular la acción de control u. Será esta función la que determine las fuer-

zas de vínculo necesarias para implementar el vínculo que controle el sistema.

16Ver validez de la transformación de parámetros del sistema en E

37

3. CONTROL CUASI-GLOBAL Control del péndulo con carro

3.1.3. Señal de Control

La señal de control u se calcula siguiendo el procedimiento general que ya des-

cribimos en §1.5. Recordemos que para este caso particular el vínculo variacional

determina

fθ = 0 , (3.27)

y por lo tanto, eligiendo17 vθ = 0 y vψ = 1 obtenemos:

fψ ≡ u =γ I2 Ieq

1Ja

cosθ θ +(

1− 1a

)MgI2

Jsenθ . (3.28)

Esta última ecuación nos dará la forma funcional de la señal de control u(θ, θ)que debemos implementar, para la cual será necesario medir sólo el ángulo θ del

pendulo y su velocidad ω. Es decir, para el control a lazo cerrado tendremos las

variable controlada θ y la variable manupulada fψ (ver [14]).

O′

θ

O

ψ

fψ

(θ, θ)

fψ = u

ufθ = 0 (3.28)

u(θ, θ)

(3.2) (θ, θ; ψ, ψ)

Figura 3.11: Diagrama de bloques esquemático para el control a lazo cerrado del péndulo con disco.

3.2. Control del péndulo con carro

Retomemos el sistema del péndulo con carro. En §2.2, ya discutimos el problema

del control de este sistema localmente. Sin embargo, ninguno de los vínculos cine-

máticos que presentamos allí nos ha permitido controlar el sistema con una cuenca17Recordemos que a partir de la definición de la acción de control que dimos en el Capítulo 2, las

fuerzas de vínculo en este caso resultan: fθ = vθu y fψ = vψu.

38


de atracción para el punto O lo suficientemente grande como para ser considerado

en esta sección.

Analicemos, entonces, los efectos del vínculo variacional. Modificando el Cv pro-

puesto en §2.2, consideremos ahora el siguiente vínculo18:

Cv : fθ + c fx = 0, c δθ− δx = 0 . (3.29)

Que combinamos con el vínculo cinemático

Ck : θ + ax = γ senθ , (3.30)

que derivado respecto al tiempo resulta

θ + ax = γ cosθθ . (3.31)

Luego, para calcular las ecuaciones de movimiento seguiremos el procedimiento

general que se describe en el Apéndice B, mediante el cual obtenemos el sistema de

ecuaciones (B.4)

(mx + m l

2 senθθ2 −m l

2 cosθθ)

δx +

+(

I0θ−m l2 cosθx−mg l

2 senθ)

δθ = 0

fxδx + fθδθ = 0

Reemplazando el vínculo variacional (3.29) en este sistema de ecuaciones, elimina-

mos las fuerzas y se obtiene una ecuación diferencial de segundo orden en θ y x.

Pero, si además utilizamos la ecuación (3.31) puede eliminarse x, y mediante la in-

troducción de la nueva variable independiente ω = θ se consigue reducir el orden

de las ecuaciones de Euler-Lagrange, que ahora podemos escribir,

ω = −ω2csenθ

J(a,c,θ)−ω

γ

acosθ

J(a,c,θ)

(2cl− cosθ

)+ g

senθ

J(a,c,θ)

θ = ω

(3.32)

donde definimos

J(a,c,θ) =2I0

ml− 2c

al+

(1a− c

)cosθ . (3.33)

18Aquí debemos tener en cuenta que aunque se implementa torque en el eje y fuerza sobre el carro,

el sistema sigue siendo sub-actuado ya que se debe verificar la condición (3.29). Es decir, la ecuación

(3.29) sólo determina el subespacio F al que pertenece f = ( fθ , fx). Ver Apéndice B, en particular la

discución sobre este caso en §B.1

39


Del sistema dinámico autónomo (3.32) deducimos inmediatamente, que si se quiere

ω < ∞ ∀θ ⇒ J(a,c,θ) 6= 0 ∀θ sii:∣∣∣∣2I0

ml− 2c

al

∣∣∣∣ >

∣∣∣∣1a− c

∣∣∣∣ . (3.34)

Como ya vimos en §3.1.2, a fin de generalizar los resultados que obtengamos

en esta sección, puede resultar conveniente reportarlos adimensionalmente. En esta

opotunidad, y teniendo como precedente el desarrollo realizado en §3.1.2, proceda-

mos directamente al análisis del sistema adimensional.

3.2.1. Adimensionalización

Para adimensionalizar la dinámica del sistema del péndulo con carro, definamos

las variables

t =tτ

x =x

`/2, (3.35)

donde

τ =

√2I0

mg`. (3.36)

Las fuerzas generalizadas adimensionales

fθ = fθτ2

I0y fx = fx

τ2

m`. (3.37)

Y los parámetros adimensionales

α = a`

2y Γ = γτ . (3.38)

Así, el sistema (3.32) tendrá su forma adimensional

dω

dt= −ω2 c

Jsenθ− ω

Γ

Jαcosθ

(c− Icosθ

)+

senθ

Jdθdt

= ω

(3.39)

donde

I =m(`/2)2

I0y J = 1− c

α+ cosθ

(Iα− c

). (3.40)

Notemos que la dinámica adimensional (3.39) depende de c,α, Γ , I, donde I es el

único parámetro característico del sistema.

40


3.2.2. Análisis lineal

En esta sección procederemos de manera análoga al desarrollo realizado en §3.1.1.

Así, del análisis del sistema (3.39), encontramos que sus únicos puntos fijos son

O ≡ (θ, ω) = (0, 0)

Π ≡ (θ, ω) = (π , 0)

Luego, linealizando el sistema (3.39) en cada uno de estos dos puntos se obtienen

las siguientes matrices Jacobianas:

JO =

0 11

jo

AO

jo

JΠ =

0 1

− 1

jπ

AΠ

jπ

donde

jo = J(α,c,θ=0) = 1− cα

+

(Iα− c

), jπ = J(α,c,θ=π) = 1− c

α−

(Iα− c

)(3.41)

y

AO =Γ

α

(I − c

), AΠ =

Γ

α

(I + c

). (3.42)

Resulta de particular inrterés, a los efectos del control Cuasi-Global, analizar las

condiciones que hacen de O un foco estable19. Del análisis de los autovalores de la

matriz jacobiana de este punto, encontramos que para que se dé este caso, los pará-

metros α, c, Γ , I deben verificar

AO jo < 0 y(

AO

2 jo

)2

+1jo

< 0 , (3.43)

donde jo y AO fueron definidos pos las ecuaciones (3.41) y (3.42) respectivamente.

Resulta importante destacar que, a diferencia de los casos tratados en §2.2, las

ecuaciones (3.34) y (3.43) son compatibles y determinan un subconjunto en el espacio

de parámetros (α, c, Γ) dentro del cual O es un foco estable y no hay singularidades en

las ecuaciones20, ver Figura 3.12. Analicemos, como ejemplo particular, la elección

19Ver [11].20Recordemos que los parámetros adimensionales para este caso son cuatro, de forma que la Figura

3.12es una vista (en 2D) de la proyección de la zona del espacio en cuestión (4D) sobre el hiperplano

I = 1 (3D).

41


Γ

cα

Γ

0

-1

50

-510

-1

Figura 3.12: Zonas del espacio de parámetros adimensionales del sistema α, c, Γ , con I = 1, para las

cuales O es un foco estable.

de parametros (α; c; Γ) = (0,8; 3; −0,4), correspondiente a uno de los puntos de

esta figura.

Numericamente, encontramos que para diferentes condiciones iniciales el siste-

ma evoluciona siempre hacia el punto O, ver Figura 3.13. Al igual que en el caso del

disco de inercia, medimos la cuenca de atracción de este punto tomando condiciones

iniciales lejanas21 a O.

-π 0 πθ

-2

0

2

ω

^

Figura 3.13: Retrato de fases resultante de la técnica de Control Cuasi-Global para el péndulo con

carro con(α; c; Γ) = (0,8; 3; −0,4).

21Consideramos condiciones iniciales lejanas a aquellas que generan órbitas que realizan varias

(más de 2) vueltas completas.

42


Encontramos así, que para todas las condiciones iniciales ensayadas el sistema

converge uniformemente al punto O, como se muestra en el retrato de fases exten-

dido de la Figura 3.14.(Ver definición convergencia uniforme en [11]).

-10π 0 10πθ

-20

0

20

ω

^

Figura 3.14: Retrato de fases extendido. Control Cuasi-Global para el péndulo con carro con

(α; c; Γ) = (0,8; 3; −0,4).

Alternativamente, aquí presentamos, aunque claramente escapa a los objetivos

del capítulo, el caso de control local en Π. Al igual que en §3.1, mostramos este caso

ya que, como se discutió en esa sección, puede resultar de interés al implementar

una técnica de control local con fuerzas limitadas. En particular, en la Figura 3.15

presentamos las zonas del espacio de parámetros (para I = 1) donde se tiene un foco

inestable en Π.

En esta ocación, nos limitamos sólo a mensionar el hecho que mediante el vínculo

propuesto [ver ecuaciones (3.29) y (3.30)] también se puede lograr un control local

en Π para el péndulo con carro. Obteniendo órbitas como las que se muestran en

la Figura 3.16. Para realizar esta figura, también utilizamos un código similar al que

se muestra en al Apéndice F.2, eligiendo como parámetros uno de los puntos de la

Figura 3.15: (α; c; Γ) = (3; 1/2; 1).

Otra condición que resulta de particular interés a fines de lograr el control Cuasi-

Global, es aquella donde O es un nodo estable(Ver definición en [11]). Para que esto

suceda, analizando los autovalores del sistema linealizado alrededor de O, encon-

tramos que deben verificarse

AO jo < 0 0 >1jo≥ −

(AO

2 jo

)2

. (3.44)

43


Γ

50

-53

0-3

-6

Γ

10

5

0

-5

c α

Figura 3.15: Zonas del espacio de parámetros adimensionales del sistema α, c, Γ , para las cuales Π es

un foco inestable.

-π 0 πθ

-2

0

2

ω

^

Figura 3.16: Retrato de fases resultante de la técnica de Control local en Π para el péndulo con carro

con (α; c; Γ) = (3; 1/2; 1) y para I = 1.

44


De las ecuaciónes (3.44) y (3.34), encontramos que existe, nuevamente, un con-

junto de parámetros adimensionales que verifica ambas. Deducimos entonces, que

es posible encontrar un vínculo para el cual las ecuaciónes no tengan divergencias y

además el punto O resulte un nodo estable.

Γ

cα

Γ

0

-1

50

-510

-1

Figura 3.17: Zonas del espacio de parámetros del sistema α, c, Γ , para las cuales O es un nodo estable

(I = 1).

En la Figura 3.18, se muestra el retrato de fases correspondiente a una elección de

parámetros que verifica estas condiciones. Numéricamente, encontramos para este

caso particular, que la cuenca de atracción del punto O parecería ser todo el espacio

de fases excluyendo la subvariedad estable de la ensilladura en Π. Nuevamente, pa-

ra condiciones iniciales cada vez más alejadas de los puntos fijos, encontramos que

el sistema evoluciona indefectiblemente hacia O. Entonces, en vistas de la evidencia

proporcionada por la simulación suponemos que los vínculos propuestos controlan

Cuasi-Globalmente el sistema (tal como discutimos al comienzo de este capítulo).

Si bien escapa a los objetivos de esta sección, otra forma de control Cuasi-Global

que podemos mencionar, es la estabilización de una órbita en lugar de un punto fijo

(ver, por ejemplo, [15]). En particular, para los vínculos propuestos encontramos que

si, por ejemplo, se toma (α; c; Γ) = (−0,4; −1; 1) hallamos un ciclo límite atractor,

como se muestra en la Figura 3.19. Allí ejemplificamos la estabilización Cuasi-Global

de una órbita –ya que para todas las condiciones iniciales probadas el sistema tiende

a esta situación–. Para este caso particular, en lugar de converger todas las órbitas

el punto O, lo hacen a un ciclo límite del sistema. Para esta elección de parame-

45

3. CONTROL CUASI-GLOBAL Señal de Control

-π 0 πθ

-0.5

0

0.5

ω

^

Figura 3.18: Retrato de fases (α; c; Γ) = (0, 2; 4; −0, 7).

tros de control α, c y Γ , econtramos que asintóticamente el péndulo realizará giros

completos independientemente de cual fue la condición inicial de la que se partió.

–Hablamos de control Cuasi-Global debido a que la subvariedad estable asociada a

la ensilladura en el punto Π es el único conjunto que queda fuera de la cuenca de

atracción de este ciclo límite.–

0 10π 20π 30πθ

0

10

ω

^

Figura 3.19: Retrato de fases para la técnica de Control Cuasi-Global propuesta aplicada la estabili-

zación de órbita.(α; c; Γ) = (−0,4; −1; 1).

3.3. Señal de Control

Por otra parte, si en lugar de eliminar las fuerzas de las ecuaciones (2.1) se elimi-

na una de las coordenadas y sus derivadas utilizando las ecuaciones (3.29) y (3.30)

46

3. CONTROL CUASI-GLOBAL Señal de Control

–siguiendo el procedimiento general que mostramos en §1.5– se puede escribir la la

fuerza necesaria para implementar el vínculo virtual impuesto al sistema en función

de una sola de las coordenadas. Esta formulación resulta de interés a la hora de la

implementación del control a lazo cerrado. Identificando u ≡ λ (como vimos en el

Capítulo 2) en la ecuación (3.29) se tiene

fx = u

fθ = −cu

con

u =`/2

J(a,c,θ)senθ

(aI0 + m

`

2cosθ

)θ2 + (3.45)

+γm

J(a,c,θ)

[I0 −

(m

`

2cosθ

)2]

θ−

− mg`/2J(a,c,θ)

senθ

(a`

2cosθ− 1

)

donde J(a,c,γ) fue definido en la ecuación (3.33).

Notemos que además estas fuerzas ( fx, fθ) resultan acotadas, gracias a la ecuación

(3.34) que asegura que el denominador de cada término de la ecuación (3.45) es

distinto de cero para todo θ.

Luego, eligiendo las coordenadas generalizadas θ y z = −cθ + x (ver Apéndice

B.1), tenemos que θ es la variable controlada, mientras que z es la variable manipulada

(ver [14]).

47

fz

(θ, θ)

fz = u

ufy = 0 (3.45)

(θ, θ; x, x)xO

O′θ

(3.32)

u(θ, θ)

Figura 3.20: Diagrama de bloques esquemático para el control a lazo cerrado del péndulo con carro.

Capítulo 4

Contraste con Otros Métodos de

Control

4.1. Comparación con los métodos de control lineal con-

vencionales a lazo cerrado

A continuación relizaremos una comparación entre el método de control por

vínculos virtuales lineales y los métodos lineales convencionales.

Para esto, consideremos un sistema mecánico subactuado con n grados de liber-

tad (coordinizado por qi) y con n fuerzas externas1 fi, con 1 ≤ i ≤ n (pudiendo ser

nulas algunas de estas fuerzas).

Los métodos convencionales que analizaremos son aquellos que consisten en la

implementación de una acción de control u ∈ Rm –con m < n por ser subactuado2–

a partir del análisis del comportamiento del sistema linealizado a primer orden al-

rededor del punto de equilibrio O. En estos casos, la acción de control es además

lineal en las coordenadas y en la velocidad del sistema. Es decir cada componente

de u = (u1, . . . , um) es

ui = K1i jq

j + K2i jq

j, (4.1)

con 1 ≤ i ≤ m, 1 ≤ j ≤ n, donde K1i j = (K1)i j y K2

i j = (K2)i j pueden ser pensados

como elementos de matrices de K1,K2 ∈ Rm×n.1Sobre las fuerzas generalizadas externas es que actua la acción de control u, es decir fi = fi(u)2Ver Apéndice D.1

49

4. CONTRASTE CON OTROS MÉTODOS DE CONTROL Métodos lineales

Los métodos que cuadran en esta categoría son todos aquellos reductibles a una

representación de espacio-estado, como ser el control proporcional, el control Derivativo

y los métodos del lugar geométrico de las raices (de Ackerman, Graham & Lauthrop,

etc.), entre otros (ver [6] y [14]).

En esta sección mostraremos algunas condiciones a partir de las cuales es posi-

ble diseñar una familia de vínculos virtuales lineales tales que el sistema mecánico

linealizado resultante sea equivalente al generado por los métodos convencionales

considerados. Además mostraremos, constructivamente, como elegir este vínculo.

Consideraremos que tanto el Lagrangiano L como el subespacio F al que per-

tecen las fuerzas 3son los mismos para ambas representaciones.

Las ecuaciones de Euler-Lagrange para cada una de las dos representaciones son

ddt

(∂

∂q j L

)− ∂

∂q j L = vijui , (4.2)

ddt

(∂

∂q j L

)− ∂

∂q j L = vijλi , (4.3)

para el caso de control convencional o por vínculos virtuales, respentivamente.

Linealizando la ecuación (4.3) en el punto de equilibrio4 O = (q, q) = (0, 0),

resulta (ver [7])

Mq +Aq = Vλ (4.4)

donde M, A ∈ Rn×n, V ∈ Rn×m, λ ∈ Rm y q, q representan pequeños despla-

zamientos en la aceleración y la posición respectivamente, que pueden entonces,

pensarse como pertenecientes a Rn.

Consideremos además la implementación de los vínculos lineales w = 0, con

w : Rn ×Rn → Rm tal que

w(q, q)i = J1i jq

j + J2i jq

j − Ci , (4.5)

con 1 ≤ i ≤ m, 1 ≤ j ≤ n, Ci ∈ R y donde J1i j, J2

i j ∈ R son elementos de las matrices

incógnitas J1 y J2, respectivamente. Luego, derivando (4.5) y reemplazando q de

3Se considera que para los dos sistemas [(L , u) ó (L , Ck)] se tiene el mismo acceso al sistema: se

implementa el control mediante los mismos actuadores mecánicos los que determinan F .4El análisis se realiza sólo en las cercanías del punto de equlibrio, ya que los métodos tradicionales

son diseñados a partir del comportamiento del sistema en esta zona.

50

4. CONTRASTE CON OTROS MÉTODOS DE CONTROL Métodos lineales

(4.4)dwdt

= J1q + J2M−1 (Vλ−Aq) = 0Rm . (4.6)

Así, ya que para ambos modelos se tienen los mismos vínculos variacionales (Cv),

escribimos las fuerzas generalizadas: f j = vi jui para los métodos convencionales y

f ′j = vi jλi para el método de vínculos virtuales. De forma que, para conseguir el

mismo sistema ( L ,Cv,f ), debe verificarse

λi = ui ,

para 1 ≤ i ≤ m. Así, reemplazando la ecuación(4.1) en (4.6), resulta el siguiente

sistema de ecuaciones para los elementos de J1 y J2 :

J1q + J2M−1 (VK1q +VK2q−Aq) = 0Rm ∀(q, q) ∈ Rn ×Rn .

Luego, considerando la ecuación anterior válida para todo5 (q, q), resultan las

ecuaciones

J1 + J2M−1VK2 = 0Rm×n , (4.7)

J2C = 0Rm×n ,

donde

C =M−1 (VK1 −A) .

Transponiendo ambos miembros tenemos

C>J>2 = 0Rn×m (4.8)

Sea, F =< f > el espacio generado por las fuerzas generalizadas de control

–o de vínculo– (ver Apéndice D.1), tal que dim(F ) = m (es decir, [K1K2] de rango

completo). Luego, como vimos en §1.5 para poder obtener las fuerzas de vínculo

es necesario contar con m ecuaciones de vínculo independientes6. Como w(q, q) =[J1J2] [qq]>, será necesario que

rango[J1J2] = m .

5Se piden condiciones válidas para todo (q, q), pero bastaría con considerar (q, q) ∈ TQ, ver [8].6En otras palabras, dim(F ) + dim(w−1(0)) = dim(TQ)⇒ dim(w−1(0)) = 2n−m.

51

4. CONTRASTE CON OTROS MÉTODOS DE CONTROL Métodos energéticos

En particular, si rango(J2) = m se verifica automaticamente la ecuación anterior

independientemente de J1. Luego, teniendo en cuenta la ecuación (4.8) –y conside-

rando queM es de rango completo–, encontramos que

rango (VK1 −A) = n−m⇒ rango(C) = n−m⇒ rango(J2) = m

Así, una condición suficiente es:

rango (VK1 −A) = n−m (4.9)

Destaquemos que la ecuación anterior –aunque quizas excesivamente restrictiva–

impone condiciones sólo sobre la la señal de control (mediante K1) a partir de las

características del sistema (V y A). –No interviene ninguna de las incógnitas J1 o

J2.–

De esta manera, para sistemas convencionales que verifiquen la ecuación (4.9),

calculamos las posibles soluciones J2 mediante la ecuación (4.8). Luego, J1 queda-

rá univocamente determinada para cada J2 solución de (4.8) y la obtenemos de la

ecuación (4.7)

J1 = −J2M−1VK2 . (4.10)

Finalmente las constantes Ci que determinan el vínculo podremos elegirlas en fun-

ción de las condiciones iniciales. Este último punto establece otra restricción: los sis-

temas serán equivalentes sólo para las condiciones iniciales que verifiquen el víncu-

lo, es decir deben existir las constantes reales Ci : w(q0, q0) = 0.

Aquí hemos formulado condiciones suficientes, no necesarias, es decir podrá ha-

ber casos más generales de sistemas tradicionales que no cumplan con las condi-

ciones aquí descriptas pero que sin embargo factibles de ser reproducidos mediante

este tipo de vínculos virtuales lineales. En particular estas condiciones más genera-

les se tratan en [8].

4.2. Comparación con los métodos de lagrangianos con-

trolados mediante Kinetic Shapping

En esta sección compararemos el método de control mediante vínculos virtuales

no holónomos y el de lagrangianos controlados que se describe en [2]. En esta publi-

52


cación Bloch, Leonard y Marden describen, entre otras cosas, las condiciones7 que

se deben cumplir para poder implementar la técnica de lagrangianos controlados

que proponen. Es justamente en estas condicones en las que enfocaremos nuestro

análisis.

En §I-B. de la publicación se analiza el caso del pendulo con carro. Analicemos en-

tonces este caso ya que además representa un ejemplo recurrente en nuestro propio

trabajo. En este sentido podemos establecer una equivalencia entre las descripciones

del sistema que se hacen en [2] y la el modelo que planteamos para nuestro análisis

(ver Apéndice B) si redefinimos las variables que se utilizan en la publicación según:

γ = m, α = I0, β = m`/2, D = −mg`/2, φ = θ, s = x ,

donde m, I0, `, g, θ y x se definen en el Apéndice B para nuestro péndulo con carro.

En la publicación se propone, a paritr del sistema actuado

ddt

(∂L

∂θ

)− ∂L

∂θ= 0

ddt

(∂L

∂x

)= fx

(4.11)

–donde (∂L )/(∂x) = 0 (x es cíclica)–, construir el sistema

ddt

(∂Lσ ,τ

∂θ

)− ∂Lσ ,τ

∂θ= 0

ddt

(∂Lσ ,τ

∂x

)= 0

(4.12)

donde x sigue siendo una variable cíclica. El procedimiento general consiste en asi-

milar la señal de control fx dentro de una modificación sólo8 en la energía cinética

del sistema original –de forma que redefiniendo esta cantidad se consigue el sistema

(4.12)– .Para esto se define una expresión general para el nuevo lagrangiano

Lσ ,τ =12

[mθ2 + m` cosθ(x + kθ)θ + m(x + kθ)2

]+

σ

2m k2 θ− mg`

2cosθ , (4.13)

siendo σ una constante y k una función a determinar. Luego comparando la primer

ecuación de los sistemas (4.12) y (4.11) –ecuaciones en θ– se tiene la primera condición

7En [3] se relajan algunas de las condiciones necesarias, gracias a la implementación de lo que se

denomina potencial shapping.8En [3] se admite una redefinición tanto de la energía cinética como de la potencial.

53


de compatibiliad(matching conditions, ver [2].)

σm(

k(θ)

)2= −m`/2 k(θ) cosθ . (4.14)

Por otro lado, comparando las segundas ecuaciones de estos mismos sistemas –

ecuaciones en x– se tiene la segunda condición de compatibilidad

fx = − ddt

(m k(θ)

), (4.15)

que determina la acción de control a implementar en el modelo de lazo cerrado en

función de σ y k. De la ecuación (4.14) se tiene

k(θ) =`

2σcosθ . (4.16)

Luego, la constante libre σ se ajusta de forma de obtener la dinámica buscada, en

particular para que O sea estable debe verificarse

σ−1 >4I0

m`2 − 1 ,

para 4I0/(m`2)− 1 > 0.

Ahora bien, analicemos la segunda ecuación –en x– del sistema (4.12). Si reem-

plazamos la ecuación (4.13) obtenemos

ddt

(∂Lσ ,τ

∂x

)=

ddt

[m`/2 cosθ θ + m(x + k(θ)θ)

]= 0 . (4.17)

Particularizando en el valor de k(θ) dado por la ecuación (4.16), encontramos

ξ cosθ θ + m x− Cα = 0 , (4.18)

donde ξ es una constante y donde Cα es una función de las condicones iniciales

dadas por

ξ = m`

2

(1 +σ−1

), Cα = ξ cosθ0 θ0 + m x0 .

Notemos entonces que la ecuación (4.18) es de la forma w(q, q) = 0, verificando

la definición de vínculos no holónomos de la ecuación (1.10). Encontramos así una

familia de vínculos (para diferentes conjuntos de condiciones iniciales), a partir de

las condiciones de compatibilidad. Por otra parte, dado que por hipótesis fθ = 0,

aplicando el principio de los trabajos virtuales generalizado, resulta

Cv : δx = 0 . (4.19)

54


Luego el sistema no holónomo formado por la terna (L , Ck, Cv), donde L es el

lagrangiano original del sistema dado por (C.11), Ck el vínculo cinemático indicado

en la ecuación (4.18) y Cv está definido por (4.19), reproduce la dinámica alcanzada

mediante el método de lagrangianos controlados que analizamos aquí. Es decir, son

equivalentes los sistemas

(L , Cv, fx) ≡ (Lσ ,τ , k(θ),σ) ≡ (L , Cv, Ck) ,

siempre que se verifiquen las condiciones de compatibilidad (4.14) y (4.15).

Ahora demos un paso más en el analisis. Con el ejemplo del péndulo con carro

que acabamos de analizar vimos que para encontrar un sistema no holónomo que

describa adecuadamente las ecuaciones de un lagrangiano controlado, el mayor in-

conveniente se presenta en la determinación del vínculo cinemático (Ck), ya que el

lagrangiano L y el Cv son heredados del sistema original. Pero reviendo el procedi-

miento mediante el cual obtuvimos la expresión para Ck que damos en la ecuación

(4.18) a partir de (4.17), encontramos que fácilmente podemos generalizarlo

Ck :ddt

(∂Lσ ,τ

∂s

)= 0 ,

siempre que exista en el sistema original –y en el controlado– una variable cíclica s

–que como se muetra en [2] siempre genera una cantidad conservada9–.

Así, concluimos que siempre podemos encontrar un sistema no holónomo generalizado

equivalente a los sistemas resultantes del método de lagrangianos controlados, siempre que

exista alguna coordenada cíclica.

Este resultado –al igual que el de §4.1–, se analiza para condiciones más genera-

les en [8].

9Esta cantidad conservada es justamente la que determina el Ck, cuyo orden dependerá de las

derivadas involucradas en la ecuación (4.17): En general, para lagrangianos dependientes sólo de la

posición y velocidad, resulta un vínculo de primer orden.

55

Capítulo 5

Conclusiones

En este trabajo describimos la dinámica resultante de la implementación de la

técnica de control por vínculos virtuales mediante sistemas no holónomos generaliza-

dos. Valiendonos de este formalismo calculamos diferentes vínculos que permiten

la estabilización de puntos inestables para diferentes sistemas no lineales . Para es-

to realizamos un análisis de las órbitas y de los parámetros que generan el control

buscado. Por este camino conseguimos diseñar estrategias que permiten alcanzar

el control cuasi-global de los sistemas. Llevando luego estos resultados a la estructu-

ra usual de control por retroalimentación, al indicar la forma funcional de la señal

de control que se debe implementar a tales fines. Alternativamente, presentamos

vínculos lineales y no-lineales que generan la estabilización local. Finalmente –y en

forma accesoria– contrastamos la técnica de control mediante vínculos cinemáticos

con otros métodos conocidos como son los métodos lineales en el espacio de estados y

los métodos energéticos.

56

Apéndice A

El péndulo con disco

O′

θ

mb, I2g

ψmd, I1

O

`

c

Figura A.1: El péndulo con disco.

Este modelo mecánico consiste en un péndulo invertido capaz de girar libremen-

te respecto de O y con un disco de inercia adosado en su extremo móvil O′, como

el que se muestra en la Figura A.1. Para describir la posición de este sistema utili-

zamos las coordenadas generalizadas θ (para el ángulo del péndulo respecto de la

vertical superior) y ψ (el ángulo de giro del disco respecto de alguna posición arbi-

traria cualquiera) que se indican en la figura. Así un punto genérico q del espacio

57

A. EL PÉNDULO CON DISCO

de configaraciones1 Q resulta q = (θ, ψ) ∈ Q. El Lagrangiano del sistema es2

L =12

Ieq1 θ2 +

12

I2(θ + ψ

)2 −Mg (1 + cosθ) . (A.1)

Para el cual se han definido

Ieq1 = mbc2 + md`

2 + I1 y M = mbc + md`

donde mb, I1 y md, I2 son las masas y momentos de inercia baricéntricos de la barra y

disco de inercia, respectivamente; c y ` son las distancias desde el eje de rotación de

la barra a los centros de masa de la barra y disco, respectivamente; g la aceleración

de la gravedad; y donde los ángulos θ y ψ son medidos respecto de la vertical, ver

figura A.1.

A partir de (A.1) se desprenden las Ecuaciones de Euler-Lagrange3

Ieq1 θ + I2

(θ + ψ

)−Mgsenθ = fθI2

(θ + ψ

)= fψ

(A.2)

Luego, combinando las ecuaciones del sistema (A.2)

[Ieq1 θ + I2

(θ + ψ

)−Mgsenθ]δθ +

+[I2

(θ + ψ

)]δψ = fθδθ + fψδψ (A.3)

donde δθ, δψ deben elegirse tales que se verifique

fθδθ + fψδψ = 0 . (A.4)

Así, si se cumple la ecuación (A.4) se eliminan las fuerzas de vínculo. En par-

ticular si el único control que es posible realizar sobre el sistema es a través de fψ( fθ = 0), es decir torque en el disco, la ecuación (A.4) se reduce a

δψ = 0 . (A.5)

Luego, reemplazando (A.5) en (A.3) resulta

Ieq1 θ + I2

(θ + ψ

)−Mgsenθ = 0

fθ = 0(A.6)

1Ver definición de espacio de configuraciones en [7]2ver decucción en §C.13Ver deducción de este procedimiento en D.2

58

Apéndice B

El péndulo con carro

O′

m, I

x

g

θ

O

`/2

Figura B.1: El péndulo con carro.

Este modelo consiste en un péndulo invertido montado sobre un carro que es

capaz de moverse horizontalmente y sobre una linea recta (ver Figura B.1). El pén-

dulo puede girar libremente alrededor del punto O, sin hacer contacto con el carro

en ningun punto excepto O′, para toda posición. Para describir la posición de este

sistema utilizamos las coordenadas generalizadas θ, x que se indican en la figura.

59

B. EL PÉNDULO CON CARRO

Notemos que el origen de coordenadas de x puede ser cualquier punto del piso y el

origen de θ corresponde a la posicón vertical superior. Así un punto genérico q del

espacio de configaraciones1 Q resulta q = (θ, x) ∈ Q. El lagrangiano de este sistema

es2:

L =12

mx2 +12

I0θ2 −m

l2

cosθ(

g + θx)

. (B.1)

donde m es la masa del péndulo, I0 = I + `2/4 es su momento de inercia respecto

de O′, dado el momento de inercia I baricéntrico. –Aquí hemos considerado nula la

masa del carro a fin de simplificar la descripción.–

A partir de (B.1) se desprenden las Ecuaciones de Euler-Lagrange3

(mx + m l

2 senθθ2 −m l

2 cosθθ)

δx +

+(


2 senθ)

δθ = fxδx + fθδθ ,(B.2)

donde, (δx, δθ) ∈ Cv.

Además, aplicando el principio de los trabajos virtuales generalizado para siste-

mas no-holónomos (ver [4]),

fxδx + fθδθ = 0 . (B.3)

Así, si se toman δx, δθ tales que se verifique la ecuación (B.3) se consigue eliminar

las fuerzas de vínculo, mediante un procedimiento equivalente a la formulación de

D’Alambert. Se obtiene de ésta manera el sistema de ecuaciones

(mx + m l

2 senθθ2 −m l

2 cosθθ)

δx +

+(


2 senθ)

δθ = 0

fxδx + fθδθ = 0

(B.4)

Recordemos que, a diferencia de los sistemas que verifican el principio de D’Alambert

–donde la relación entre δx y δθ se desprende del vínculo cinématico– el sistema

(B.4) requiere por separado la restricción dada por el vínculo cinemático (se reali-

zarán sólo sobre la velocidad y posición del sistema, para los casos estudiados) y la

limitación del vínculo variacional, es decir la vinculación entre δx y δθ.

1Ver definición de espacio de configuraciones en [7]2Ver contrucción del lagrangiano para este sistema en particular en Apéndice C.23Ver deducción de este procedimiento en D.2

60

B. EL PÉNDULO CON CARRO Análisis de la expresión gral. de Cv

Dado que la implementación del vínculo será a través de servomecanismos, en

general definimos el vínculo variacional a partir del conocimiento de los actuadores

(ver §1.4).

Por ejemplo si la acción de control se implementa mediante una fuerza horizontal

sobre el carrito, el vínculo variacional resultará: Cv : fθ = 0 ó alternativa-

mente, a partir de la ecuación (B.3): Cv : δx = 0.

Si, por el contrario, sólo se puede ejercer un torque sobre la barra del péndulo, el

vínculo será: Cv : fx = 0 ó Cv : δθ = 0

Finalmente, en una forma más general puede admitirse el siguiente vínculo:

Cv : fθ + c fx = 0, c δθ− δx = 0 . (B.5)

B.1. Análisis de la ecuación (B.5) en el marco de los sis-

temas subactudos

La ecuación (B.5), que dá una expresión general para los vínculos variacionales

que tratamos en este trabajo, implica que –para c 6= 0– el control del sistema debe

hacerse mediante dos fuerzas. Luego, dado que los sistemas que tratamos (tanto el

péndulo con carro como con disco de inercia) tiene dos coordenadas generalizadas

independientes (dim Q = 2), se plantea la duda de si este vínculo realmente repre-

senta un sistema subactuado.

Recordemos, entonces la definición de sistemas subactuados (ver Apéndice D.1)

dim(F ) < dim(Q) ,

donde F =< f > es el espacio generado por las fuerzas de vínculo. Luego, de la

ecuación (B.5) tenemos

f = ( fθ, fx) = (−c, 1)λ ,

donde λ es alguna función de las coordenadas y velocidades del sistema. De forma

que

dim(F ) = 1 < dim(Q) = 2 .

61

B. EL PÉNDULO CON CARRO Análisis de la expresión gral. de Cv

Es decir, se trata de un sistema subactuado ya que las fuerzas de vínculo son siempre

en la dirección4 (−c, 1).

Para visualizar mejor esto último, hagamos el siguiente cambio de coordenada

generaliza:

z = −c θ + x , (B.6)

donde θ y z son independientes. Ahora en estas nuevas coordenadas (θ, z), de la

ecuación (B.5) tenemos5

fθ = 0 , (B.7)

de modo que

fz = ξλ, (B.8)

donde ξ2 = c2 + 1. En estas nuevas coordenadas hemos encontrado la descripción

clásica de sistemas subactuados donde θ es la variable controlada y fz es la variable

manipulada, ver [14].

4Hablamos de dirección (realizando, quizás, un abuso de notación) en el espacio dual al tangente

del de configuraciones T∗Q, no fisicamente (ver [12]).5Ahora < fy, fz > 6=< fθ , fx >= 0, y es por esto que fθ = 0.

62

Apéndice C

Lagrangianos de sistemas articulados

Para calcular el lagrangiano L de cualquier sistema mecánico, es necesario co-

nocer las expresiones de la energía cinética T y potencial V del mismo (ver [7]).

Recordemos que

L = T−V . (C.1)

La energía potencial V, en general no presenta demasiados inconvenientes. Pero

la energía cinética de los sistemas tratados a lo largo de este trabajo pueden presen-

tar algunas sutilezas que vale la pena tener en cuenta.

Al tratar con sistemas articulados, es común tomar como origen de alguna coor-

denada el punto O′ que articula dos partes del sistema.Es por esto que, para escribir

el lagrangiano en las coordenadas generalizadas elegidas, nos interesará calcular la

énergia cinética en estas mismas coordenadas.

Resulta útil, entonces, conocer una expresión general de la energía cinética para

cada una de las partes del sistema en función de la descomposición de su movimien-

to respecto de un punto cualquiera, generalmente acelerado.

El objetivo de este apartado es sistematizar un procedimiento general, que per-

mita obtener la energía cinética de cuerpos arbitrarios en movimiento plano, que

son la clase considerada en este trabajo. Para esto, procederemos por aproximacio-

nes sucesivas.

Primera aproximación: Sistema Discreto.

Consideremos el sistema compuesto por N masas puntuales δmi.

La energía cinética TO del sistema respecto del punto inercial O –para un dado

63

C. LAGRANGIANOS DE SISTEMAS ARTICULADOS

O

O′

rr

R

r

Figura C.1: Descomposición de la posición de los puntos de un cuerpo arbitrario.

instante– estará dada por1

TO =12δmi(ri)2 , (C.2)

con 1 ≤ i ≤ N. Donde a cada masa diferencial –por ser puntual– le corresponde una

única velocidad ri (respecto del punto O).

Reescribiendo la posición ri = R + rir (ver figura C.1) de cada masa diferencial,

respecto de algún punto arbitrario O’ –en general no inercial (perteneciente ó no al

sistema)– resulta (ri)2 = ri · ri = R2 +(rir)2 + 2R · ri

r, donde rir es la velocidad de cada

punto relativa a O′. Así, podemos reescribir la energía cinética en estos términos,

TO =12

[MR2 + (ri

r)2δmi + 2R · ri

rδmi

],

donde M = ∑Ni=0 δmi es la masa total del volumen V considerado.

Segunda aproximación: Sistema Continuo.

Tomando el límite de la ecuación anterior, para N tendiendo a infinito y mante-

niendo la masa total M = ∑Ni=0 δmi → M =

∫V dm, generalizamos, así, la expresión

obtenida para TO, a un sistema continuo:

TO =12

MR2 + TO′ +∫

VR · rrdm , (C.3)

1Índices repetidos indican sumatoria

64

C. LAGRANGIANOS DE SISTEMAS ARTICULADOS

donde TO′ = 1/2∫(rr)2dm es la energía cinética total respecto a un sistema coorde-

nado inercial en O′ –coincidente en posición y velocidad con O′ solo por un instante

(O′ puede ser acelerado)–.

Tercera aproximación: Cuerpo Rígido (CR) en movimiento plano.

La condición de CR impone un vínculo entre cada dm –en este análisis manten-

dremos la hipótesis anterior de sistema continuo– que podemos escribir,

rr = r− R = Ω× rr , (C.4)

con Ω ∈ R, uniforme para todo punto perteneciente al CR.

Si ahora, además, consideramos que el cuerpo tiene restringido su movimiento a

un plano Π⊥Ω, rr y R resultan coplanares y R ·Ω = rr ·Ω = 0. Teniendo en cuen-

ta esto –y aplicando la definición de producto escalar– podemos escribir el último

término de la ecuación (C.3) como∫

VR · rrdm = −RΩ

∫

Vrrsenϑdm ,

donde ϑ es el ángulo entre las proyecciones de rr y R sobre Π.

Notar que este resultado podemos interpretarlo como un momento de primer

orden de la masa del cuerpo respecto de un plano Λ⊥Π tal que R ∈ Λ y que deno-

taremos

IΛ =∫

Vrrsenϑdm .

–Cabe destacar que esta integral no es una propiedad propia del cuerpo ya que que-

da definida por la dirección de R (ésta es una de las sutilizas a las que nos referíamos

al comienzo de este apéndice).–

Para las aplicaciones nos interesará reescribir IΛ considerando la descomposi-

ción rr = rcmr + rcm, donde rcm

r es la posición del centro de masa relativa a O′ y rcm

es la posición de cada punto relativa al centro de masa. Así, reescribimos

IΛ = rcmr senϑcmM + Icm

Λ , donde IcmΛ =

∫

Vrcmsenϑdm = 0 ,

con ϑcm el ángulo entre las proyecciones sobre Π de rcmr y R. Aquí hemos identicado

IcmΛ = 0 por realizarse la integración respecto del CM, ver [7]. Por otra parte, el tér-

mino TO′ de la ecuación (C.3), podemos reescribirlo, teniendo en cuenta la ecuación

65

C. LAGRANGIANOS DE SISTEMAS ARTICULADOS El péndulo con disco.

(C.4), de la forma

TO′ =12

∫

V(rr)2dm =

12

∫

VΩ2r2

r dm =12Ω2 IO′

donde IO′ =∫

r2r dm.

Finalmente, la energía cinética, respecto de un pto. inercial O, de un cuerpo rígi-

do arbitrario en movimiento plano, es en general

TO =12

MR2 +12Ω2 IO′ − RΩIΛ . (C.5)

A continuación nos valdremos de la ecuación (C.5) para escribir la energía ciné-

tica de los sistemas que son citados en este trabajo.

C.1. El péndulo con disco.

Consideremos el sistema que denominamos péndulo con disco y que se muestra

en la figura A.1. Esta cadena cinemática está constituida por dos cuerpos rígidos

articulados entre sí y vínculados al bastidor2 (representado por el rayado diagonal

en la figura).

De la ecuación (C.2) se deduce, inmediatamente (ver, por ejemplo, [7]) que TO =Tb

O + TdO, donde TO es la energía cinética total, Tb

O es la de la barra y TdO es la del

disco.

Aplicando la ecuación (C.5) a la barra –de masa mb y momento de inercia bari-

céntrico Ib (ver figura A.1)–, identificando O′ de la ecuación(C.5) con el centro de

masa de la barra, obtenemos

TbO =

12

mb(θc

)2 +12

Ibθ2 , (C.6)

donde IΛ = 0 ya que rCMr = 0 –debido a que CM ≡ O′–. Por otra parte, si aplicamos

la ecuación (C.5) al disco de inercia –de masa md y momento de inercia baricéntrico

Id ≡ IbO′ (ver figura A.1)–, obtenemos

TdO =

12

md(θ`

)2 +12

IdO′

(θ + ψ

)2 , (C.7)

2El bastidor constituye el tercer elemento de la cadena cinemática y actúa como marco de referen-

cia inercial. Dada la vinculación entre la barra y el bastidor, se deduce, y es importante destacar, que

O pertenece a ambos.

66

C. LAGRANGIANOS DE SISTEMAS ARTICULADOS El péndulo con carro.

donde ahora consideramos coincidentes al punto O′ y el centro de masas del disco.

Aquí, al igual que en la ecuación anterior, IΛ = 0 dado que CM ≡ O′ ⇒ rCMr = 0.

La energía cinética total del sistema completo la obtenemos, como ya vimos, su-

mando TbO y Td

O –dadas por las ecuaciones (C.6) y (C.7) respectivamente–. Así calcu-

lamos,

TO = TbO + Td

O =12

Ieqθ2 +12

IdO′

(θ + ψ

)2 , (C.8)

donde hemos definido, un momento de inercia equivalente (respecto de O′)

Ieq = mbc2 + md`2 + Ib

CM .

Por otro lado, la energía potencial V del sistema completo, podemos escribirla

V = Mg (1 + cosθ) ,

donde hemos definido

M = mbc + md` .

Finalmente el lagrangiano para el péndulo con disco (aplicando la ecuación C.1)

resulta

L =12

Ieqθ2 +12

IdO′

(θ + ψ

)2 −Mg (1 + cosθ) . (C.9)

C.2. El péndulo con carro.

Este sitema constituye el otro ejemplo recurrente a lo largo de este trabajo. Se

trata de un péndulo –de masa m y momento de inercia IO′ respecto del eje de ro-

tación3– montado sobre un carro capaz de desplazarse horizontalmente (ver figura

B.1). Para aplicar la ecuación (C.5) a este modelo, debemos considerar al punto O

fijo al bastidor –indicado por el rayado diagonal en la figura B.1, mientras que el

punto O′ se mueve con el carro y pertenece tanto al carro como al péndulo. En el

modelo estudiado, por simplicidad, se consideró nula4 la masa del carro, por lo tan-

3Dado el momento de inercia ICM respecto del centro de masas, el correspondiente a un eje para-

lelo por O′ es IO′ = IO + m(`/2)2, donde `/2 es la distancia entre O y O′4 Puede generalizarse facilmente las ecuaciones de movimiento, resultantes de las ecuaciones de

Euler-Lagrange, teniendo en cuenta la masa del carro, incluyendola en un término extra en la fuerza

horizontal sobre el carro. De esta manera redefinimos la fuerza horizontal Fx = F′x + mc x, donde mc

es la masa del carro, F′x es la fuerza horizontal en el modelo de mc = 0 y Fx es la fuerza horizontal en

el modelo con mc 6= 0.

67

C. LAGRANGIANOS DE SISTEMAS ARTICULADOS El péndulo con carro.

to la energía cinética total se deberá unicamente al movimiento del péndulo. Así, al

aplicar la ecuación (C.5), la energía cinética resulta

TO =12

mx2 +12

IO′ − xθm`

2cosθ , (C.10)

ya que IΛ = m(`/2)cosθ, pues rCMr = `/2.

Por otro lado, la energía potencial V podemos escribirla

V = mg`

2cosθ .

Finalmente el lagrangiano para el péndulo con carro (aplicando la ecuación C.1)

resulta

L =12

mx2 +12

IO′ − xθm`

2cosθ−mg

`

2cosθ . (C.11)

68

Apéndice D

Sistemas subactuados

D.1. Definición

Definimos sistemas subactuados a aquellos que verifican

dim(F ) < dim(Q) ,

con F =< f > –espacio generado por las fuerzas de vínculo–

donde f = ⊕i fi representa las fuerzas generalizadas actuantes sobre el sistema1 y Q

es el espacio de configuraciones del sistema2 (ver [7]).

D.2. Deducción de las ecuaciones de Euler-Lagrange pa-

ra sistemas no holónomos a partir del principio de

Hamilton.

Consideremos el sistema No Holónomo Generalizado subactuado de lagrangiano

L y con n coordenadas generalizadas. Aplicando el principio de Hamilton se tiene

δ

∫ t1

t0

L (q(t), q(t)) dt = 0

sii q(t) es una trayectoria del sistema, al realizar variaciones a extremos fijos.

1Notemos que f(q, q) ⊆ TQ es una distribución –un subespacio asociado a cada punto (q, q)–.2Por ejemplo para un sistema con dos coordenadas generalizas independientes q1 y q2, Q =<

(q1, q2) >⇒ dim(Q) = 2

69

D. SISTEMAS SUBACTUADOS Deducción de las ecuaciones de E −L

A partir de la ecuación anterior, derivando según la regla de la cadena e inte-

grando por partes (ver [7]), obtenemos∫ t1

t0

[ddt

(∂

∂q j L

)− ∂

∂q j L

]δqi dt = 0 (D.1)

con 1 ≤ j ≤ n.

Como se muestra en [4] estos sistemas cumplen con el principio de los trabajos

virtuales generalizado a los desplazamientos δqi (no ∆qi), que podemos escribir

fi δqi = 0 .

–Notemos que las fuerzas de vínculo sí realizan trabajo en desplazamientos infini-

tesimales del sistema ∆q–. Luego, reescribimos (sin perder generalidad) la ecuación

anterior de la forma ∫ t1

t0

fi δqi dt = 0 . (D.2)

Combinando las ecuaciones (D.1) y (D.2)∫ t1

t0

[ddt

(∂

∂q j L

)− ∂

∂q j L − fi

]δqi dt = 0 (D.3)

Así, aplicando el lema fundamental del cálculo variacional (ver [7]), resulta

ddt

(∂

∂q j L

)− ∂

∂q j L = fi , (D.4)

que son justamente las ecuaciones de Euler-Lagrange del sistema.

–Escribiendo de esta forma las ecuaciones, la información acerca del vínculo va-

riacional (Cv) la incluiremos en el término fi, lo cual resultará más cómodo al tratar

con servomecanismos–.

De esta manera, a partir de los principios de Hamilton y de los trabajos virtua-

les –en su versión generalizada– dedujimos las ecuaciones de Euler-Lagrange sólo a

partir del lagrangiano L del sistema. Es decir, al igual que en los casos d’alambertianos,

podemos considerar la dinámica del sistema contenida en L , si aceptamos el cum-

plimiento de algunos principios fundamentales.

Entonces ahora, podemos redefinir los sistemas no holónomos generalizados –

que definimos en §1.3– como aquellos dados por la terna (L , Ck, Cv) para los cuales

vale el principio de Hamilton y el principio generalizado de los trabajos virtuales.3

3Ya que en tal caso podremos deducir las ecuaciones de Euler-Legrange siguiendo el procedi-

miento aquí mostrado y arribar al sistema que define los sistemas no holónomos generalizados en

§1.3.

70

Apéndice E

Reparametrización del péndulo con

disco.

En §3.1.2 recurrimos a un cambio de coordenadas en el espacio de parámetros

adimensionales para el sistema del péndulo con disco de inercia. Gracias a esta

nueva descripción conseguimos simplificar notoriamente las zonas de estabilidad

–como discutimos en §3.1.2–.

Sin embargo, notemos que las ecuaciones (3.18) y (3.19) que definen ∆ y ε no son

combinaciones lineales de a, I y Γ y por lo tanto la validez de los parámetros ε y ∆

no es trivial y merece ser analizada con un poco de detenimiento.

Consideremos las funciones de reparametrización f1 = (∆,ε, I, τ) y f2 = (Γ , a, I, τ)dadas por

f1 :

ε =1

I (1− a−1) + 1

∆ =12· Γ

a(

1 + I−1)− 1

y

f2 :

Γ =2∆

ε(

I + 1)− 1

a =ε I

ε(

I + 1)− 1

Donde, tanto para f1 como para f2, I y τ permanecen invariantes (es decir la trasfor-

71

E. REPARAMETRIZACIÓN DEL PÉNDULO CON DISCO.

mación para estos parámetros es la identidad). Notemos que ∆ yε están definidas de

la misma forma que en las ecuaciones (3.18) y (3.19), siendo f1 la reparametrización

usada en §3.1.2 y f2 la función que nos permite volver a los parámetros originales.

Dados los puntos singulares de las funciones f1 y f2, definimos los dominios

D1 : formado por los puntos (Γ , a, I, τ), tales que

I 6= 0 , (E.1)

a 6= 0 y (E.2)

a(

1 +1

I

)6= 1 . (E.3)

y D2 : formado por los puntos (ε, ∆, I, τ), tales que1

I 6= 0 y

ε(

I + 1)6= 1 . (E.4)

De manera que

f1 : D1 → R4 ,

f2 : D2 → R4 .

Para que realmente los dos conjuntos de parámetros sea equivates2 debe cumplirse:

Im( f1) ⊆ D2 , (E.5)

Im( f2) ⊆ D1 , (E.6)

f1 f2 = ID2 (E.7)

1Las condiones que se dan aquí son suficientes para la no divergencia de las ecuaciones (3.18) y

(3.19), esto se vé más claramente para (3.19) reescribiendo 2∆ = IΓ/a[ I(1− a−1) + 1]−1.2Los parámetros son equivalentes si permiten representar los mismos puntos.

72

E. REPARAMETRIZACIÓN DEL PÉNDULO CON DISCO.

f1 f2 = ID2 (E.8)

Comencemos por verificar la condición (E.5), y analicemos Im( f1). Las ecuaciones

(E.1) y (E.2) se cumplen por hipótesis, resta entonces considerar (E.3) la cual, al apli-

car f2, resulta

a(

1 +1

I

)=

ε(

I + 1)

ε(

I + 1)− 16= 1 ⇒ ε

(I + 1

)6= ε

(I + 1

)− 1 , (E.9)

lo cual es cierto para todo ε, I ∈ D2, cumpliendo así la condición (E.5).

Para demostrar el cumplimiento de (E.6), reescribamos la ecuación (E.4) median-

te la transformación f1, así obtenemos

ε(

I + 1)

=I + 1

I + 1− I/a6= 1 ⇒ I

a6= 0 ⇒ I 6= 0 (E.10)

lo cual se verifica para todo a, I ∈ D1 –gracias a las ecuaciones (E.1) y (E.2)–, cum-

pliendose de esta manera la condición (E.5).

Analicemos ahora la condición (E.7),

f1 f2 =

ε =1

I(

1− [ε( I + 1)− 1]/(ε I))

+ 1=

1

I − I − 1 +ε−1 + 1= ε

∆ =12

2∆

ε I(1 + I−1)−ε( I + 1) + 1=

∆

ε I +ε−ε I −ε + 1= ∆

que es lo que buscabamos.

De igual manera verifiquemos la condición (E.8)

f2 f1 =

a =ε I

ε( I + 1)− 1=

1

1 + I−1 − (ε I−1)=

1

1 + I−1(1− I + I/a− 1)= a

Γ =2∆( I − I/a + 1)

I/a= 2∆

[a(

1 + I−1)− 1

]= Γ

encontrandose así el resultado esperado.

De esta forma, habiendo demostrado las condiciones (E.5), (E.6), (E.7) y (E.8)

podemos asegurar que los parámetros adimensionales ∆, ε son una adecuada des-

cripción del espacio de parámetros.

(Γ , a, I, τ)←→ (∆,ε, I, τ) (E.11)

73

Apéndice F

Códigos de cálculo

En este Apéndice mostramos algunos ejemplos de los cödigos de cálculo más

relevantes que se utilizaron en el trabajo.

F.1. Cálculo de las zonas de estabilidadPara resolver algunos polinomios característicos que surgieron a lo largo del tra-

bajo resultó necesaria la resolución de polinomios de tercer grado. Para esto, se si-guió el procedimiento que R. Bombelli ideó a partir del trabajo de S. dal Ferro y N.Tartaglia publicado en Ars Magna por G. Cardano en 1545 (ver [17]). Esta soluciónque denominamos B-F-T-C nos permite obtener valores exactos para las raices rea-les i complejas del polinómio. Sin embargo, dadas las inecuaciones que definen laszonas de estabilidad se optó por la resolución numerica de forma tal de poder ca-racterizar estas zonas evaluando estas soluciones para diferentes parámetros puntoa punto. A continuación presentamos el código más relevante que se formuló a talesfines, se trata justamente de la implementación del procedimiento de B-F-T-C:// se resue lve l a ecuacion cubica : x ^ 3 + a x ^ 2 + bx + c = 0//se sigue e l metodo de Cardano# include < s t d i o . h># include < s t d l i b . h># include <math . h>

s t r u c t complejo

double rea l , // parte r e a limag ; // parte imaginaria

;

void c2p ( s t r u c t complejo∗ x ) ;void p2c ( s t r u c t complejo∗ x ) ;void omega ( double p , double q , s t r u c t complejo x [ 2 ] ) ;void ca lc_u ( s t r u c t complejo w[ 2 ] , s t r u c t complejo x [ 6 ] ) ;void inversa ( s t r u c t complejo∗ x , s t r u c t complejo∗ r ) ;void potencia ( s t r u c t complejo∗ x , i n t exp , s t r u c t complejo∗ r ) ;void root_p3 ( s t r u c t complejo x [ 6 ] , double coef [ 3 ] ) ;

main ( )

74

F. CÓDIGOS DE CÁLCULO Cálculo de las zonas de estabilidad

i n t i ;s t r u c t complejo x [ 6 ] ,

e r r o r [ 6 ] , cubo , cuadrado ;double pi=4∗atan ( 1 ) , c o e f i c i e n t e s [ 3 ] ;

// c o e f i c i e n t e s [0 ]= a , coef . [ 1 ] = b , . . .c o e f i c i e n t e s [0]=−1;c o e f i c i e n t e s [ 1 ] = 2 0 ;c o e f i c i e n t e s [ 2 ] = 0 . 3 ;root_p3 ( x , c o e f i c i e n t e s ) ;// V e r i f i c a c i o n :f o r ( i = 0 ; i < 6 ; i ++)potencia (&x [ i ] ,2 ,& cuadrado ) ;potencia (&x [ i ] ,3 ,& cubo ) ;e r r o r [ i ] . r e a l = cubo . r e a l + c o e f i c i e n t e s [0 ]∗ cuadrado . r e a l + c o e f i c i e n t e s [1 ]∗ x [ i ] . r e a l + c o e f i c i e n t e s [ 2 ] ;e r r o r [ i ] . imag=cubo . imag+ c o e f i c i e n t e s [0 ]∗ cuadrado . imag+ c o e f i c i e n t e s [1 ]∗ x [ i ] . imag ;p r i n t f ( " e r r[ %d ] : ( % f , % f )\n " , i , e r r o r [ i ] . rea l , e r r o r [ i ] . imag ) ;

void c2p ( s t r u c t complejo∗ x ) /∗pasar l a d i r e c c i o n de mem. apuntada por x [ i ]∗/

//se guarda e l modulo en l a parte r e a l y e l arg en l a imaginariadouble mod , ang ;mod= s q r t (pow( x−>rea l , 2 ) +pow( x−>imag , 2 ) ) ;ang=atan2 ( x−>imag , x−>r e a l ) ;// p r i n t f ( " modulo: %f \n angulo : % f pi\n " ,mod, ang ) ;x−>r e a l =mod;x−>imag=ang ;

void p2c ( s t r u c t complejo∗ x ) /∗pasar l a d i r e c c i o n de mem. apuntada por x [ i ]∗/

//presupone e l modulo en l a parte r e a l y e l arg en l a imaginariadouble re , im ;re=x−>r e a l∗cos ( x−>imag ) ;im=x−>r e a l∗s i n ( x−>imag ) ;x−>r e a l =re ;x−>imag=im ;

void omega ( double p , double q , s t r u c t complejo x [ 2 ] )

double d e l t a ;d e l t a =pow( q , 2 ) / 4 . 0 +pow( p , 3 ) / 2 7 . 0 ;i f ( del ta >0)

x [ 0 ] . r e a l =q/2.0+ s q r t ( d e l t a ) ;x [ 1 ] . r e a l =q/2.0− s q r t ( d e l t a ) ;x [ 0 ] . imag = 0 . 0 ;x [ 1 ] . imag = 0 . 0 ;

i f ( del ta <0)

p r i n t f ( " d e l t a= %f \n " , d e l t a ) ;d e l t a =pow( q , 2 ) / 4 . 0 +pow(−p , 3 ) / 2 7 . 0 ;x [ 0 ] . r e a l =q / 2 . 0 ;x [ 1 ] . r e a l =x [ 0 ] . r e a l ;x [ 0 ] . imag= s q r t ( d e l t a ) ;x [ 1 ] . imag=−x [ 0 ] . imag ;

i f ( d e l t a ==0)

x [ 0 ] . r e a l =q / 2 . 0 ;x [ 1 ] . r e a l =x [ 0 ] . r e a l ;x [ 0 ] . imag = 0 . 0 ;x [ 1 ] . imag = 0 . 0 ;

75


void calc_u ( s t r u c t complejo w[ 2 ] , s t r u c t complejo x [ 6 ] )

i n t i , j ;double mod;double pi=4∗atan ( 1 ) ;f o r ( i = 0 ; i < 2 ; i ++)

c2p(&w[ i ] ) ; /∗di r . de mem apuntada por w∗/p r i n t f ( "w modulo: %f \n angulo : % f \n " ,w[ i ] . rea l , w[ i ] . imag ) ;mod=pow(w[ i ] . rea l , 1 . 0 / 3 ) ;f o r ( j = 0 ; j < 3 ; j ++)

x [ j + i ∗3 ] . r e a l =mod;x [ j + i ∗3 ] . imag=w[ i ] . imag/3.0+ j ∗2/3.0∗pi ;

i f ( x [ j ] . imag>2∗pi ) x [ j ] . imag−=2∗pi ;

void inversa ( s t r u c t complejo∗x , s t r u c t complejo∗r )

// l a entrada debe e s t a r en CARTESIANA y l a s a l i d a es en CARTESIANAc2p ( x ) ;r−>r e a l =1.0/x−>r e a l ; /∗ modulo del resu l tado∗/r−>imag=−x−>imag ; /∗ angulo del resu l tado∗/p2c ( x ) ;p2c ( r ) ;

void potencia ( s t r u c t complejo∗ x , i n t exp , s t r u c t complejo∗ r )

// l a entrada debe e s t a r en CARTESIANA y l a s a l i d a es en CARTESIANAc2p ( x ) ;r−>r e a l =pow( x−>rea l , exp ) ; /∗ modulo del resu l tado∗/r−>imag=exp∗x−>imag ; /∗ angulo del resu l tado∗/p2c ( x ) ;p2c ( r ) ;

void root_p3 ( s t r u c t complejo x [ 6 ] , double coef [ 3 ] )

i n t i ;double p , q ,

a , b , c ;s t r u c t complejo inv , w[ 2 ] , u [ 6 ] ;

p r i n t f ( " coef 0 % f " , coef [ 0 ] ) ;a=coef [ 0 ] ;b=coef [ 1 ] ;c=coef [ 2 ] ;p=b−pow( a , 2 ) / 3 . 0 ;q=c +(2∗pow( a ,3)−9∗a∗b ) / 2 7 . 0 ;omega ( p , q , w) ;p r i n t f ( " w1: ( % f %f )\n w2: ( % f %f )\n " ,w[ 0 ] . rea l ,w[ 0 ] . imag ,w[ 1 ] . rea l ,w[ 1 ] . imag ) ;ca lc_u (w, u ) ;p r i n t f ( " RAICES\n " ) ;f o r ( i = 0 ; i < 6 ; i ++)

p2c(&u [ i ] ) ;// p r i n t f ( " u[ %d ] : % f %f \n " , i , u [ i ] . rea l , u [ i ] . imag ) ;

inversa (&u [ i ] ,& inv ) ;x [ i ] . r e a l =p/3.0∗ inv . rea l−u [ i ] . rea l−a / 3 . 0 ;x [ i ] . imag=p/3.0∗ inv . imag−u [ i ] . imag ;p r i n t f ( " x[ %d ] : % f %f \n " , i , x [ i ] . rea l , x [ i ] . imag ) ;

76


A modo de ejemplo, a continuación mostramos el código de cálculo usado paradeterminar una de las zonas de estabilidad que se tratan en el cuerpo principal deltrabajo. En particular atenderemos al caso del control global con foco en O para elpéndulo con carro ya que para este caso el programa resulta de reducido tamaño.La salida de este código se puede ver en la Figura 3.12//se e s c r i b e un archivo parametros . dat con t r e s columnas alpha , c , Gamma coord . de l o s//puntos para l o s cua les e l s is tema t i e n e focos e s t a b l e s en l a pos ic ion v e r t i c a l//e i n e s t a b l e en l a i n f e r i o r# inc lude < s t d i o . h># include < s t d l i b . h># include <math . h>

# def ine N 3# def ine I 1 . 0 /∗ I ( param . adim . del s is tema )∗/# def ine X_MAX 3 . 0 /∗a∗ l /2∗/# def ine Y_MAX 5 . 0 /∗c∗/# def ine Z_MAX 1 0 . 0 /∗Gamma= gamma ∗ TAU ∗/# def ine X_MIN −6.0# def ine Y_MIN −5.0# def ine Z_MIN −1.0# def ine CANT_PTOS 1 E6 /∗cantidad de puntos del g r a f i c o∗/

void gra f ( double ∗x ) ;FILE ∗ out ;

i n t main ( )

i n t i , j , k ;double A, B , j0 , j p i , a , c , gamma , x [N] , rango [N] ;

rango [ 0 ] = (X_MAX−X_MIN ) ;rango [ 1 ] = (Y_MAX−Y_MIN ) ;rango [ 2 ] = (Z_MAX−Z_MIN ) ;srand ( time (NULL ) ) ;

f o r ( i = 0 ; i <CANT_PTOS ; i ++)

x [ 0 ] = rand ( ) ;x [ 0 ] = x [ 0 ] /RAND_MAX∗rango [0 ] +X_MIN ;x [ 1 ] = rand ( ) ;x [ 1 ] = x [ 1 ] /RAND_MAX∗rango [1 ] +Y_MIN ;x [ 2 ] = rand ( ) ;x [ 2 ] = x [ 2 ] /RAND_MAX∗rango [2 ] +Z_MIN ;

a=x [ 0 ] ; c=x [ 1 ] ; gamma=x [ 2 ] ;

A= gamma∗( I−c )/ a ;B= gamma∗( I +c )/ a ;j 0 = 1.0− c/a+ I /a−c ;j p i = 1.0− c/a−I /a+c ;

i f ( fabs (1.0− c/a ) > fabs ( I /a−c ) ) /∗condicion de no divergenc ia∗/

i f ( ( A/ j 0 < 0 . 0 ) & & ( (A/2./ j 0 )∗ (A/2./ j 0 )+1 ./ j 0 < 0 . 0 ) ) /∗ para tener un foco e s t a b l e super ior∗/

gra f ( x ) ;

re turn 0 ;

void gra f ( double ∗x )

out = fopen ( " foco_a_c_g . dat " , " a " ) ;//imprime y s a l e por cada paso de t por eso append , en caso de que por alguna eventual idad se interrumpa l a e j e c u c i o n//no se pierden l o s datos ca lcu lados

77

F. CÓDIGOS DE CÁLCULO Resolución numérica de la dinámica

f p r i n t f ( out ," % l f % l f % l f \n " , x [ 0 ] , x [ 1 ] , x [ 2 ] ) ;f c l o s e ( out ) ;

F.2. Resolución numérica de la dinámica

En esta sección mostramos otro de los códigos de cálculo típicos realizados pa-

ra este trabajo, en este caso detallamos un de los encargados de resolver las órbitas

del sistema. Este programa calcula la evolución de un conjunto de condiciones ini-

ciales ordenadas sobre un rectángulo en el espacio de fases. A este rectángulo lo

llamaremos marco del retrato de fases aunque puede o no coincidir con los limites

que elegimos para mostrar en las figuras. Las salidas consisten en una serie de ar-

chivos (tantos como condiciones iniciales se hayan elegido) conformados por tantas

columnas como variables tenga el sistema de ecuaciones autónomas al que se redujo

la dinámica. El método de cálculo utilizado es el de Runge-Kutta 4. Aquí mostramos

un ejemplo de este tipo de código para la resolución de uno de los casos que se des-

criben en este trabajo. En particular, se trata del caso del control global del péndulo

con disco mediante el vínculo dado por la ecuación (3.1), que en definitiva resulta

en el sistema

d2θ

dt2+ I

(d2θ

dt2+

d2ψ

dt2

)− senθ = fθ

I(

d2θ

dt2+

d2ψ

dt2

)= fψ

A continuación presentamos el código de cálculo de este sistema:// e s t e programa t i e n e por s a l i d a l o s r e t r a t o s de f a s e s del pendulo i n v e r t i d o//qo , wo toman l o s va lores del marco del r e t r a t o

# include < s t d i o . h># include < s t d l i b . h># include <math . h># def ine N 2 /∗dimensiones del r e t r a t o∗/# def ine t f 0 . 5 0# def ine t i 0 . 0# def ine DTA 0 . 0 1 /∗paso de tiempo adimensional∗/# def ine cota 1 E−10# def ine CI 4 /∗cantidad de condic iones i n i c i a l e s sobre cada e j e∗/# def ine WCOTA 1 E6# def ine Qmin 4 /∗ ñTamao del r e t r a t o∗/# def ine Qmax 3 . 6# def ine Wmin −0.3# def ine Wmax −0.9

void Func ( double ∗x ) ;void gra f ( double t , double ∗x ) ;void RK4( double x [ ] , void (∗ F ) ( ) ) ;double J ( double del ta , double E , double q , double w) ;

78


void curva ( double x [ ] , void (∗RK4 ) ( ) , void (∗ Func ) ( ) ) ;//x [ 0 ] = velocidad angular (w)//x [ 1 ] = angulo ( t i t a )FILE ∗ out ;char nombre1 [ 1 5 ] ;double dta ;

i n t main ( )

i n t i , v e r t i c e ;double x [N] , paso_q , paso_w ;i f ( CI==0)

x [ 0 ] =Wmax;x [ 1 ] =Qmax;s p r i n t f ( nombre1 , " disc_ad_esp %d . dat " , 0 ) ;curva ( x , RK4 , Func ) ;

e l s epaso_q =(Qmax−Qmin)/ CI ;paso_w=(Wmax−Wmin)/ CI ;f o r ( i = 0 ; i <4∗CI ; i ++)

v e r t i c e = i /CI ;switch ( v e r t i c e )case 0 :

x [0 ] =Wmax;x [1 ] =Qmin+ i∗paso_q ;break ;

case 1 :x [0 ] =Wmax−( i−CI )∗paso_w ;x [1 ] =Qmax;break ;

case 2 :x [0 ] =Wmin;x [1 ] =Qmax−( i−2∗CI )∗paso_q ;break ;

case 3 :x [0 ] =Wmin+( i−3∗CI )∗paso_w ;x [1 ] =Qmin ;break ;

s p r i n t f ( nombre1 , " disc_adim %d . dat " , i ) ;curva ( x , RK4 , Func ) ;

void curva ( double x [ ] , void (∗metodo ) ( ) , void (∗ pendiente ) ( ) )

i n t i , j ,MAX;double ant [N] , Dq , Dw, t =0;MAX= 100∗ ( t f−t i )/DTA;Dw=cota +1;Dq=Dw;f o r ( i = 0 ; ( i <MAX)&&((Dq>cota )||(Dw>cota ))&&( fabs ( x [ 0 ] ) <WCOTA) ; i ++)/∗parada s i ( q ,w) − > a pto . f i j o , w > WCOTA∗/

dta=DTA∗exp(− fabs ( x [0]/8.0)− fabs ( s i n ( x [ 1 ] ) ) ) ; /∗paso v a r i a b l e para mejor dens de ptos en q ,w∗/graf ( t , x ) ;t +=dta ;f o r ( j = 0 ; j <N; j ++)

ant [ j ]= x [ j ] ;metodo ( x , pendiente ) ;Dw=fabs ( ant [0]−x [ 0 ] ) ;Dq=fabs ( ant [1]−x [ 1 ] ) ;

79


void RK4( double x [ ] , void (∗ F ) ( ) )

double k1 [N] , k2 [N] , k3 [N] , k4 [N] ;i n t i ;f o r ( i = 0 ; i <N; i ++)

k1 [ i ]= x [ i ] ;F ( k1 ) ;f o r ( i = 0 ; i <N; i ++)

k1 [ i ]∗= dta ;k2 [ i ]= x [ i ]+ k1 [ i ] / 2 ;

F ( k2 ) ;f o r ( i = 0 ; i <N; i ++)

k2 [ i ]∗= dta ;k3 [ i ]= x [ i ]+ k2 [ i ] / 2 ;

F ( k3 ) ;f o r ( i = 0 ; i <N; i ++)

k3 [ i ]∗= dta ;k4 [ i ]= x [ i ]+ k3 [ i ] ;

F ( k4 ) ;f o r ( i = 0 ; i <N; i ++)

k4 [ i ]∗= dta ;x [ i ]+=( k1 [ i ]+2 .∗k2 [ i ]+2 .∗k3 [ i ]+ k4 [ i ] ) / 6 . ;

void gra f ( double t , double ∗x )

out = fopen ( nombre1 , " a " ) ;/∗imprime y s a l e por cada paso de t por eso append en caso de i n t e r r u p c i o n no se pierden l o s c a l c u l o s∗/

f p r i n t f ( out ," % l f % l f \n " , x [ 1 ] , x [ 0 ] ) ; /∗ q ,w∗/f c l o s e ( out ) ;

void Func ( double ∗x )

double F [N] ,w, q ,del ta , E ;

i n t i ;

w=x [ 0 ] ;q=x [ 1 ] ;

d e l t a = 2 . 0 0 ;E= −1.0;

F [ 0 ] = J ( del ta , E , q ,w) ;F [ 1 ] = w;

f o r ( i = 0 ; i <N; i ++)x [ i ]=F [ i ] ;

double J ( double del ta , double E , double q , double w)

re turn (−2.0∗ d e l t a∗cos ( q)∗w + E∗s i n ( q ) ) ;

80

Apéndice G

Evaluación económica.

G.1. Distribución de Tareas

Las tares realizadas durante este proyecto integrador pueden ser divididas según

se muestra en la Figura G.1.

(IWGVMTGMzR8EVIE

)WXYHMSHIGSRGITXSWFjWMGSW

0IGXYVEHITYFPMGEGMRIWVIPEGMSREHEWGSRIPXIQEHIPTVS]IGXS

%RjPMWMWMRXIKVEPHIPTVSFPIQEHIGSRXVSP]VIWSPYGMzREREPuXMGEHIWMWXIQEWRSLSPzRSQSWKIRIVEPM^EHSW

4VSKVEQEGMzR]GEPGYPSRYQqVMGSHIPEW^SREWHIIWXEFMPMHEH]PEWzVFMXEWHIPWMWXIQE

)WGVMXYVEHIVIWYPXEHSW]TVIWIRXEGMzR

Figura G.1: Descripción de tareas.

Por otra parte, el tiempo empleado en cada una se muestra en el diagrama de

Gantt aproximado de la Figura G.2.

8EVIE@1IW

Figura G.2: Diagrama de Gantt del proyecto.

81

G. EVALUACIÓN ECONÓMICA. Estimación de Costos

G.2. Estimación de Costos

Para la realización de este proyecto fueron necesarias aproximadamente 16 horas

de consulta mensuales a los directores, estimando un costo de $20 por hora por cada

uno, resulta un costo mensual de $640. Además se utilizó una PC durante todo el

proyecto, asumiendo un costo aproximado de $ 2000 y un período de amortización

de 10 años, y un factor de uso del % 50, resulta un costo mensual de $8.3 . En esta

evaluación no se consideran los gastos de mantenimiento, beca, infraestructura ni

servicios. Resulta entonces un gasto mensual c = $648, 3

Adoptando una tas descuento anual ianual del 12 %, resulta una tasa mensual

imensual del 0.95 % dada por

(1 + ianual) = (1 + imensual)12 .

Luego el costo del proyecto al día de su inicio resulta

C = cn=N

∑n=1

(1 + i)n ,

donde N = 10. Obtenemos así un costo inicial C = $6831, 58 al mes de agosto.

Sumando el costo de oficina que se utilizó durante el último mes que estimamos de

$ 500, teniendo en cuenta la misma tasa de descuento, resulta un costo total

C = $7381, 16 (G.1)

al 08/2005.

82

Referencias

[1] D. M. Alonso, E. E. Paolini, J. L. Moiola, Global Bifurcation Analysis of a Controlled

Underactuated Mechanical System, Nonlineart Dynamics, 40: 205-225, 2005

[2] A. Bloch, N. Leonard, J. Marsden, Controlled Lagrangians and Stabilization of Me-

chanical Systems I: The first Matching Theorem, IEEE Transactions on Automatic

Control, Vol. 45, 12, 2253-2270, 2000.

[3] A. Bloch, D. Chang, N. Leonard, J. Marsden, Controlled Lagrangians and Stabiliza-

tion of Mechanical Systems II: Potencial Shapping, IEEE Transactions on Automatic

Control, Vol. 46, 10, 1556-1571, 2001.

[4] H. Cendra, S. Grillo, Generalized Nonholonomic Mechanics, Servomechanisms and

Related Brackets J. Math. Phys. 47, 1-29, 2006.

[5] H. Cendra, A. Ibort, M. de León, D. M. de Diego, A generalization of Chetaev’s

principle for a class of higher order nonholonomic constraints, J. Math. Phys. 45 (7),

2785-2801, 2004.

[6] G. F. Franklin, D. J. Powell, A. Emami-Naeini, Feedback Control of Dynamic Sys-

tems, (5th ed.), Prentic Hall PTR, Upper Saddle River, New Jersey, 2005.

[7] H. Goldstein, Classical Mechanics, Second Edition, Addison-Wesley, Reading,

Massachusetts, 1980.

[8] S. Grillo, F. Maciel, D. Pérez, Closed-loop Systems and Generalized Nonholonomic

Mechanics. En preparación.

[9] Y. Rocard, Dynamique Générale des Vibrations, Masson et Cie Éditeurs, Chap. XV,

p. 246, Paris, 1949.

83

REFERENCIAS

[10] Y. Rocard, L’instabilité en mécanique; automobiles, avions, ponts suspendus, Masson,

Paris, 1954.

[11] J. K. Hendrick, H. M. Paynter, Nonlinear System Analysis and Synthesis: vol. 1

–Fundamental Principles, The American Society of Mechanical Engineers, New

York, diciembre, 1976.

[12] M. Nacahara, Geometry, Topology and Physics, Graduate Students Series in Phy-

sics, 1990.

[13] C.-M. Marle, Kinematic and Geometric Constraints, Servomechanism and Control of

Mechanical Systems, Geom. Struc. for Phys. Theories, II, Vol. 54, 4: 353-364, 1996.

[14] K. Ogata, Modern Control Engineering, 3er ed., Prentice Hall, Upper Saddle River,

New Jersey, 1997.

[15] A. Shiriaev, C. Canudas-de-Wit, Virtual Constraints a Constructive Tool for Orbital

Stabilization of Underactuated Nonlinear Systems,6th IFAC International Sympo-

sium on Nonlinear Control Systems, NOLCOS’04, Stuttgart, septiembre, 2004.

[16] A. Shiriaev, J. W. Perram, A.Robertsson, A. Sandberg, Explicit Formulae for Ge-

neral Integral of Motion for a Class of Mechanical Systems subjects to Virtual Cons-

traints, proc. IEEE Conf. Decision and Control (CDC’04), 1158-1163, diciembre,

2004.

[17] http://en.wikipedia.org/wiki/Cubic_equation

84

http://en.wikipedia.org/wiki/Cubic_equation

Agradecimientos

Antes de comenzar a agradecer a todas las personas que de una forma u otra hizo posible

la realización de este trabajo, me gustaría aclarar que este trabajo es en realidad el cierre de

un ciclo que comenzó hace tres años. Por lo tanto, antes de agradecer a todos aquellos que

influyeron directamente en este esrito, voy a empezar por los que siempre estubieron. Los

que me bancaron desde el principio, durante los tiempos más dificiles, cuando este momento

en que termino la carrera parecía extremadamente remoto. Los que supieron estar cuando

se los necesitaba, los que pusieron lo mejor de sí, los que me dieron todo.

A mis viejos (Fernando y Marta). A quienes no pienso agradecer por darme la vida, sino

por todo lo que vino después. Por su apoyo incondicional siempre y en especial en estos

tres últimos años. A mis hemanos (Dany, Matias y Fede), quienes siempre estuvieron y me

hicieron el aguante cuando los necesitaba. Por el contacto permanente por mail y en el chat

que resultaron una inyección anímica fundamental que siempre me mantuvo cerca de casa.

A mi familia, toda. A mis abuelas, que fueron una fuente de cariño costante. A mis tíos

que siempre estubieron al tanto de su sobrino del sur y lo ayudaron en todo. A mis primos,

que aunque no lo sepan, me simplificaron la vida enormemente. A los pibes, con los que

compartí estos últimos años y con los que nunca dejamos de ser uno sólo. Acá va mi muy

especial agradecimiento a Bruno, a Edu, a Gabriel, al Pela, a Rubén, a Tincho, a Tito y la

Vieja. Que aunque no todos son mecánicos supieron ganarse su lugar honoris causa.

A Paul, que estuvo siepre dispuesto a darme un techo para dormir en las interminables

noches de escritura. A mis correctores en este trabajo. A Bruno, Jeremy y Fernandito que

se animaron a leer versiones preliminares encontrando siempre algo que mejorar o algún

acento y aunque –a veces– no alcanzó el tiempo: vale la inteción. Tambien, al soporte técnico

–indispensable– en LATEXde Martín.

Finalmente a mis directores por los viernes de consulta, por el tiempo dedicado y la ex-

celente predisposición. Por la preocupación y dedicación, por el asesoramiento y por haber

sabido siempre marcar el rumbo del proyecto.

D .G .P .

85