View
37
Download
5
Category
Preview:
Citation preview
El gradiente y el método de los multiplicadores de Lagrange.
Wilman García
David Fernández Arenas
Licenciatura en Matemáticas y Física.
Universidad de Antioquia.
2
Resumen:
En este trabajo se presenta un conjunto de conceptos como lo son: campo vectorial, gradiente,
derivada direccional, y el método de los multiplicadores de Lagrange para obtener máximos y/o
mínimos de funciones sometidas a ciertas restricciones; se busca que sea visto desde un punto
de vista intuitivo, haciendo uso histórico de la noción de campo vectorial con el fin de reconocer
su importancia en el desarrollo de la física, de igual manera se presentan notas históricas del
concepto de gradiente y la relación existente entre éstos dos últimos. Por otra parte se intenta
dar una visualización del resultado del método de los multiplicadores de Lagrange, con el fin de
ofrecer una mayor claridad y detalles, para entender dicho concepto se han restringido las
funciones a R2 y R3, y no se han tratado demostraciones rigurosas. Por ultimo se pretende tratar
de relacionar dichos temas con algunas cuestiones de la geometría vectorial tales como vectores
libres, de posición.
Nota: cuando se indique un punto en negrita se hace referencia a un conjunto de puntos por
ejemplo x puede indicar la terna ordenada (x, y, z).
Para comenzar a hablar del gradiente y los multiplicadores de Lagrange es bueno tomar en
cuenta algunas consideraciones previas, como lo son algo de historia y lo referente al operador
diferencial nabla.
El gradiente fue denotado Δ por Hamilton en 1846, hacia 1870 se denoto ∇ la letra delta
invertida, que se llamó “atled”. En 1871 Maxwell escribió “la cantidad ∇P es un vector”. El
nombre de “pendiente” como se conocía en un principio pasó de uso y se reemplazó por la de
“gradiente”; se refiere a la palabra grado, el peralte de un camino o una superficie. El nombre de
(nabla apareció impreso por vez primera en 1901 en Vector Analysis, un libro para uso de
estudiantes de matemáticas y física.
Ahora bien en cuanto al operador nabla ∇ ≡ para el caso de una superficie de
en coordenadas cartesianas, ∇ no es un vector, sino un operador, puede considerarse como
un vector simbólico; así si ϕ es un campo escalar, entonces ϕ∇ es un operador, por tanto
colocando ∇ a la izquierda da operadores, mientras que aplicado a la derecha ∇ϕ da la
importante función vectorial llamada gradiente, por lo tanto a la derecha entrega funciones
vectoriales o escalares, en el caso de tener ϕ una función real definida en un conjunto abierto S
de , el gradiente de ϕ designado por ∇ϕ o por gradϕ, es una función vectorial definida por
∇ϕ =(D1 ϕ(x),…,Dn ϕ(x)) donde D1 ,D2,… Dn son las derivadas parciales; a lo anterior se le conoce
como campo gradiente de ϕ, pero entonces surge un nuevo concepto a tratar aunque de manera
algo vaga, el de campo vectorial, para conocer algo acerca de éste remitámonos nuevamente a
un poco de historia, el concepto de campo, entendido como campo de vectores, tuvo un gran
3
impacto en el desarrollo de las bases conceptuales de la física y la ingeniería, es realmente una
de las ideas que supusieron un avance significativo en la historia del pensamiento humano.
Es la noción que permite describir de modo sistemático las influencias sobre objetos y entre
objetos que están separados espacialmente. La idea de campo comenzó con el concepto de
Newton de campo gravitacional en este caso, dicho campo describe la atracción de un cuerpo o
grupo de cuerpos sobre otro. Análogamente el campo eléctrico producido por un objeto o grupo
de objetos cargados crea una fuerza sobre otro objeto cargado eléctricamente. El uso de campos
vectoriales para describir este tipo de fuerzas ha conducido a una misma comprensión mas
profunda de las fuerzas atractivas y repulsivas en la naturaleza. Sin embargo fue el monumental
descubrimiento de las ecuaciones de Maxwell que describen la propagación electromagnética,
las que consolidaron el concepto de campo en el pensamiento científico. Este ejemplo es
especialmente interesante teniendo en cuenta que los campos se pueden propagar. El contraste
entre campos electromagnéticos que se pueden propagar y el campo gravitacional que implica
una acción a distancia, ha originado gran interés entre los filósofos de la ciencia. La idea de
Einstein es que la gravitación puede describirse en términos de las propiedades métricas del
espacio-tiempo y que en esta teoría los campos asociados también pueden propagarse,
exactamente como el campo electromagnético, proporcionando por lo tanto una profunda
evidencia filosófica de que la versión de Einstein de la gravitación debería ser correcta. La idea
de campo también se usa en ingeniería para describir sistemas elásticos e interesantes
propiedades micro-estructurales de los materiales, con la teoría de la física moderna, el concepto
de campo se usa para describir partículas elementales, además es una herramienta fundamental
en los esfuerzos de los físicos teóricos modernos para unificar la gravedad con la mecánica
cuántica de las partículas elementales.
“Es imposible imaginar un marco teórico moderno que no incorpore algún tipo de concepto de
campo como ingrediente central. En las aplicaciones matemáticas a la física y a ciertas ramas de
la ingeniería como la mecánica de fluidos por ejemplo, se maneja con frecuencia el concepto de
campo vectorial.”1
Ahora matemáticamente un campo vectorial no es otra cosa que una función vectorial definida
en un cierto conjunto. Por ejemplo si a cada punto x de la atmosfera asignamos un vector V(x)
que representa la velocidad del viento, queda definido un campo vectorial. Si V(x) se expresa en
función de sus tres componentes de una cierta base por ejemplo { base ortonormal
derecha para R3, entonces se define una función vectorial:
1 Cálculo Vectorial, Jerrald E. Marsden, Anthony J. Tromba.
4
Las componentes V1, V2, V3, son tres funciones reales por lo
tanto un estudio de los campos vectoriales equivale en cierto sentido al de estudiar en este caso
ternas de funciones reales. Para distinguir entre campos vectoriales y funciones reales, a estas
ultimas se les suele llamar campos escalares. Por ejemplo la temperatura en cada punto de la
atmosfera define un campo escalar.
Uno de los modelos físicos más útiles de campo vectorial se presenta al considerar el
movimiento de un fluido. A cada punto x (o partícula del fluido) atribuimos un vector V(x) que
representa la velocidad de aquella partícula. Naturalmente el campo puede o no cambiar con el
tiempo. El flujo estacionario V(x) esta completamente determinado por x y no depende del
tiempo. En problemas físicos que incluyan campos vectoriales es importante conocer no
solamente el vector V(x) en cada punto x, sino también como varia dicho vector al pasar de un
punto a otro. Para estudiar este cambio disponemos del mecanismo de la diferenciación parcial
que puede aplicarse a los componentes de V. en general las derivadas parciales de estos
componentes dependerán de la elección de la base con relación a la que los componentes han
sido determinados. Por eso las derivadas parciales son un tanto insatisfactorias para describir
ciertas magnitudes físicas, mientras que ciertas combinaciones de derivadas parciales, como la
divergencia, el rotacional, entre otras, se usan para describir mejor el comportamiento de los
campos vectoriales, la divergencia de un campo vectorial por ejemplo es un campo escalar que
en el uso de una corriente de fluido, mide la proporción en la que el fluido fluye del entorno
inmediato a cada punto.
Ahora retomando nuevamente el campo gradiente este es un ejemplo claro de la relación
existente de un campo vectorial con el estudio de la derivación parcial. Si ϕ es una función (un
campo escalar) definida en un conjunto abierto de Rn, el gradiente de ϕ, designado por gradϕ, y
definida por la relación anterior gradϕ(x) = (D1 ϕ(x),…,Dn ϕ(x)) en cada punto x de S en que
existan las derivadas parciales.
Interpretaciones del campo gradiente.
Para el caso de R3, se tiene una interesante interpretación.
Sea c una constante y consideremos el conjunto de superficies en donde ϕ(x)=c si alguna de
estas superficies tiene un plano tangente en a= (a1, a2, a3) la ecuación de dicho plano esta dada
por esto significa que ∇ϕ (a) es
normal al plano en el punto a. Por tanto el plano tangente existe siempre que ∇ϕ (a)≠ .
5
El campo escalar ϕ cuyo gradiente es ∇ϕ se llama función potencial del campo vectorial ∇ϕ. Las
correspondientes distintas superficies se denominan superficies equipotenciales (o superficies
de nivel) ahora si se trata de campos bidimensionales cada conjunto de superficies son ahora
conjuntos de curvas planas que se llaman curvas equipotenciales o de nivel. Las superficies o
curvas de nivel dependiendo del caso son ortogonales al vector gradiente en cada punto a en el
que ∇ϕ ≠ 0.
De forma geométrica el gradiente evaluado en un punto es un vector que se encuentra normal a
una superficie en el espacio a la cual se le esta estudiando en dicho punto, bien sea (x,y) o de
coordenadas(x,y,z); por ejemplo: supóngase que se considera la temperatura en un lugar
determinado, la cual se define a través de un campo escalar de tal manera que en cualquier
punto (x,y,z) la temperatura esta dada por T(x,y,z). Asumiendo que no varia con respecto al
tiempo. Ahora el gradiente en un punto (x,y,z), y la magnitud de este nos dará cuan rápido se
calienta un fluido en una dirección cuya temperatura este regida por la función T(x,y,z).
Otro ejemplo interesante es el relacionado con una montaña en la cual su altura en un punto
(x,y) esta definida por un campo escalar H(x,y), el gradiente de H, en ese punto estará en la
dirección del punto a mayor grado de inclinación, la magnitud del gradiente nos mostrará que
tan empinada se encuentra la pendiente.
Con respecto a la física ya antes mencionado el gradiente posee bastantes aplicaciones
especialmente en electromagnetismo y mecánica de fluidos. En particular existen muchos
campos vectoriales que pueden escribirse como el gradiente de una función potencial escalar,
uno de ellos por ejemplo es el campo electrostático que deriva del potencial eléctrico .
Ahora bien todo campo que pueda escribirse como el gradiente de un campo escalar, se
denomina potencial conservativo o irrotacional. Asi por ejemplo una fuerza conservativa deriva
de la energía potencial , y como ya antes mencionado los gradientes también aparecen
en procesos de difusión que verifican ciertas leyes como la de Fourier para la temperatura. Así
por ejemplo, el flujo de calor de un material es proporcional al gradiente de temperatura
siendo k una constante de conductividad térmica.
He aquí la grafica de algunos campos gradientes en R3 y de una taraza en particular asociada a la
función potencial del campo sobre una pequeña región del espacio, funciones que utilizaremos
posteriormente:
6
h(x,y,z)= yz-2
Figura 1
Figura 1.1
∇ f(x,y,y) f(x,y,y)=xz +yz xz +yz=3
∇ g(x,y,z) g(x,y,z)= x^2+z^2-2 x^2+z^2=2
7
Figura 1.2
Las pequeñas flechas de colores representan el campo gradiente evaluado en algunos puntos y la
superficie representa una superficie de nivel de la función que se esta tratando.
En los ejemplos anteriores se ha tratado el gradiente y algo relacionado con la dirección es por
ello que se hace necesario mencionar algunas cuestiones sobre la derivada direccional, es decir
como es la variación de determinada función con respecto a una dirección especifica, en una
función de dos variables cuando estamos hablando de derivadas parciales de ,
estamos indicando solamente como esta variando la función en dirección del vector
respectivamente pero surge la pregunta como esta variando en otras direcciones.
Es fácil mostrar que esta variación esta dada por:
Donde representa la variación de la función en la dirección
de un vector unitario en la dirección de de esta relación anterior se deducen varias cosas:
a) El máximo valor de la derivada direccional esta dado por ‖ ∇f(x,y) ‖
b) El mínimo será entonces -‖ ∇f(x,y) ‖
∇ h(x,y,z) h(x,y,z)= yz-2 yz=2
8
De lo dicho anteriormente podemos sacar algunas conclusiones previas o más bien algunas
propiedades que verifica el vector gradiente:
Es ortogonal a las superficies escalares.
Apunta en la dirección en que la derivada direccional es máxima.
Se anula en los puntos críticos (máximos, mínimos y puntos silla).
Esta última propiedad mencionada no es más que una extensión a la definición de punto crítico
de una variable, para el caso de dos variables que se dice si existe en todos los puntos de
algún subconjunto de R2 el punto (x0 , y0) es un punto crítico de f si una de las siguientes
condiciones se cumple:
i)
ii)
Es decir que es un punto crítico si no existe.
Hasta este punto hemos hablado de campo vectorial, derivada direccional, gradiente y puntos
críticos, entremos ahora en una segunda parte, una pequeña introducción a lo que se denomina
el método de los multiplicadores del Lagrange.
MÉTODO DE LOS MULTIPLICADORES DE LAGRANGE
Cuando se quiere determinar los máximos o mínimos de una función sometida a una o mas
restricciones por ejemplo el de encontrar la distancia mínima que hay de una superficie
y el origen no siempre es posible resolver la restricción para alguna de las variables en
términos de las otras, pero se puede seguir un método para determinar dichos puntos máximos
o mínimos ; dicho procedimiento se denomina Método de los Multiplicadores de Lagrange en
honor al matemático francés Joseph L. Lagrange y consiste en lo siguiente:
Si un campo escalar tiene un extremo relativo cuando esta sometido a un
conjunto de condiciones siendo m<n, existen
entonces escalares tales que:
9
Para el caso de funciones de dos variables cuyas primeras derivadas parciales son continuas,
si tiene un extremo relativo en el punto sujeta a la condición y
∇ g≠ 0, entonces existe una constante λ talque:
El método de los multiplicadores de Lagrange nos permite encontrar los puntos
Que optimizan (producen máximos y/o mínimos) una función dada , sujeta a la restricción
.
Esta idea es esencialmente la extensión natural del método usual para funciones de una variable,
buscar máximos o mínimos entre sus puntos críticos, es decir los puntos en donde .
Este caso consideramos . Es claro que , así basta
buscar valores en los cuales , es decir
Para la demostración de la validez del método para funciones de dos variables puede observarse
en: “El CALCULO 7 ed.” Dicha demostración esta basada en algunas concepciones geométricas
que se presentan a continuación:
Antes de comenzar con algún ejemplo ilustrativo es conveniente tener en cuenta algunas
observaciones acerca del método:
La condición del método de Lagrange es una condición necesaria pero no suficiente, para
la determinación de puntos máximos o mínimos.
El método es valido si el numero de condiciones m, es menor que el numero de variables
n.
Por ejemplo en una variable la condición es necesaria pero no suficiente para que f
posea un máximo o un mínimo en , por ejemplo la función
10
Es tal que sin embargo el origen no es punto de máximo ni de mínimo para .
Figura 2 Figura 2.1
Considérese la función sujeta a la restricción , es decir considérese la
función . Encontrar los máximos y/o mínimos de
Aplicando el método de los multiplicadores de Lagrange, es decir encontrar un λ tal que:
Para hallar dicho punto hay que considerar lo siguiente:
Ahora bien tenemos lo siguiente pero en este punto tenernos 3 variables y solo dos
ecuaciones por lo que introducimos una nueva ecuación que no es más que la
restricción, así obtenemos un sistema de ecuaciones:
11
Resolviendo el sistema encontramos los valores para λ =±1 y sin embargo la
función no tiene ni máximo ni mínimo sobre esta restricción.
Figura 3
Veamos otro ejemplo: encontrar la distancia mínima en el plano de la función . Aquí surge
una pregunta ¿Cuál es la función a optimizar?, la función a optimizar es una función distancia
dada por:
12
Sometida a la restricción de
Tenemos que:
Luego el sistema esta dado por:
Resolviendo el sistema encontramos los puntos , este λ en economía
tiene una interpretación especial.
Luego un que a su vez representa una curva de nivel sobre el plano
, obsérvese nuevamente que la curda de nivel de la función es
tangente a la restricción en el punto si consideramos toda la circunferencia
completa es decir .
13
Desde el punto de vista grafico:
Figura 4 Figura 4.1
Figura 4.2
Gráficamente vemos que la curva de nivel de la
función que se va a optimizar es precisamente
tangente a la curva de nivel de la restricción, la
figura 4.1 muestra una el primer octante sobre el
cual se visualizan las funciones, con en el fin de
mayor claridad.
Veamos ahora con el ejemplo anterior una forma algo intuitiva de mostrar que realmente las
curvas son tangentes en este punto.
14
Consideremos la traza de la función =2 es decir una parametrización
bastante simple de estas curva esta dada por:
Es claro que un vector tangente esta dado por
.
Ahora bien tenemos que el gradiente de en términos de esta parametrización:
luego luego el gradiente es ortogonal a la curva de nivel como ya antes se había
mencionado.
Similarmente para la restricción tenemos que una simple parametrización consisten en:
sea luego un conjunto de ecuaciones paramétricas que me representan dicha función esta
dada por de manera que y además el gradiente de en
términos de esta parametrización viene dada por luego nuevamente
vemos que el gradiente es ortogonal a la curva de nivel. Ahora bien existe un punto en que el
cual son paralelos y mediante las relaciones anteriores esto implica que
también lo sean luego las dos curvas en este punto son tangentes entre si. Teniendo
en cuenta las restricciones que y sean diferentes del vector nulo.
Por otra parte el hecho que:
Indican que se esta encontrando un punto sobre el cual el vector gradiente es
múltiplo escalar del vector , por lo que si tomamos el producto punto entre los dos
vectores obtenemos que:
Siendo θ el ángulo entre dichos vectores pero dado que los vectores son paralelos entonces
tenemos que el ángulo formado entre ellos es 0° ó 180° por lo tanto dicho producto punto
queda determinado por:
Ó
15
Y retomando la derivada direccional que:
El máximo valor de la derivada direccional esta dado por ‖ ∇f(x,y) ‖
El mínimo será entonces -‖ ∇f(x,y) ‖ análogamente estamos encontrando, como esta variando la
función en la dirección del vector ∇g(x,y) y dicha variación estará relacionada con las
expresiones anteriores.
Para el caso de dos restricciones se esta considerando que:
Análogamente en el caso de una restricción se considera un vector múltiplo escalar de otro
ahora aquí se esta considerando al como una combinación lineal de los gradientes de
y se busca un punto en donde dicha relación se cumpla, a modo de ejemplo
tomado de “El CALCULO 7 ed.” Aunque el objetivo en este caso es ver un poco la forma gráfica
del problema, considérese el siguiente conjunto de restricciones , y y se busca
optimizar la función sobre dichas restricciones.
Por lo tanto tenemos que:
Luego el sistema de ecuaciones queda determinado por:
Y resolviendo el sistema encontramos los puntos (1, 2, 1); (-1, -2, -1); (-1,- 2, -1); (-1, 2, 1)
los cuales nos entregan un máximo y un mínimo son respectivamente (1, 2, 1) y (-1,- 2, -1), en
donde , para tratar de hacer un poco mas claros se tratara de
16
mostrar el caso para el punto (1, 2, 1), pero recuérdese que por algo de simetría en el problema
es análogo el análisis para el punto (-1, -2, -1).
Gráficamente:
Figura 5 Figura 5.1
Figura 6 Figura 6.1
17
Figura 7 Figura 7.1
Figura 8 Figura 8.1
18
z
Y
x
(x0, y0, z0)
∇ f(x0, y0, z0)
z
Y
x
(x0, y0, z0)
∇ f(x0, y0, z0)
Las figuras 5, 5.1, 6, 6.1, 7, 7.1 hacen referencia a los gradientes:
Y a las superficies de nivel respectivamente.
Ahora surge una pregunta como es posible graficar los vectores gradientes evaluados en un
punto, una idea algo intuitiva que intenta dar respuesta, consiste en ver al gradiente evaluado en
un punto como un vector en R3 el cual tiene un origen móvil dado por el punto , y a
partir de allí graficar un vector de posición determinado por el gradiente evaluado en dicho
punto, siguiendo este procedimiento podríamos hallar varios vectores representativos y
hacernos a una idea de cómo se comporta el campo gradiente en algunos puntos, aunque
graficar esto en el espacio es algo complicado similarmente podemos aplicar el procedimiento
en el plano siendo allí mucho mas sencillo.
Figura 9
Desde un punto de vista mas geométrico es el de tratar al vector gradiente como un vector libre
en el espacio, si tomamos el punto de coordenadas , considerándolo como el punto
terminal del vector de posición , a dicho vector le podemos sumar el vector
gradiente evaluado en dicho punto obteniendo así un nuevo vector de posición determinado por
ya que la suma de un vector libre mas un vector de posición es un nuevo vector de
posición, así el vector queda determinado mediante la siguiente relación:
19
Luego el gradiente de la función puede ser despejado de la relación anterior
obteniendo así:
Lo cual indica la diferencia de dos vectores de posición la cual esta definida y es un nuevo vector
libre, recuérdese que la suma de dos vectores de posición no esta definida, por lo tanto seguimos
acorde con la teoría considerando el vector gradiente evaluado en un punto como un vector
libre, por lo cual conociendo el gradiente evaluado en un punto, graficarlo es fácil:
Figura 10
20
Por ultimo consideremos nuevamente el problema de optimización sometido a las dos
restricciones analíticamente se ha encontrado que efectivamente el se puede
expresar como combinación lineal de los vectores , una forma de mostrarlo
geométricamente es haciendo referencia a lograr encontrar un plano, ¿cual plano será? , veamos:
tenemos claramente que <2, 0, 2> y <0, 2, 1> son Linealmente independientes por lo tanto
forman una base que genera un espacio consideremos dicho espacio como el plano que forman
los dos vectores, fácilmente se puede llegar a que la ecuación del plano esta dada por:
y se puede comprobar que los puntos asociados a los vectores de posición con
los que podemos graficar están efectivamente contenidos en dicho plano.
Figura 11 Figura 11.1
Las figuras 11 y 11.1 muestran el plano generado por los dos vectores <2, 0, 2> y <0, 2, 1> y el
vector <1, 3, 3>, y una perspectiva del grafico muestra que los tres vectores efectivamente están
sobre un mismo plano por lo tanto cualquiera de ellos es combinación lineal del resto.
21
Bibliografía:
Marsden, Jerrold Eldon, Tromba, Anthony J. Calculo vectorial. - 5. Ed. Pearson Educación. España. 2004
Apóstol, Tom M. Análisis matemático: introducción moderna al cálculo superior. - 01.ED, Reverte. España. 1950.
Apóstol, Tom M. Calculo con funciones de varias variables y algebra lineal con aplicaciones a las ecuaciones diferenciales y a las probabilidades: v2. - 2. ed. Reverte. España. 1975.
Leithold, Louis. El calculo. - 7. Ed. Oxford University Press. Mexico. 1998 Caicedo Contreras, José Francisco. Calculo avanzado: introducción, Universidad Nacional
de Colombia. Bogotá. 2005. Phillips, Henry Bayard. Análisis vectorial. Uteha. Mexico. 1956
Recommended