286
CAPÍTULO 12 Aplicaciones en la ingeniería: ecuaciones algebraicas lineales El propósito de este capítulo es usar los procedimientos numéricos analizados en los capítulos 9,10 y 11 para resolver sistemas de ecuaciones algebraicas lineales, en algunas aplicaciones de la ingeniería. Estas técnicas numéricas sistemáticas tienen significado práctico, ya que los ingenieros se enfrentan con mucha frecuencia a problemas que involucran sistemas de ecuaciones que son demasiado grandes para resolverse a mano. Los algoritmos numéricos en estas aplicaciones son de particular conveniencia para implementarse en computadoras personales. En la sección 12.1 se muestra cómo un balance de masa se puede emplear para modelar un sistema de reactores. En la sección 12.2 se le da especial énfasis al uso de la matriz inversa para determinar las interacciones complejas causa-efecto entre las fuerzas en los miembros de una estructura. La sección 12.3 es un ejemplo del uso de las leyes de Kirchhoff para calcular las corrientes y voltajes en un circuito con resistores. Por último, la sección 12.4 es una ilustración de cómo se puede emplear las ecuaciones lineales para determinar la configuración del estado uniforme de un sistema masa-resorte. 12.1 ANÁLISIS EN ESTADO ESTABLE DE UN SISTEMA DE REACTORES (INGENIERÍA QUÍMICA/PETROLERA) Antecedentes. Uno de los más importantes principios de organización en la ingeniería química es la conservación de la masa (recuerde la tabla 1.1). En términos cuantitativos, el principio se expresa como un balance de masa que toma en cuenta todas las fuentes y depósitos de un fluido que entra y sale de un volumen (véase figura 12.1). Sobre un periodo finito, esto se puede expresar como Acumulación = entradas salidas (12.1) El balance de masa representa un ejercicio contable para la sustancia particular que habrá de modelarse. Para el tiempo en que se realiza el cálculo, si las entradas son mayo- res que las salidas, la masa de la sustancia dentro del volumen aumenta. Si las salidas son mayores que las entradas, la masa disminuye. Si las entradas son iguales a las salidas, la acumulación es cero y la masa permanece constante. Para esta condición estable, o en estado uniforme, la ecuación (12.1) se puede expresar como ünlriidiiN « SIILIDIM (12.2)

Chapra12-20

Embed Size (px)

Citation preview

Page 1: Chapra12-20

CAPÍTULO 12

Aplicaciones en la ingeniería: ecuaciones algebraicas lineales

El propósito de este capítulo es usar los procedimientos numéricos analizados en los capítulos 9,10 y 11 para resolver sistemas de ecuaciones algebraicas lineales, en algunas aplicaciones de la ingeniería. Estas técnicas numéricas sistemáticas tienen significado práctico, ya que los ingenieros se enfrentan con mucha frecuencia a problemas que involucran sistemas de ecuaciones que son demasiado grandes para resolverse a mano. Los algoritmos numéricos en estas aplicaciones son de particular conveniencia para implementarse en computadoras personales.

En la sección 12.1 se muestra cómo un balance de masa se puede emplear para modelar un sistema de reactores. En la sección 12.2 se le da especial énfasis al uso de la matriz inversa para determinar las interacciones complejas causa-efecto entre las fuerzas en los miembros de una estructura. La sección 12.3 es un ejemplo del uso de las leyes de Kirchhoff para calcular las corrientes y voltajes en un circuito con resistores. Por último, la sección 12.4 es una ilustración de cómo se puede emplear las ecuaciones lineales para determinar la configuración del estado uniforme de un sistema masa-resorte.

1 2 . 1 A N Á L I S I S E N E S T A D O E S T A B L E D E U N S I S T E M A D E R E A C T O R E S ( I N G E N I E R Í A Q U Í M I C A / P E T R O L E R A )

Antecedentes. Uno de los más importantes principios de organización en la ingeniería química es la conservación de la masa (recuerde la tabla 1.1). En términos cuantitativos, el principio se expresa como un balance de masa que toma en cuenta todas las fuentes y depósitos de un fluido que entra y sale de un volumen (véase figura 12.1). Sobre un periodo finito, esto se puede expresar como

Acumulación = entradas — salidas (12.1)

El balance de masa representa un ejercicio contable para la sustancia particular que habrá de modelarse. Para el tiempo en que se realiza el cálculo, si las entradas son mayores que las salidas, la masa de la sustancia dentro del volumen aumenta. Si las salidas son mayores que las entradas, la masa disminuye. Si las entradas son iguales a las salidas, la acumulación es cero y la masa permanece constante. Para esta condición estable, o en estado uniforme, la ecuación (12.1) se puede expresar como

ünlriidiiN « SIILIDIM ( 1 2 . 2 )

Page 2: Chapra12-20

3 3 0 APLICACIONES EN LA INGENIERÍA: ECUACIONES,ALGEBRAICAS LINEALES

Entrada Salida

F IGURA 12.1 Una representación esquemática del balance de masa.

Empleo de la conservación de la masa para determinar concentraciones en estado estable de un sistema de reactores acoplados.

Solución. Se puede usar el balance de masa para resolver problemas de la ingeniería al expresar las entradas y salidas en términos de variables y parámetros medibles. Por ejemplo, si se realiza un balance de masa para una sustancia conservativa (es decir, una que no aumenta o disminuye debido a las transformaciones químicas) en un reactor (véase figura 12.2), podríamos cuantificar la razón con la cual el flujo másico entra al reactor a través de dos tuberías de entrada, saliendo de éste a través de una tubería de salida. Se puede hacer esto al tomar el producto del caudal Q (en metros cúbicos por minuto) y la concentración c (en miligramos por metro cúbico) para cada tubería. Por ejemplo, para la tubería 1 en la figura 12.2, Qx = 2 m 3/min y cx — 25 mg/m 3 ; por tanto, la razón con la cual fluye la masa hacia el reactor a través de la tubería 1 es Qlcl = (2 m 3/min)(25 mg/ m 3 ) = 50 mg/min. Así, 50 mg de sustancias químicas fluyen cada minuto hacia el reactor a través de esta tubería. De forma similar, para la tubería 2 la razón de masa que entra se calcula como Q2c2 = (1.5 m 3/min)(10 mg/m 3) = 15 mg/min.

Observe que la concentración a la salida del reactor a través de la tubería 3 no se especifica en la figura 12.2. Esto es porque ya se tiene suficiente información para calcularla con base en la conservación de la masa. Como el reactor se halla en estado uniforme, se aplica la ecuación (12.2) y las entradas se encuentran en balance con las salidas, como en

Q\c\ + Q2C2 = Q3C3 Sustituyendo los valores dados en esta ecuación se obtiene

5 0 + 15 = 3.5c 3

la cual se resuelve para c 3 = 18.6 mg/m 3 . De esta forma, hemos determinado la concentración en la tercera tubería. Sin embargo, el cálculo obtiene algo adicional. Como el reactor está bien mezclado (como lo representa el agitador en la figura 12.2), la concón Ilación será uniforme, u homogénea, en todo el tanque. Asimismo, la concentración 0 1 1 ln tupiarla 3 Haría aer iiiénlitm 11 la (««nnentruci An en. tntin el reactor. Rn r.nnaaeuanala al

Page 3: Chapra12-20

12.1 ANÁLISIS EN ESTADO ESTABLE DE UN SISTEMA DE REACTORES 991

F I G U R A 1 2 . 2 I lu UKICIDI en oslado i'.'.lulilo, completamente MUi/i Jado, con dos tuberías do unliada y una de salida. Ii >;, llujos volumétricos están i ni metros cúbicos por minuto, y las II mconlraciones están en tuilij j iamos por metro i ubico.

« 2 m3/mln c-, = 25 mg/m3 y

Q2 - 1.5 m3/min c2 = 10 mg/m3

03 = 3.5 m3/min c3 = ?

F IGURA 1 2 . 3 ' Un o reactores conectados i ii ii luberías.

Oi5 = 3

Q03 = 8

Q2, = 1 Q31 = 1

CQ3 = 20

0« = 2 Q,¿ = 2

0 » = 5 Q12 = 3 c 2

Q24=1 c 4 c 0 1 = 10 °1 c 2 c 4 044=11

balance de masa nos ha permitido calcular ambas: la concentración en el reactor y el caudal en el tubo de salida. Tal información es de gran utilidad para los ingenieros químicos y petroleros, quienes deben diseñar reactores que tengan mezclas de una concentración específica.

Debido a que se usa álgebra simple para determinar la concentración para un solo reactor en la figura 12.2, esto podría no ser fácil de representar en una computadora para el cálculo de un balance de masa. En la figura 12.3 se muestra la disposición de un problema donde las computadoras no sólo son útiles, sino también prácticas. Debido a que hay cinco reactores interconectados o acoplados, se necesitan cinco ecuaciones de balance de masa para caracterizar el sistema. Para el reactor 1, la razón de flujo de masa que entra es

Sí 10) 4- Q\\c\

Page 4: Chapra12-20

APLICACIONES ENJLA INGENIERÍA: E C U A C I O N E S ALGEBRAICAS LINEALES

y la razón de flujo de masa de salida es

Ya que el sistema se halla en estado uniforme, los flujos de entrada y salida deben ser iguales:

5(10) + Q3lC3 = Gl2Cl + Gl5Cl

o, sustituyendo valores para el flujo, de la figura 12.3

6ci — c 3 = 50

Ecuaciones similares se definen para los otros reactores:

- 3 c i + 3c 2 = 0 -c2 + 9c 3 = 160

-c2 - 8c 3 + l l c 4 - 2c 5 = 0

- 3 c i - c 2 + 4c 5 = 0

Se puede usar un método numérico para resolver estas cinco ecuaciones para las cinco incógnitas que son las concentraciones:

{C} r = L11.51 11.51 19.06 17.00 11.51J

Además, se puede calcular la matriz inversa como

Cada uno de los elementos a y significa el cambio en la concentración del reactor i debido a un cambio unitario en la carga del reactor j . De esta forma, los ceros en la columna 4 indican que una carga en el reactor 4 no tendrá impacto sobre los reactores 1, 2, 3 y 5. Esto es consistente con la configuración del sistema (véase figura 12.3), la cual indica que el flujo de salida del reactor 4 no alimenta ningún otro reactor. En contraste, la.s cargas de cualquier otro de los tres reactores afectarán al sistema completo como es indicado por la ausencia de ceros en las primeras tres columnas. Tal información es de gran utilidad para los ingenieros que diseñan y manejan sistemas como ése.

1 2 . 2 A N Á L I S I S D E U N A E S T R U C T U R A E S T Á T I C A M E N T E D E T E R M I N A D A ( I N G E N I E R Í A C I V I L / A M B I E N T A L )

0.16981 0.16981 0.01887 0.06003 0.16981

0.00629 0.33962* 0.03774 0.07461 0.08962

0.01887 0.01887 0.11321 0.08748 0.01887

0 0 0

0.09091 0

0 0 0

0.04545 0.25000

Antecedentes. Un problema importante en la ingeniería estructural es determinar IIIN

fuerzas y reacciones asociadas con una estructura estáticamente determinada, lin la l'i gura 12.4 se muestra un ejemplo de tal estructura.

Page 5: Chapra12-20

12.2 A N Á L I S I S D E U N A E S T R U C T U R A E S T Á T I C A M E N T E D E T E R M I N A D A 333

PIOURA 1 2 . 5 I iii ii |M iiiius de fuerza de i utíipii libio para los nodos fin I un I (1,'ili'uctura

«Mr'illi nmnnte determinada.

~2,v 30°

3 F3,h

Las fuerzas (F) representan, ya sea la tensión o la compresión de los elementos de la estructura. Las reacciones externas (H2, V2 y V3) son fuerzas que caracterizan cómo interactúa la estructura con la superficie de soporte. El apoyo en el nodo 2 puede transmitir ambas fuerzas, horizontal y vertical a la superficie, mientras que el rodillo en el nodo 3 transmite sólo fuerzas verticales. Se observa que el efecto de la carga externa de 1 000 Ib se distribuye a lo largo de varios elementos de la estructura.

Solución. El tipo de estructura se puede describir como un sistema de dos ecuaciones algebraicas lineales. Los diagramas de cuerpo libre se muestran para cada nodo en la figura 12.5. La suma de las fuerzas en ambas direcciones, vertical y horizontal, deben ser cero en cada nodo, ya que el sistema está en reposo. Por tanto, para el nodo 1,

EF„ = 0 = - f , eos 30° + F3 eos 60° + F , h

ZFy = 0 sen 30° - F\ sen 60° + Fx

(12.3)

(12.4)

Page 6: Chapra12-20

334 APLICACIONES EN LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES

para el nodo 2,

JFH= 0 = F2 +F{ eos 30° + F2h +r H2 (12.5)

I F K = 0 = F , sen 30° + F 2 > „ + V2 (12.6)

para el nodo 3,

ZFH=0= -F2 -F3 eos 60° + F3h (12.7)

IFV = 0 = F3 sen 60° + F 3 „ + V3 (12.8)

dondeF i h es la fuerza horizontal externa que se aplica sobre el nodo i (donde la fuerza es positiva de izquierda a derecha) y Fives la fuerza vertical externa que se aplica sobre el nodo / (donde la fuerza es positiva hacia arriba). Así, en este problema, la fuerza de 1 000 Ib hacia abajo en el nodo 1 corresponde a F¡ v = — 1 000 libras. Para este caso, todas las otras F¡ y F¡ h son cero. Observe que las direcciones de las fuerzas internas y las reacciones son desconocidas. La aplicación apropiada de las leyes de Newton requiere sólo de suposiciones consistentes con respecto a la dirección. Las soluciones son negativas si las direcciones se asumen de manera incorrecta. También observe que en este problema, las fuerzas en todos los elementos supuestamente están en tensión y actúan jalando los nodos adyacentes. Una solución negativa, por tanto, corresponde a compresión. Este problema se puede escribir como el siguiente sistema de seis ecuaciones con seis incógnitas:

0.866 0.5

-0 .866 - 0 . 5

0 0

- 0 . 5 0.866

0 0

0.5 -0 .866

0 0

-1 0 0 0

0 0 0

-1 0 0

íFi} 0 F2

- 1 0 0 0 F3

0 H2 0

v2

0

i v3 J 0

(12.9)

Advierta que, como se formuló en la ecuación (12.9), se requiere de pivoteo parcial para evitar la división entre cero de los elementos de la diagonal. Con el uso de una estrategia para el pivote, el sistema se puede resolver mediante cualquiera de las técnicas de eliminación que se analizaron en los capítulos 9 y 10. Sin embargo, como este problema es un caso ideal de estudio, para demostrar la utilidad de la matriz inversa se puede usar la descomposición LUpara calcular

F\ = - 5 0 0 F2 = 433

H2=0 V2 = 250

y la matriz inversa es

[ A ] " 1 =

F 3

V3

- 8 6 6

750

0.866 0.5 0 0 JO 0.25 -0 .433 0 0 1 0 - 0 . 5 0.866 0 0 0 0 - 1 0 - 1 0 - 1 0

-0 .433 -0 .25 0 - 1 0 0 0.433 -0 .75 0 0 0 - 1

Page 7: Chapra12-20

Ahora, observe que los vectores del lado derecho representan las fuerzas externas horizontal y vertical que se aplican sobre cada nodo, como en

{F}r = (/i,* F,,„ F2,h F2,v F 3,„ F3,tJ (12.10)

Debido a que las fuerzas externas no tienen efecto sobre la descomposición L U, no se necesita implementar el método una y otra vez para estudiar el efecto de diferentes fuerzas externas sobre la estructura. Más que esto, todo lo que se ha hecho es ejecutar los pasos de sustitución hacia adelante y hacia atrás para cada vector del lado derecho con el fin de obtener de manera eficiente soluciones alternas. Por ejemplo, podríamos querer estudiar el efecto de fuerzas horizontales que se inducen por un viento que sopla de izquierda a derecha. Si la fuerza del viento se puede idealizar como dos fuerzas puntuales de 1 000 libras sobre los nodos 1 y 2 (véase figura 12.6a), el vector del lado derecho es

{F}T = L-1000 0 1000 0 0 0J

el cual se puede usar para calcular

Fi = - 8 6 6 F2 = 250 F 3 = - 5 0 0

H2 = - 2 0 0 0 V2 = - 4 3 3 V3 = 433

Para un viento de la derecha (véase figura 12.66), Flh = — 1 000, F 3 h = — 1 000, y todas las demás fuerzas externas son cero, con esto, resulta que

Fj = - 8 6 6 F2 = - 1 2 5 0 F 3 = 500

H2 = 2000 V2 = 433 V3 = - 4 3 3

Los resultados indican que los vientos tienen efectos muy notorios sobre la estructura. Ambos casos se muestran en la figura 12.6.

F IGURA 1 2 . 6 I >I>N rusos de prueba mostrando o) vientos desde la izquierda y b) vientos desde la derecha.

Page 8: Chapra12-20

336 APLICACIONES EN LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES

Los elementos individuales de la matriz inversa tienen también utilidad directa en aclarar las interacciones estímulo-respuesta para la estructura. Cada elemento representa el cambio de una de las variables desconocidas a un cambio unitario de uno de los estímulos externos. Por ejemplo, el elemento a3\ indica que la tercera incógnita (F 3 ) cambiará a 0.866 debido a un cambio unitario del segundo estímulo externo (F, „). De esta forma, si la carga vertical en el primer nodo fuera aumentada en 1, F 3 se podría aumentar en 0.866. El hecho de que los elementos sean 0 indica que ciertas incógnitas no son afectadas por algunos estímulos externos. Por ejemplo a\\ = 0 significa que F , no es afectado por los cambios en F2h. Esta habilidad de aislar interacciones tiene un número de aplicaciones en la ingeniería; éstas incluyen la identificación de aquellos componentes que son muy sensibles a estímulos externos y, como una consecuencia, la mayoría tiende a fallar. Además, se puede usar para determinar los componentes que son innecesarios (véase el problema 12.16).

El procedimiento anterior resulta particularmente útil cuando se aplica a grandes estructuras complejas. En la práctica de la ingeniería, puede ser necesario resolver estructuras con cientos y aun miles de elementos estructurales. Las ecuaciones lineales proveen un enfoque poderoso para ganar cierta comprensión del comportamiento de estas estructuras.

1 2 . 3

F I G U R A 1 2 . 7 Representaciones esquemáticas de o) regla de las corrientes de Kirchhoff y b) ley de Ohm.

' 3

C O R R I E N T E S Y V O L T A J E S E N C I R C U I T O S DE R E S I S T O R E S ( I N G E N I E R Í A ELÉCTR ICA)

Antecedentes. Un problema común dentro de la ingeniería eléctrica involucra la determinación de corrientes y voltajes en varios puntos en circuitos de resistores. Estos problemas se resuelven usando las leyes para corrientes y voltajes de Kirchhoff. La regla para la corriente (o nodo) establece que la suma algebraica de todas las corrientes que entran a un nodo debe ser cero (véase figura 12.7a), o

E/ = 0 (12.11)

donde todas las corrientes que entran al nodo se consideran de signo positivo. La regla de la corriente es una aplicación del principio de la conservación de la carga (recuerde la tabla 1.1).

La regla para el voltaje (o malla) especifica que la suma algebraica de las diferencias de potencial (es decir, cambios en el voltaje) en cualquier ciclo debe ser igual a cero. Para un circuito de resistores, esto se expresa como

E§ - Ei7? = 0 (12.12)

donde ¿j es la fem (fuerza electromotriz) de las fuentes de voltaje, y i? es la resistencia de cualquier resistor en la malla. Observe que el segundo término se deriva de la ley de Ohm (véase figura 12.76), la cual establece que la caída de voltaje a través de un resistor ideal es igual al producto de la corriente y la resistencia. La ley de Kirchhoff para el voltaje es una expresión de la conservación de la energía.

Solución. La aplicación de estas reglas resulta en un sistema de ecuaciones algebraicas lineales, ya que son varios los ciclos o mallas que forman un circuito. Por ejemplo,

Page 9: Chapra12-20

F IGURA 12 .8 1 ln circuito de resistores que liuhiá de ser resuelto usando ecuaciones akjubraicas lineales simultáneas.

ñ=5a:

f?» 1011

—vW— ñ=15Q

•ñ= ion

ñ = 20í2

1 ~OV-\= 200 V

-O Vés = 0 V

considere el circuito mostrado en la figura 12.8. Las corrientes asociadas con este circuito son desconocidas tanto en magnitud como en dirección. Esto no presenta gran dificultad, ya que simplemente se supone una dirección para cada corriente. Si la solución resultante a partir de las leyes de Kirchhoff es negativa, entonces la dirección supuesta fue incorrecta. Por ejemplo, en la figura 12.9 se muestran las direcciones supuestas de las corrientes.

Dadas estas suposiciones, la regla de la corriente de Kirchhoff se aplica a cada nodo para obtener

í 12 + ' 5 2 + ( 3 2 — 0 ' 6 5 - ' 5 2 — ' 5 4 = 0 ¡ 4 3 - ' 3 2 = 0 i 5 4 — ' 4 3 — 0

La aplicación de la regla del voltaje en cada una de las mallas da

— ' 5 4 - ^ 5 4 — ' 4 3 * 4 3 — ' 3 2 * 3 2 + ' 5 2 * 5 2 = 0

- « 6 5 * 6 5 " ' 5 2 * 5 2 + ¿12*12 " 200 = 0 o, si se sustituyen las resistencias de la figura 12.8 y se pasan las constantes al lado derecho,

-15/54-5Í43 - 10¿32 + 10/52 =0 -20/65 - IO/52 + 5/12 = 200

Portante, el problema se reduce a la resolución del siguiente conjunto de seis ecuaciones con seis corrientes como incógnitas:

F I G U R A 1 2 . 9 (Corrientes supuestas.

Page 10: Chapra12-20

338 APLICACIONES EN LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES

I I I 0 •-1 0 0 0 - 1 0 ü 0 0 10 - 1 0 5 - 1 0 0

Aunque no es práctico resolverlo a mano, este sistema se maneja de manera fácil mediante un método de eliminación. Si se procede de esta forma, la solución es

¿ 1 2 = 6.1538 ¿ 5 2 = -4 .6154 z 3 2 = - 1 . 5 3 85

/ 6 5 = - 6 . 1 5 3 8 i 5 4 = -1 .5385 ¡ 4 3 = - 1 . 5 3 8 5

Así, con una adecuada interpretación de signos en el resultado, las corrientes y voltajes en el circuito se muestran en la figura 12.10. Deberían ser evidentes las ventajas de usar algoritmos numéricos y computadoras para problemas de este tipo.

0 0 0 1 - 1 0 0 0 1 0 1 - 1 0 - 1 5 - 5 20 0 0

0 ' 5 2 0 ' 3 2 0

' 6 5 0 ' 5 4 0

' 4 3 200

1 2 . 4 S I S T E M A S M A S A - R E S O R T E ( I N G E N I E R Í A M E C Á N I C A / A E R O E S P A C I A L )

Antecedentes. Los sistemas idealizados resorte-masa desempeñan un papel importante en la mecánica y otros problemas de la ingeniería. En la figura 12.11 se muestra un sistema de ese tipo. Después de liberar las masas, éstas son jaladas hacia abajo debido a la fuerza de la gravedad. Observe que el desplazamiento resultante en cada resorte de la figura 12.1 Ib, se mide a lo largo de las coordenadas con referencia a su posición inicial dada en la figura 12.1 la.

Como se introdujo en el capítulo 1, la segunda ley de Newton se puede emplear en conjunto con un equilibrio de fuerzas para desarrollar un modelo matemático del sistema. Para cada masa, la segunda ley se puede expresar como

d2x m—r = rD dt2

(12.13)

Para simplificar el análisis se supondrá que todos los resortes son idénticos y que se comportan de acuerdo con la ley de Hooke. En la figura 12.12a se muestra un diagrama de cuerpo libre para la primera masa. La fuerza hacia arriba es únicamente una expresión directa de la ley de Hooke:

Fn = kx\ (12.14)

F I G U R A 1 2 . 1 0 la solución obtenida para hs con ionios y voltajes iiftundo un método de (LILLTLILKK'IÚLL.

V= 153.85 - M A

ÍZ = 169.23

< | ( / = 1.5385

M A A - - O V=200

/= 6.1538

V - 1 4 6 . 1 5 V- 123.08 ^ O I Z= 0

Page 11: Chapra12-20

"11

m2

a) b)

1

1 1

x2

O

*3

F IGURA 1 2 . 1 1 Un sistema compuesto de tres masas suspendidas verticalmente por una serie de resortes. a) Ei sistema antes de liberarse; es decir, antes de la extensión o compresión de los resortes. b) El sistema después de liberarse. Advierta que las posiciones de las masas están referenciadas a las coordenadas locales con orígenes en su posición antes de soltarse.

« 1 M *2 -* l ) K*Z-Xl) M * 3 ~ * 2 )

L I L _L m

k{x2-x:) m^g k{xz-xy) mzg k[xz-xz)

a) b)

m3g

c)

F IGURA 1 2 . 1 2 Diagramas de cuerpo libre para las tres masas de la figura 12 .1

Las componentes hacia abajo consisten en dos fuerzas sobre el resorte junto con la acción de la gravedad sobre la masa,

Fi,~k(X2-xi)+k(x2-xi) + mig (12.15)

(MiNcrve cómo la componente fuerza en los dos resortes es proporcional al desplaza-micnlo do In N E G U N D N musa, .v3, apropiado para el desplazamiento de la primera masa, x,.

Page 12: Chapra12-20

340 APLICACIONES EN LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES

m2-d2x2

dt2

y

= k(x3 - x2) + m2g - 2k(x2 - xx) (12-1?)

W 3^7? = m3g - k(x, - x2) ( 1 2 1 8 )

Las ecuaciones (12.16), (12.17) y (12.18) forman un sistema de tres ecuaciones diferenciales con tres incógnitas. Con las condiciones iniciales apropiadas, éstas se pueden usar para calcular los desplazamientos de las masas como una función del tiempo (es decir, sus oscilaciones). Analizaremos en la parte siete los métodos numéricos para obtener esas soluciones. Por ahora, podemos obtener los desplazamientos que ocurren cuando el sistema eventualmente llega al reposo; es decir, en estado estable. Esto se realiza mediante la igualación a cero de las derivadas en las ecuaciones (12.16), (12.17) y (12.18), para dar

3kxi — 2kx2 = ni\g —2kx\ + 3kx2 — kx3 = m2g

— kx2 + kxi — mjg

o, en forma matricial,

[K]{X} = [W}

donde [K], es llamada matriz de rigidez, y es

[K] 3k -2k

-2k 3k -k -k k

Y {^0 y {^} s o n l ° s vectores columna de las incógnitas X y de los pesos mg, en forma respectiva.

Solución. En este punto se puede emplear métodos numéricos para obtener una solución. Si nt\ = 2 kg, m2 — 3 kg, mi — 2.5 kg, y las k — lü kg/s 2; use lu descomposición

. i „ j . . « i „ „ B , u n t a i v uenerar la inven» de [K],

Las ecuaciones (12.14) y (12.15) se pueden sustituir en la ecuación (12.13) para dar

d2x\ m]—^-=2k(x2-xi)-{-mlg-kxl (12.10)

dt¿

De esta forma, se ha obtenido una ecuación diferencial de segundo orden para describir el desplazamiento de la primera masa con respecto al tiempo. Sin embargo, advierta que la solución no se puede obtener, ya que el modelo incluye una segunda variable dependiente, x2. En consecuencia, se debe desarrollar diagramas de cuerpo libre para la segunda y tercera masas (véase figuras Yl.Ylb y c) que se pueden emplear para obtener

Page 13: Chapra12-20

' • ' T W W B S B I T W B

P R O B L E M A S

Susti tuyendo los parámetros del mode lo se obtiene

{W} = \K\ 30

- 2 0 - 2 0 30

- 1 0 - 1 0 10

19.6 29.4 24.5

La descomposición LU se puede emplear con el fin de resolver para xx = 7.35, x2 = 10.045 y x3 = 12.495. Estos desplazamientos se usaron para construir la figura 12.1 Ib. La inversa de la matriz de rigidez se calcula como

[K] = 0.1 0.1 0.1

0.1 0.15 0.15

0.1 0.15 0.25

Cada elemento de la matriz kj¡ nos indica el desplazamiento de la masa i debido a una fuerza unitaria impuesta sobre la masa j . Así, los valores de 0.1 en la columna 1 nos indica que una carga unitaria hacia abajo en la primera masa desplazará todas las masas 0.1 m hacia abajo. Los otros elementos se pueden interpretar en una forma similar. Por tanto, la inversa de la matriz de rigidez provee un resumen fundamental de cómo los componentes del sistema responden a fuerzas que se aplican de forma externa.

I N U I M I L E R I A Q U Í M I C A / P E T R O L E R A

12.1 Realice los mismos cálculos que en la sección 12.1, pero mnihic c,|| a 20 y c 0 3 a 6. 11.2 Si Iti entrada al reactor 1 en la sección 12.1 se disminuye en un 2.1%, ¿cuál es el porcentaje de cambio en la concentración de lim roiielorcs 2 y 3? 12.1 Debido a que el sistema mostrado en la figura 12.3 se halla en M L I I D O estable, ¿qué se puede inferir con respecto a los cuatro H H I « » : Y O I . G O 3 . f i « Y F I J S ?

12.4 Vuelva a calcular las concentraciones para los cinco reacto-l M (|iie se muestran en la figura 12.2, si los flujos se han cambiado n:

< 2 O I = 5 g 3 I = 2

Gis = 3 2 5 5 = 4 2 L 2 = 4 2 0 3 = 10

2 2 5 = 3 2 2 3 :

2 5 4 = 2 2 3 4

2 2 4 = 0

12.5 Resuelva el mismo sistema como lo especifica el problema 12.4, pero tome Ql2 y Q¡4 igual a cero. Use la conservación del flujo para recalcular los valores para los otros flujos. ¿Qué le indica la respuesta con respecto al sistema físico? 12.6 En la figura P12.6 se muestra tres reactores unidos por tuberías. Como se indica, la razón de transferencia de químicos a través de cada tubería es igual al flujo volumétrico (Q, con uni-

R I O U R A P 1 2 . 6

LLON incK LOIOS C O N E C T A D O S

jiul INLIOIL ÍJS. LA R A Z Ó N D E

IFWMLBINNR.LA D E M A S A A

LLÚVÉ» DTI C A D A TUBERÍA E S

IQIHII TIL PRODUCTO DEL FLUJO Q

y Iti T»(TU ( M I R A C I Ó N c D E L

T W I R L M (JOL i UUL SO O R I G I N A EL

LLU|u

400 mg/s 0 , 3 C ,

t

Q 2 ¡ ^ [j j200mg/s tr Q 3 3 =120 0 , 3 = 40 Q,2 = 80 0 2 3 = 60 Q 2, = 20

Page 14: Chapra12-20

342 APLICACIONES EN LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES

iludes ilc metros cúbicos por segundo) multiplicado por la concentración del reactor donde se origina el flujo (c, con unidades do miligramos por metro cúbico). Si el sistema se halla en un eslaclo estable, la transferencia hacia cada reactor equilibrará la transferencia de salida. Desarrolle ecuaciones de balance de masa pura los reactores y resuelva las tres ecuaciones algebraicas lineales simultáneas para sus concentraciones. 1 2 . 7 Emplee el mismo planteamiento básico que en la sección 1 2 . 1 , para determinar la concentración de cloro en cada uno de los Grandes Lagos mediante la información mostrada en la figura P 1 2 . 7 .

1 2 . 8 Una etapa en un proceso de extracción se ilustra en la figura P 1 2 . 8 . En estos sistemas, una corriente que contiene una fracción en peso F e n de un químico entra desde la izquierda a razón do un flujo de masa de Fv En forma simultánea, un solvente que

tiene una fracción en peso Xm del mismo químico entra desde la derecha a una razón de flujo de F2. Así, para la etapa i, se puede representar un balance de masa como

F,y,_i + F2Xi+i = FiY¡ + F2X¡ (P12.8a)

En cada etapa, se supone que se establece un equilibrio entre Y¡ y Xt, como en

K = ~ (P12.86)

donde K es llamada el coeficiente de distribución. La ecuación (P12.86) se puede resolver para X¡ y sustituirla en la ecuación (P12.8a) para obtener

F I G U R A P l 2 . 7 Un balance del cloro para los Grandes Lagos. Las flechas con número son entradas directas.

1 8 0

7 4 0

7 1 0 Hurón

Q H E ° H 3 8 5 0

Michigan

Erie

Q E O ° E

QMHCM

0 S H = 6 7

3 6

Q H E = 1 6 1

Q E O = 1 8 2

Qoo = 2 1 2

4 7 2 0

Ontario

Qoo°o

F I G U R A P 1 2 . 8 Un estado del proceso de extracción.

X M | ( x2 x3 x¡ x n - 1

Page 15: Chapra12-20

P R O B L E M A S 148 600

F IGURA P 1 2 . l l

i - ( l + j-K^j Y¡ + (y-K^J Yi+Í = 0 (P12.8c)

Sí /•', = 400 kg/h, Ym = 0.1, F2 = 800 kg/h, X e n = 0 y K = 5, determine los valores de 7 f u e r a y X f i j e r a, si se usa un reactor de 5 etapas. Observe que la ecuación (P12.8c) debe modificarse para tomar en cuenta las fracciones peso de entrada cuando se aplica II las etapas primera y última.

Ingeniería civil/ambiental 12.<> Un ingeniero civil involucrado en la construcción, requiere •I 800, 5 810 y 5 690 m 3 de arena, de grano fino y grueso, résped ivuinente, para un proyecto de construcción. La composición de estas canteras es

Arena Grano fino Grano grueso % % %

l'n I 52 30 18 vw: 20 50 30 l'n i 25 20 55

/,('nimios metros cúbicos se debe transportar desde cada cantera ptiiu cumplir con las necesidades del ingeniero? 11. Kl Realice el mismo cálculo que en la sección 12.2, peroaho-in cambie el ángulo en el nodo 2 a 40° y en el nodo 3 a 50°, y la llici/ii en el nodo 1 es de 750 libras.

12.11 Realice el mismo cálculo que en la sección 12.2, pero ahora para la estructura mostrada en la figura P12.11. 12.12 Efectúe el mismo cálculo que en la sección 12.2, pero ahora para la estructura mostrada en la figura P12.12. 12.13 Calcule las fuerzas y reacciones para la estructura de la figura 12.4 si se aplica en el nodo 1 una fuerza por debajo de 2 200 kg y una fuerza horizontal hacia la derecha de 1 800 kg. 12.14 En el ejemplo para la figura 12.4, donde una fuerza por debajo de 1 000 libras se aplica en el nodo 1, las reacciones externas V2 y V} fueron calculadas. Si las longitudes de los miembros de la estructura han sido dadas, se puede calcular V2 y V3

utilizando el hecho que V2 + V3 debe ser igual a 1 000 y sumando los momentos alrededor del nodo 2. Sin embargo, como no se conoce V2 y V}, se puede trabajar hacia atrás y resolver para las longitudes de los elementos de la estructura. Observe que como existen tres longitudes desconocidas y sólo dos ecuaciones, se puede resolver para únicamente la relación entre las longitudes. Resuelva para esta relación. 12.15 Emplee los mismos métodos que se usaron en el análisis de la figura 12.4, determine las fuerzas y reacciones para la estructura que se muestra en la figura P12.15.

F IGURA P 1 2 . 1 5

F IGURA P 1 2 . 1 2 4 ° 0 200 1 i

Page 16: Chapra12-20

344 APLICACIONES EN LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES

X60° 6 0 ° X / \ 4 5 °

3500

F I G U R A P 1 2 . 1 6

12.16 Resuelva para las fuerzas y reacciones de la estructura de lu figura P12.16. Determine la matriz inversa para el sistema. ¿Parece razonable la fuerza en elemento vertical a la mitad del elemento? ¿Por qué? 12.17 Como su nombre implica, la polución de aire entrante tiene que ver con la contaminación encerrada en espacios tales como casas, oficinas, áreas de trabajo, etcétera. Suponga que se diseña un sistema de ventilación para un restaurante como se muestra en la figura P12.17. El área de servicio del restaurante consiste en dos cuartos cuadrados y uno alargado. El cuarto 1 y el 3 tienen fuentes de monóxido de carbono, de los fumadores y una parrilla. Se puede escribir balances de masa en estado estable para cada cuarto. Por ejemplo, para la sección de fumadores (cuarto I), el balance se escribe como

0 = W'fu.nador + Q aC f l - Q aC, +EÍ3(C3-C¡) (carga) + (entrada) — (salida) + (mezcla)

o sustituyendo los parámetros

225c, - 25c3 = 1400

Se puede escribir balances en forma similar para los otros cuartos.

a) Resuelva para la concentración, en estado estable, de monóxido de carbono en cada cuarto.

b) Determine qué porcentaje de monóxido de carbono en la sección de niños es a causa de i) los fumadores, ii) la parrilla y iii) el aire que entra por ventilación.

Ingeniería eléctrica 12.18 Realice el mismo cálculo que en la sección 12.3, pero ahora cambie la resistencia entre los nodos 3 y 4 a 25 Í2 y cambie VH

a60V 12.19 Lleve a cabo el mismo cálculo que en la sección 12.3, pero ahora para el circuito que se presenta en la figura P12.19. 12.20 Realice el mismo cálculo que en la sección 12.3, pero ahora para el circuito expuesto en la figura P 12.20. 12.21 Resuelva el circuito resistor de la figura 12.8, usando la eliminación de Gauss, si V{ = 180 V y R56 = 50 ohms. 12.22 Resuelva el circuito de la figura Pl 2.22 para las corrientes en cada alambre. Use el método de eliminación de Gauss con pivoteo. 12.23 Un ingeniero eléctrico supervisa la producción de tres tipos de componentes eléctricos. Tres clases de materiales (metal, plástico y hule) se requieren para la producción. Las cantidades necesarias para producir cada componente son

F I G U R A P 1 2 . 1 7 Vista aérea de los cuartos en un restaurante. Las flechas en un sentido representan los flujos de aire volumétricos, mientras que las flechas en ambos sentidos representan la mezcla difusa. Las cargas debido al humo y la parrilla agregan masa de monóxido de carbono al sistema pero con entrada de aire Insignificante.

Qc= 1 5 0 m 3 / h r i

Qb = 50 m 3 /hr

cb = 2 mg /m 3

O, = 200 m 3 /hr

c a = 2 mg /m 3

Carga por fumadores

(T 000 mg/h'r)

(Sección ^ de niños)

Q d = 1 0 0 m 3 / h r A

25 m 3 /hr

1 (Sección de fumar) ~

25 m 3 /hr

- H -

Page 17: Chapra12-20

R-20U 2 fl-10U 1

vW

ñ = 5 1 i

O V, = 150 volts

ñ=5í2

1 " ' 5

PIOURA P 1 2 . 1 9

ñ = 2 5 Q

— o ve = 0 volts

Componente Metal, Plástico, Hule, g/componente g/componente g/componente 15 17 19

0.25 0.33 0.42

Si IIIS cantidades totales son 2.12, 0.0434 y 0.164 kgpara el metal, plástico y hule, respectivamente, y están disponibles cada illa, ¿cuántos componentes se puede producir por día?

Ingeniería mecánlen/aeroespiiclal 12.24 Efectúe el mismo cálculo que en la sección 12.4, pero uhoru triplique el valor de las constantes del resorte. 12.25 Realice el mismo cálculo que en la sección 12.4, pero ahora agregue un tercer resorte entre las masas 1 y 2 y duplique k. 12.26 Efectúe el mismo cálculo que en la sección 12.4, pero ahora cambie las masas de 2, 3 y 2.5 kg a 15, 3 y 2 kg. 12.27 Los sistemas idealizados masa-resorte tienen numerosas aplicaciones en toda la ingeniería. La figura P12.27 muestra un arreglo de cuatro resortes en serie cuando se comprimen con una fuerza de 2 000 kg. En el equilibrio, se pueden desarrollar las ecuaciones de equilibrio de fuerzas, definiendo las interrelacioncs entre los resortes; k2(x2 - x¡) = kyxi k3(x3 -x2) = k2(x2 -JCI) kA(x'4 - x3) — k3(x3 - x2)

F = k4{X4 - x3)

donde las k son las constantes del resorte. Si de k{ a ¿ 4 son de 150, 50, 75 y 225 kg/s2, respectivamente, calcule las x.

PIOURA P 1 2 . 2 0

MOURA P 1 2 . 2 2

20 Q

5Í2 15 £2

V, - 1 1 0 V 2 = 40

Page 18: Chapra12-20

346 APLICACIONES EN LA INGENIERÍA: ECUACIONES ALGEBRAICAS LINEALES

x2

F I G U R A P 1 2 . 2 7

Page 19: Chapra12-20

11.IH Tres bloques cslnn conectados por unit cnerda sin peso y ih'sciinsiiii sobre un plimo inclinado (véase figura IM2.28<7). Si !<u usa un procodiniicnlo similar al usado en el análisis del paracaidista en caída libre del ejemplo 9.11, se obtiene el siguiente ninjiinlo de ecuaciones simultáneas (los diagramas de cuerpo libre se muestran en la figura P12.28£>):

IIKW I 7' 519.72 MW T I A* - 216.55

. ' . .• i ,/ - R = 108.27

Encuentre la aceleración a y las tensiones 7'y l< en las dos cuerdas. 12.29 Realice un cálculo similar al que se pidió en el problema 12.28, pero ahora para el sistema que se muestra en la figura P 12.29. 12.30 Realice el mismo cálculo que en el problema 12.28, pero ahora para el sistema expuesto en la figura P12.30 (los ángulos son de 45°).

F IGURA P 1 2 . 2 9 F IGURA P 1 2 . 3 0

Page 20: Chapra12-20

E P Í L O G O : P A R T E TRES

P T 3 . 4 E L E M E N T O S D E J U I C I O

La tabla PT3.2 proporciona un resumen de los elementos de juicio involucrados en la resolución de ecuaciones algebraicas lineales simultáneas. Dos métodos (el gráfico y la regla de Cramer) están limitados a pocas ecuaciones (< 3), de modo que tienen poca utilidad para resolver problemas prácticos. Sin embargo, esas técnicas son herramientas didácticas útiles para entender el comportamiento en general de sistemas lineales.

Los mismos métodos numéricos están divididos en dos categorías generales: métodos exactos y aproximados. El primero, como su nombre lo implica, intenta dar resulta dos exactos. Sin embargo, como están afectados por errores de redondeo, algunas veces dan resultados imprecisos. La magnitud del error de redondeo varía en cada sistema y depende de varios factores que incluyen las dimensiones del sistema, su condición y si la matriz de coeficientes es dispersa o llena. Además, la precisión de la computadora afectará el error de redondeo.

Se recomienda una estrategia de pivoteo para emplearse en cualquier programa de computadora con el fin de implementar métodos de eliminación exactos. La inclusión de esa estrategia minimiza el error de redondeo y evita problemas como el de la división entre cero. Todas las otras cosas permanecen igual, la descomposición LU basada en algoritmos son los métodos más apropiados debido a su eficiencia y flexibilidad.

T A B L A P T 3 . 2 Comparación de las características de métodos alternativos para encontrar soluciones a ecuaciones algebraicas lineales simultáneas.

Método Es tabi l idad Precis ión Rango de aplicación

Es fue rzo de programación Comentar ios

Gráfica

Regla de Cramer

Eliminación de Gauss (con pivoteo parcial) Descomposición LU

Pobre Limitada

Afectada por errores Limitada de redondeo

Afectada por errores General de redondeo Afectada por errores General de redondeo

Moderado

Moderado

Puede tomar más tiempí > que el método numério > Excesivo esfuerzo computacional requerid > para más de tres ecuaciones

Método de eliminación preferido; permile til cálculo de la matriz

Gauss-Seidel Puede no converger si no es diagonalmente dominante

Excelente Apropiada sólo para sistemas diagonalmente dominante»

Fácil

Page 21: Chapra12-20

m . é M É T O D O S A V A N Z A D O S Y R E F E R E N C I A S A D I C I O N A L E S 34»

Aunque los métodos de eliminación tienen gran utilidad, el uso de toda la matriz do coeficientes puede ser algo limitante cuando se trate con sistemas dispersos muy grandes. Esto se debe a que grandes porciones de la memoria de la computadora podrían ser dedicadas a guardar ceros, lo cual no tiene sentido. Para sistemas bandados, se dispone de técnicas para implementar métodos de eliminación sin tener que guardar todos los coeficientes de la matriz.

La técnica aproximada descrita en este libro se conoce como método de Gauss-Seidel. Difiere de las técnicas exactas en que emplea un esquema iterativo para obtener progresivamente estimaciones más cercanas a la solución. Así, el efecto del error de redondeo es un punto de discusión con el método de Gauss- Seidel, ya que se pueden continuar las iteraciones hasta que se obtenga la precisión deseada. Además, se pueden desarrollar versiones del método de Gauss-Seidel para utilizar de manera eficiente los requerimientos de almacenaje en computadora para sistemas dispersos. En consecuencia, la técnica de Gauss-Seidel es útil para grandes sistemas de ecuaciones, donde los requerimientos de almacenaje podrían llevar a problemas significativos para las técnicas exactas.

La desventaja del método de Gauss-Seidel es que no siempre converge, o algunas veces lo hace de manera lenta sobre la solución verdadera. Es muy confiable sólo para aquellos sistemas que son diagonalmente dominantes. Sin embargo, los métodos de relajación de que se dispone algunas veces corrigen estas desventajas. Además, como muchos conjuntos de ecuaciones algebraicas lineales se originan a partir de sistemas físicos y exhiben dominio de la diagonal, el método de Gauss-Seidel tiene gran utilidad para resolver problemas de ingeniería.

En resumen, diferentes factores soportarán su elección de una técnica para un problema en particular que involucra ecuaciones algebraicas lineales. Sin embargo, como se mencionó antes, el tamaño y la densidad del sistema son factores particularmente importantes en la determinación de su elección.

P T 3 . 5 R E L A C I O N E S I M P O R T A N T E S Y F O R M U L A S

Cada parte de este libro incluye una sección que resume fórmulas importantes. Aunque la parte tres no trata en realidad sólo con fórmulas, usamos la tabla PT3.3 para resumir los algoritmos expuestos. La tabla proporciona una revisión que será de gran ayuda para repasar y aclarar las principales diferencias entre los métodos.

P T 3 . 6 M É T O D O S A V A N Z A D O S Y R E F E R E N C I A S A D I C I O N A L E S

Se puede encontrar referencias generales acerca de la solución de ecuaciones lineales simultáneas enFaddeev y Faddeeva(1963), Stewart (1973), Varga (1962) y Young (1971). Ralston y Rabinowitz (1978) proporcionan un resumen general.

Muchas técnicas avanzadas están disponibles para aumentar el ahorro en tiempo y/o espacio de ecuaciones algebraicas lineales. La mayoría de éstas se concentra en propiedades de exploración de ecuaciones como las simétricas y bandadas. En particular, se dispone de algoritmos para operar sobre matrices dispersas al convertirlas a un mínimo formato bandado. Tewerson (1973) y Jacobs (1977) incluyen información sobre esta

Page 22: Chapra12-20

350 EPÍLOGO: PARTE TRES

área. Una vez que se encuentran en un formato mínimo bandado, existe una variedad de estrategias de solución eficientes que pueden emplearse, como el procedimiento de guardar en la columna activa de Bathe y Wilson (1976).

Además de los conjuntos de ecuaciones n X «, hay otro tipo de sistema donde el número de ecuaciones, m, y el número de incógnitas, n, no son iguales. A los sistemas donde m < n se les conoce como bajodeterminados. En tales casos puede ser que no tenga solución o que tenga más de una. Los sistemas donde m > n son llamados sobredeterminados. Para tales situaciones no hay solución exacta. Sin embargo, a menudo es posible desarrollar una solución convenida que intente determinar soluciones que estén "lo más cerca" de satisfacer todas las ecuaciones de manera simultánea. Un procedimiento común es resolver la ecuación en un sentido de "mínimos cuadrados" (Lawson y Hanson, 1974; Wilkinson y Reinsch, 1971). Alternativamente, se puede usar métodos de programación lineal donde las ecuaciones son resueltas en un sentido "óptimo" al minimizar algunas funciones objetivo (Rabinowitz, 1968; Dantzig, 1963; y Luenberger, 1973). En el capítulo 15 se describe con mayor detalle este procedimiento.

T A B L A P T 3 . 3 Resumen de información importante presentada en la parte tres.

P rob lemas potenciales

Método Procedimiento y soluciones

Eliminación de Gauss

a,, a 1 2 a , 3 I c{

a 2i a 22 c-23 I c2 °31 °32 °33 ' c 3.

Olí 0 1 2 0 1 3 I C ]

«22 °23 1 c2 033 1 c 3

Descomposición

*3 = c3/°33 => x2 = |c2 - a 2 3 x 3 ) / a 2 2

x, = (c, - a , 2 x , - o i 3 x 3 ) / a ,

Sustitución hacia atrás

T Descomposición "ai 1 °12 a13~ " 1 0 0 "

LU °21 °22 °23 => '21 1 0

. 031 °32 ° 3 3 . . '31 '32 1 .

uu u]2 u 1 3

0 u 2 2 u 2 3

. 0 0 u 3 3

Sustitución hacia adelante

Método de Gauss-Seidel

x', = ( q - o t 2 X 2 y!7 = ( c 2 - a 2 1 x í

X3 = ( C 3 - ° 3 1 * 1

' - o i ^ ' l / a i , ! - G^xf1 ) / a 2 2

- a 3 2 x 2 ) / a 3 3 J

Continúa iterativamente hasta -1

1 0 0 % < e s

1 y. paró todas las x,

P rob lemas : Mal condicionamiento Redondeo División entre cero

Soluciones: Alta precisión Pivoteo parcial

P rob lemas : Mal condicionamiento Redondeo División entre cero

Soluciones: Alta precisión Pivoteo parcial

P rob lemas : Divergente o converge lentamente

Soluciones: Relajación por diagonal dominante

Page 23: Chapra12-20

OPTIMIZACIÓN P T 4 . 1 M O T I V A C I Ó N

La localización de raíces (parte dos) y la optimización están relacionadas, en el sentido de que ambas involucran valores iniciales y búsqueda de un punto sobre una función. La diferencia fundamental entre los dos tipos de problemas se expone en la figura PT4.1. La localización de raíces involucra la búsqueda de raíces de una función o funciones. En contraste, la optimización involucra la búsqueda del mínimo o el máximo.

Lo óptimo es el punto donde la curva es plana. En términos matemáticos, esto corresponde al valor de x donde la derivada f'(x) es igual a cero. Además, la segunda derivada,/"^), indica si el óptimo es un mínimo o un máximo: si f"(x) < 0, el punto es un máximo; si f"(x) > 0, el punto es un mínimo.

Si comprendemos ahora la relación entre raíces y óptimo podríamos sugerir una posible estrategia para determinar el último. Esto es, se puede diferenciar la función y localizar la raíz (es decir, el cero) de la nueva función. De hecho, algunos métodos de optimización buscan encontrar un óptimo al resolver la raíz del problema: f'{x) — 0. Debería observarse que tales búsquedas con frecuencia son complicadas porque f'(x) no está disponible analíticamente. Por tanto, a veces se debe usar aproximaciones por diferencia finita para estimar la derivada.

Más allá de ver la optimización como un problema de raíces, debería observarse que la tarea de localizar el óptimo está reforzada por alguna estructura matemática extra que no es parte del hallazgo de una simple raíz. Esta tiende a hacer de la optimización una tarea más fácil de seguir en particular para casos multidimensionales.

P T 4 . 1 . 1 Métodos s in computadora e histor ia

Como se mencionó antes, los métodos de cálculo diferencial aún están en uso para determinar soluciones óptimas. Todos los estudiantes de ciencia e ingeniería recuerdan el trabajo con problemas de máximos y mínimos cuando determinan las primeras deriva-

FIGURA PT4.1 Una función de una sola variable ilustra la diferencia entre raices y el óptimo.

Máximo

0 x

Page 24: Chapra12-20

3 5 4 OPTIMI I Z A C I Ó N

das de l a s funciones en sus cursos de cálculo. Bemoulli, Euler, Lagrange y otros, intro-d u j e r o m l ° s fundamentos del cálculo de variaciones, el cual trata con la minimización de funcionales. El método de los multiplicadores de Lagrange se desarrolló para optimizar p rob l e r rnas restringidos; es decir, problemas de optimización donde las variables son conf i n a d a ^ en alguna forma.

El primer avance de importancia en los procedimientos numéricos ocurrió con el desar rcol lo de las computadoras digitales después de la Segunda Guerra Mundial. Koopmans en el R - e i n o Unido y Kantorovich en la ex Unión Soviética, trabajaron en forma independiente ¡ ^ o b r e el problema general de distribución a bajo costo de artículos y productos. En 1947, e s ¡ l estudiante de Koopman, Dantzig, inventó el método simplex para resolver problemas - <3 e programación lineal. Este método abrió el camino a muchos investigadores hacia otros rrrT-étodos de optimización restringida; entre los más notables se encuentran Chames y sus cc^>laboradores. El planteamiento de la optimización restringida también se desarrolló en f ^ o r m a rápida siguiendo la disponibilidad tan amplia de las computadoras.

P T 4 . 1 - 2 Optimización y práctica de la ingeniería

La m a ^ ' - 0 1 ™ de los modelos matemáticos con que hemos tratado hasta ahora han sido descriptivos- Es decir, se han derivado de simular el comportamiento de un dispositivo o s i s t e m a de la ingeniería. En contraste, la optimización tiene que ver típicamente con la deterrrínínación del "mejor resultado", u óptima solución, de un problema. Así, en el contexto d ^ e l modelado, los modelos matemáticos son con frecuencia llamados modelos prescri^ptivos, puesto que se usan para prescribir un curso de acción o el mejor diseño.

Lcr>s ingenieros deben diseñar en forma continua dispositivos y productos que realicen t a r - ^ a s e n forma efectiva. Al hacer esto, ellos están restringidos por las limitaciones del mu n d o físico. Además, deben mantener costos bajos. Así, los ingenieros siempre se hallará J i confrontado problemas de optimización que equilibren el comportamiento y las l imi t ac=- i ° n e s - Algunos ejemplos comunes se listan en la tabla PT4.1. El siguiente ejem-

TABUBt PT4.1 Algunos ejemplos comunes de optimización en la ingeniería.

• G\s~&ño de un avión para un mínimo peso y máxima resistencia. • Tro yectorias óptimas de vehículos espaciales, • D ¡ » e ñ o de estructuras en la ingeniería civil con un mínimo costo. • Disv- e ño de proyectos de abastecimiento de agua, como en presas, para mitigar el daño por inundación

m i e n t r a s se obtiene máxima potencia de generación. • Pre^decír el comportamiento estructural al minimizar la energía potencial. • E s t * " a , e 9 ¡ a de corte de materiales para un costo mínimo. • D¡sv©ño de bombas y equipos de transferencia de calor para máxima eficiencia. • M c a ; < ¡ m ' 2 a r 1° potencia de salida de redes eléctricas y maquinaria mientras se minimiza el caloi

generado. • Rut o m á s corta de un vendedor que visita varias ciudades durante un viaje de venias. • Pie* neación óptima y calendarizada. • An*ci l ¡ s ¡ s estadístico y modelado con un mínimo error. • R e e J e s de tubería óptimas. • Q ^ n t r p l de inventario. • Pío neación del mantenimiento para minimizar costos. • Mi n imízar tiempos de espera y ociosos. • D i s -eñor sistemas de tratamiento de aguas para cumplii con «sláiiclmos do uilklud ilnl nijiici ci bu|ii

c o s t o -

Page 25: Chapra12-20

PT4.1 MOTIVACIÓN 355 pío ha sido desarrollado para ayudarlo a obtener una visión de la forma on la que tule» problemas se podrían formular.

EJEMPLO PT4.1 Optimización del costo de un paracaídas

] Enunciado del problema. A través de este libro, hemos usado la caída de un paracai-! dista para ilustrar las áreas básicas de un problema de métodos numéricos. Usted puede ] haber notado que ninguno de estos ejemplos se concentró en lo que pasa después de que

se abre el paracaídas. En este ejemplo examinaremos un caso donde el paracaídas se i abre, y en el cual nos interesaremos en predecir la velocidad de impacto en el suelo.

Usted es un ingeniero que trabaja para una compañía aérea que lleva abastecimientos a los refugiados en una zona de guerra. Los abastecimientos se dejarán caer a baja

í altitud (500 m), de tal forma que la caída no sea detectada y que los abastecimientos caigan tan cerca como sea posible del campo de refugiados. Los paracaídas abren en

i forma inmediata casi al salir del aeroplano. Para reducir el daño, la velocidad vertical de impacto debe ser menor que un valor crítico de vc = 20 m/s.

El paracaídas que se usa para la caída se ilustra en la figura PT4.2. El área transversal del paracaídas es el de una semiesfera,

! A = 2nr2 (PT4.1)

La longitud de cada una de las 16 cuerdas que sostienen al paracaídas con la masa está relacionada con el radio del paracaídas por

í = V2r (PT4.2)

Usted sabe que la fuerza de arrastre en el paracaídas, es una función lineal de su área de sección transversal descrita por la siguiente fórmula

! c = kcA (PT4.3)

donde c = coeficiente de arrastre (kg/s) y kc = constante de proporcionalidad parametrizando el efecto del área sobre el arrastre [kg/(s • m 2 )] .

F I G U R A PT4.2 Un paracaídas abierto.

Page 26: Chapra12-20

356 OPTIMIZACIÓN

También, es posible dividir la carga total en tantos paquetes como quiera. Es decir, la masa de cada paquete individual se puede calcular como

M, m = —

n

donde m = masa de cada paquete individual (kg), Mt — carga total que habrá de arrojarse (kg) y n = número total de paquetes.

Por último, el costo de cada paracaídas está relacionado con el tamaño en una forma no lineal,

Costo por paracaídas = c 0 + cxl + c2A2 (PT4.4)

donde c 0 , cx y c2 = coeficientes de costo. El término constante, c 0 , es el valor base para los paracaídas. La relación no lineal se debe a que la manufactura de los paracaídas de

¡ gran tamaño es más complicada que la de los paracaídas pequeños, j Determine el tamaño (r) y el número de paracaídas («) que puedan obtenerse a un | mínimo costo, y que cumplan al mismo tiempo el requerimiento de tener una velocidad | de impacto suficientemente pequeña. ! I Solución. El objetivo aquí es determinar la cantidad y tamaño de paracaídas que mini-| micen el costo del planeador. El problema está restringido, ya que los paquetes deben | tener una velocidad de impacto menor al valor crítico. | El costo se puede calcular al multiplicar el valor de un paracaídas individual [ecua-| ción (PT4.4)] por el número de paracaídas («). Así, la función que usted quiere minimi-| zar, la cual es llamada formalmente función objetivo, se escribe como

Minimizar C = n(cQ + cxi + c2A2) (PT4.5)

¡ donde C = costo ($) y A y (, se calculan con las ecuaciones (PT4.1) y (PT4.2), respecti-j vamente. j Después, usted debe especificar las restricciones. Para este problema existen dos | restricciones. i Primera, la velocidad de impacto debe ser igual o menor que la velocidad crítica. \

\ v <vc (PT4.6)

Segunda, el número de paquetes debe ser un entero y mayor o igual a 1,

¡ n>\ (PT4.7)

I A A | donde n es un entero. I En este punto, el problema de optimización se ha formulado. Como puede verse, es | un problema restringido no lineal.

Aunque el problema se ha formulado en forma amplia, algo más se debe tener en | cuenta: ¿cómo se determina la velocidad de impacto vi Recuerde del capítulo 1 que la | velocidad de un objeto en caída se puede calcular con

L ) = _ , . - - «•/«>/) (1 -10)

Page 27: Chapra12-20

PT4.1 MOTIVACIÓN

donde v = velocidad (m/s), g = aceleración de la gravedad (m/s 2), m = masa (kg) y t = tiempo (s).

Aunque la ecuación (1.10) provee una relación entre v y r, se necesita conocer en cuánto tiempo cae la masa. Por tanto, es necesaria una relación entre la distancia de calda z y el tiempo de caída t. La distancia de caída se puede calcular de la velocidad en la ecuación (1.10) por integración

Jo c Esta integral se puede evaluar para obtener

(PT4.8)

gm t

z0 1 c

-{c/m)t (PT4.9)

donde z 0 = altura inicial (m). Esta función, como muestra la gráfica de la figura PT4.3, provee una forma de predecir z conociendo t.

Sin embargo, no se necesita z como una función de t para resolver este problema. En lugar de esto, se debe calcular el tiempo requerido por el paquete para recorrer en caída la distancia z 0 . Así, se reconoce que se ha formulado la ecuación (PT4.9) como un problema de determinación de raíces. Esto es, se debe resolver para el tiempo al cual z se acerca a cero.

0 = z 0 - — t -c

gm-(1

-(c/m)t (PT4.10)

Una vez que se calcula el tiempo de impacto, se puede sustituir en la ecuación (1.10) con el fin de resolver para la velocidad de impacto.

Page 28: Chapra12-20

3 5 8 OPTIMIZACIÓN

La especificación final del problema podría ser

Minimizar C = n(c0 + c,€ + c2A2)

sujeta a

v < vc

n > 1

donde

A = 2nr2

l = 4lr

c = kcA

Mi m = —

n

t = raíz

c

(PT4.1 I)

(PT4.12)

(PT4.13)

(PT4.14)

(PT4.15)

(PT4.16)

(PT4.17)

(PT4.18)

(PT4.19)

Resolveremos este problema en el ejemplo 15.4 al final del capítulo 15. Por ahora, reconozca que se tiene uno de los elementos fundamentales de los otros problemas de optimización, que usted enfrentará en la práctica de la ingeniería. Estos son

• El problema involucrará una función objetivo que contiene su meta. • Tendrá también un número de variables de diseño. Estas pueden ser números reales

o enteros. En nuestro ejemplo, estas variables son r (real) y n (entero). • El problema incluirá restricciones que reflejan las limitaciones bajo las cuales se

trabaja.

Plantearíamos un punto más antes de proceder. Aunque la función objetivo y restricciones pueden, en forma superficial, parecer simples ecuaciones [por ejemplo, la ecuación (PT4.12)], de hecho son la "punta del iceberg". Es decir, pueden estar basadas en modelos y dependencias complejas. Por ejemplo, en nuestro caso, pueden involucrar otros métodos numéricos [ecuación (PT4.18)]. Esto significa que las relaciones funcionales que usted estará usando podrían de hecho representar cálculos grandes y complicados. Así, pueden ser en extremo valiosas las técnicas que pueden encontrar lu solución óptima, mientras se minimizan las funciones de evaluación.

Page 29: Chapra12-20

PT4.2 BASES MATEMÁTICAS

P T 4 . 2 B A S E S M A T E M Á T I C A S

Existen infinidad de conceptos matemáticos y operaciones que son la base de lu optimización. Como creemos que para usted éstos serán más relevantes en contexto, se dejará el análisis de los prerrequisitos matemáticos hasta que se ocupen. Por ejemplo, se analizarán los importantes conceptos del gradiente de Hessians al inicio del capítulo 14 sobre la optimización de multivariables no restringidas. Mientras tanto, nos limitaremos a un tópico más general de cómo se clasifican los problemas de optimización.

Un problema de programación matemática u optimización, se puede establecer en forma general como

Determine x, el cual minimiza o maximiza/(x) sujeto a

d¡{x)<a¡ / = l , 2 , . . . , m (PT4.20)

e¡(x) = bi ¿ = 1 , 2 , ( P T 4 . 2 1 )

donde x es un vector de diseño con n dimensiones, f(x) es la función objetivo; d¡(x) son las restricciones de desigualdad; e¡(x) son las restricciones de igualdad, y a¡ y b¡ son constantes.

Los problemas de optimización se pueden clasificar con base en la forma de f(x):

• Si f(x) y las restricciones son lineales, tenemos programación lineal. • Si f(x) es cuadrática y las restricciones son lineales, tenemos programación

cuadrática. • Si f(x) es no lineal o cuadrática y/o las restricciones son no lineales, tenemos pro

gramación no lineal.

Además, cuando las ecuaciones (PT4.20) y (PT4.21) se incluyen, tenemos un problema de optimización restringida; de otra forma, es un problema de optimización no restringido. '

Observe que para problemas restringidos, los grados de libertad están dados por n-p. Generalmente, para obtener una solución,/? debe ser <n.Sip>n, se dice que el problema es sobrerrestringido.

Otra forma en la cual se clasifican los problemas de optimización es mediante dimensionalidad. Esto es muy común al dividir los problemas en unidimensionales y multidimensionales. Como su nombre implica, los primeros involucran funciones que dependen de una sola variable. Como en la figura PT4.4a, la búsqueda entonces consiste en ascender o descender los picos y valles unidimensionales. Los problemas multidimensionales involucran funciones que dependen de dos o más variables dependientes. En el mismo sentido, la optimización bidimensional se puede de nuevo visualizar como una búsqueda de picos y valles (véase PT4.46). Sin embargo, justo como en una caminata, no estamos restringidos a caminar en una sola dirección; en lugar de esto se examina ln topografía para alcanzar la meta en forma eficiente.

Finalmente, el proceso de encontrar un máximo versus encontrar un mínimo es en esencia idéntico, ya que el mismo valor, x*, min imiza /^ ) y maximiza —f(x). Esta equivalencia se ilustra en forma gráfica por una función unidimensional en la figura PT.4«.

Page 30: Chapra12-20

3 6 0 OPTIMIZACIÓN

a) b)

F IGURA P T 4 . 4 a) Optimización unidimensional. Esta figura también ilustra cómo la minimización de f(x¡ es equivalente a la maximización de -f[x). b) Optimización bidimensional. Observe que esta figura puede tomarse para representar, ya sea una maximización (los contornos aumentan con la elevación hasta un máximo como en una montaña) o una minimización (los contornos disminuyen a un mínimo como un valle).

P T 4 . 3 O R I E N T A C I Ó N

Alguna orientación es útil antes de proceder con los métodos numéricos de optimización. Lo siguiente, tiene la intención de proveer una revisión del material visto en la parte cuatro. Además, se han incluido algunos objetivos para ayudar a enfocar los esfuerzos cuando se estudie el material.

P T 4 . 3 . 1 Alcance y anticipación

La figura PT4.5 es una representación esquemática de la organización de la parte cuatro. Examine esta figura con cuidado, comenzando arriba y después en sentido de las manecillas del reloj.

Después de la introducción, el capítulo 13 se dedica a la optimización unidimensional no restringida. Se presentan métodos para determinar el mínimo o máximo de una función de una sola variable. Se cubren tres métodos: búsqueda sección-dorada, interpolación cuadrática y el método de Newton. Estos métodos tienen también relevancia en la optimización multidimensional.

El capítulo 14 cubre dos tipos generales para resolver problemas de optimización ' - • ' - J — ' - > - i — — A i v a t i t n * t a l a * p n m o húsauadcii (¡lucítotliw,

Page 31: Chapra12-20

PT4.3 ORIENTACIÓN 361

búsquedas invariables y búsquedas de patrones, no requieren la evaluación de las derivadas de la función. Por otro lado, los métodos gradiente usan algunas veces la primera y otras la segunda derivada para encontrar el óptimo. El capítulo introduce el gradiente y el Hessian, los cuales son representaciones multidimensionales de la primera y segunda derivadas. El método de paso ascendente/descendente es entonces cubierto con algún detalle. A esto le siguen descripciones de algunos métodos avanzados: gradiente conjugado, el método de Newton, el método de Marquardt y los métodos cuasi-Newton.

El capítulo 15 se dedica a la optimización restringida. La programación lineal se describe con detalle usando ambos: la representación gráfica y el método simplex. El análisis detallado de optimización restringida no lineal está fuera del alcance de este libro, pero se dará un repaso a los principales enfoques. Además, se ilustra cómo tales problemas, junto con los estudiados en los capítulos 13 y 14, se pueden obtener con las librerías y paquetes de software como Excel, Mathcad e IMSL.

El capítulo 16 extiende los conceptos anteriores a problemas actuales de la ingeniería. Se utilizan aplicaciones de la ingeniería para ilustrar cómo se formulan los problemas de optimización y en qué forma se provee una visualización en la aplicación de las técnicas de solución en la práctica profesional.

Se incluye un epílogo al final de la parte cuatro. Este contiene un repaso de los métodos analizados en los capítulos 13,14 y 15. Este repaso incluye una descripción de los elementos de juicio relacionados con el uso apropiado de cada técnica. Esta sección también provee referencias de algunos métodos numéricos que van más allá del alcance de este texto.

P T 4 . 3 . 2 Metas y objetivos

Objetivos de estudio. Después de haber analizado la parte cuatro, usted tendrá suficiente información para plantear con éxito una amplia variedad de problemas de la ingeniería relacionados con la optimización. En general, usted debería dominar las técnicas, haber aprendido a evaluar su confiabilidad y detectar métodos alternativos de análisis para un problema particular. Además, de estas metas generales, deberían ser asimilados los conceptos específicos dados en la tabla PT4.2 para un aprendizaje comprensivo del material de la parte cuatro.

Objetivos computacionales. Usted debería ser capaz de escribir un subprograma que implemente una búsqueda simple unidimensional (como la búsqueda dorada o la interpolación cuadrática) y multidimensional (como el método de búsqueda aleatorio). Además, programas de librerías como el IMSL y los paquetes de software tales como Excel o Mathcad tienen una variedad de capacidades para la optimización. Usted puede usar esta parte del libro para familiarizarse con todas estas capacidades.

Page 32: Chapra12-20

3Ó2 OPTIMIZACIÓN

15,2 Restricciones

no lineales

F I G U R A P T 4 . 5 Esquema de la organización del material en la parte cuatro: Optimización.

Page 33: Chapra12-20

PT4.3 ORIENTACIÓN lis TABLA P T 4 . 2 Objetivos de estudio específicos para la parte cuatro.

1. Comprender por qué y dónde ocurre la optimización al resolver problemas de ingeniería. 2. Comprender los elementos principales del problema de optimización en general: función ob|elivo,

variables de decisión y restricciones. 3. Ser capaz de distinguir entre la optimización lineal y no lineal, y entre problemas restringidos y no

restringidos. 4. Poder definir la relación dorada y comprender cómo realiza una eficiente optimización unidimensional. 5. Localizar el óptimo de una función con una sola variable con la búsqueda de la sección dorada,

interpolación cuadrática y el método de Newton. También, reconozca los elementos de juicio entre estos enfoques, con particular atención en los valores iniciales y en la convergencia.

ó. Ser capaz de escribir un programa y resolverlo para el óptimo y la función multivariable usando búsqueda aleatoria.

7. Comprender las ideas detrás de los patrones de búsqueda, direcciones conjugadas y el método de Powell.

8. Poder definir y evaluar el gradiente y Hessian de una función multivariable, ambas en forma analítica y numérica.

9. Calcular a mano el óptimo de una función con dos variables, usando el método de paso ascendente/ descendente.

10. Comprender las ideas básicas detrás de los métodos del gradiente conjugado, de Newton, de Marquardt y de cuasi-Newton. En particular, comprender los elementos de juicio de los enfoques y reconocer cómo cada uno mejora sobre el paso ascendente/descendente.

1 1 . Ser capaz de reconocer y acondicionar un problema de programación lineal para representar aplicaciones de los problemas en ingeniería.

1 2. Poder resolver un problema de programación lineal bidimensional con ambos métodos: el gráfico y el simplex.

1 3. Comprender los cuatro posibles resultados de un problema de programación lineal. 14. Ser capaz de acondicionar y resolver problemas de optimización restringidos no lineales mediante

un paquete de software.

Page 34: Chapra12-20

CAPÍTULO 13

Optimización unidimensional no restringida

Esta sección describirá las técnicas para encontrar el mínimo o máximo de una función de una sola variable,/(x). Una imagen útil en este sentido es la unidimensional "montaña rusa", como la función ilustrada en la figura 13.1. Recuerde de la parte dos, que la localización de una raíz fue complicada por el hecho de que varias raíces ocurren para una sola función. De manera similar, ambos, el óptimo local y el óptimo global, pueden ocurrir en optimización. Tales casos son llamados multimodal. En casi todos los ejemplos, estaremos interesados en encontrar el valor absoluto máximo o mínimo de una función. Así, debemos cuidar de no equivocarnos con un óptimo local en vez de un óptimo global.

Distinguir un extremo global de un extremo local puede ser un problema difícil para el caso general. Existen tres formas usuales de enfocar este problema. Primero, la visua-lización en el comportamiento de funciones de bajas dimensiones puede algunas veces obtenerse en forma gráfica. Segundo, determinar la óptima con base en los valores iniciales, que varían muy ampliamente y quizá sean generados en forma aleatoria, y después seleccionar el más grande de éstos como global. Por último, cambiar el punto de inicio asociado con un óptimo local y ver si la rutina regresa a un mejor punto, o siempre regresa al mismo punto. Aunque todos estos planteamientos tienen su utilidad, el hecho es que en algunos problemas (usualmente los más grandes), quizá no hay una forma práctica de asegurar que se ha localizado un óptimo global. Sin embargo, aunque se

V

F I G U R A 13 .1 Una función que asintóticamente se aproxima a cero en más y menos °° y tiene dos puntos máximos y dos puntos mínimos en la vecindad del origen. Los dos puntos a la derecha son los óptimos locales, mientras que los dos de la izquierda son globales.

A

Máximo^R^l Máximo global / \ O*^" local

Mínimo \ i global —

X

Mínimo

Page 35: Chapra12-20

13.1 B U W S U E P A DE LA SECCIÓN DORAL7A

ilcberhi ser siempre sensible ul lema, se liene la fortuna de que hay numerosos problemas en la ingeniería donde se puede localizar el global óptimo en una forma no ambigua.

Como en la localización de raíces, la optimización en una dimensión se puede dividir en métodos que usan intervalos y métodos abiertos. Como se describirá en la próxima sección, la búsqueda de sección dorada, es un ejemplo de un método de intervalo que depende de los valores iniciales y que contiene un solo óptimo. Este es seguido por un procedimiento de intervalo algo más sofisticado (la interpolación cuadrática).

El método final descrito en este capítulo es un método abierto que se basa en la idea del cálculo de que se puede encontrar el mínimo o máximo al resolver f(x) = 0. Esto reduce el problema de optimización para encontrar la raíz d e / \ x ) mediante las técnicas de esa clase descritas en la parte dos. En seguida se mostrará una versión de este planteamiento (el método de Newton).

1 3 . 1 B Ú S Q U E D A DE L A S E C C I Ó N D O R A D A

Al resolver para la raíz de sólo una ecuación no lineal, la meta fue la de encontrar la variable x que diera cero en la función f(x). La optimización de una sola variable tiene como meta encontrar el valor de x que generará un extremo, ya sea un máximo o un mínimo de f(x).

La búsqueda de la sección dorada es una técnica simple, de búsqueda de una sola variable de propósito general. Es similar en esencia al enfoque de la bisección para localizar raíces (capítulo 5). Recuerde que la bisección depende del intervalo definido, especificado por un valor inicial inferior (x,) y un valor inicial superior (xj, que ajusta a una sola raíz. La presencia de una raíz entre estas fronteras se verifica al determinar que f(x¡) Y /(*«) tienen signos diferentes. La raíz se estima entonces como el punto medio de este intervalo,

xi + xu

El paso final en una iteración por bisección involucró determinar el intervalo más pequeño. Esto se hizo al reemplazar cualquiera de las fronteras x¡ o xu, que tuvieran un valor de la función con el mismo signo que f(xr). Un efecto útil de este procedimiento fue que el nuevo valor xr, reemplazará a una de las fronteras anteriores.

Ahora se puede desarrollar un procedimiento similar para localizar el óptimo de una función unidimensional. Por simplicidad, nos concentraremos sobre el problema de encontrar un máximo. Cuando se analice el algoritmo de cómputo, se describirán las pequeñas modificaciones necesarias para simular un mínimo.

Como con el método de la bisección, se puede comenzar por definir un intervalo que contenga una sola respuesta. Es decir, el intervalo debería contener un solo máximo, y por esto es llamado unimodal. Podemos adoptar la misma nomenclatura que para la bisección, donde x¡ y xu, definen los límites inferior y superior de ese intervalo. Sin embargo, en contraste con bisección, se necesita una nueva estrategia para encontrar un máximo dentro del intervalo. En vez de usar solamente dos valores función (los cuales son suficientes para detectar un cambio de signo, y por tanto un cero), se necesitarían tres valores función para detectar si ocurre un máximo. Así, se ha escogido un punto adicional dentro del intervalo. Después, se toma un cuarto punto. Entonces, lu pruebn

Page 36: Chapra12-20

OPTIMIZACIÓN UNIDIMENSIONAL N O RESTRINGIDA

f[x)k

Primera iteración

F IGURA 13 .2 El paso inicial del algoritmo de búsqueda de la sección dorada involucra escoger dos puntos interiores de acuerdo con la razón dorada.

para el máximo podría aplicarse para discernir si el máximo ocurre dentro de los prime ros tres o en los últimos tres puntos.

La clave para hacer eficiente este procedimiento es la mejor elección de los punlim intermedios. Como en la bisección, la meta es minimizar las funciones evaluación ni remplazar los valores anteriores con los nuevos. Esta meta se puede alcanzar al especificar que las siguientes dos condiciones se cumplan (véase figura 13.2):

La primera condición especifica que la suma de las dos sublongitudes €x y £2 debe m igual a la longitud original del intervalo. La segunda indica que el cociente o razón de I I IN

longitudes debe ser igual. La ecuación (13.1) se puede sustituir en la (13.2),

lo = li +h ( 1 3 . 1 )

( I 3 . ; >

ÍI+Í2 ( I - V I )

Si se toma el recíproco y R = € 2 /€, , se llega a

( 1 1 4 )

o R2 + R- 1 = 0 ( I . U )

la cual se puede resolver para la raíz positiva

Page 37: Chapra12-20

13.1 BÚSQUEDA DE LA SECCIÓN DORADA 367

Cuadro 13.1 La razón dorada y los números de Fibonacci

l i l i muchas culturas, a ciertos números se les otorga cualidades. I'or ejemplo, en Occidente se suele decir "el 7 de la suerte" y "viernes 13". Los antiguos griegos llamaron al siguiente número ln "razón dorada":

>A I : 0.61803.

I ' . N I I I razón fue empleada para un gran número de propósitos, Incluyendo el desarrollo del rectángulo como en la figura 13.3. I ' N U I N proporciones fueron consideradas por los griegos como Místicamente agradables. Entre otras cosas, muchos de los tem-pliiN siguieron esta forma.

I ,a razón dorada se relaciona con importantes series maternal icns conocidas como los números de Fibonacci, los cuales •on

0. I , 1 , 2 , 3 , 5 , 8 , 1 3 , 2 1 , 3 4 , . . .

Así, cada número después de los dos primeros representa la mima de l o s dos precedentes. Esta secuencia detonó en muchas rtii'iiN diversas de la ciencia y la ingeniería. E n el contexto del p í n t e n l e análisis, una interesante propiedad de la secuencia de I ' I I M I I I I I C C Í relaciona la razón de números consecutivos en la se-Himieia; os decir, 0/1 = 0, 1/1 = 1, 1/2 = 0.5,2/3 = 0.667, 3/5 — (lo, 1/H = 0.625, 8/13 = 0.615, y asi sucesivamente. ¡Como mi|iunenios, la razón de números consecutivos se aproxima a la l»*on dorada!

F IGURA 1 3 . 3 El Partenón de Atenas, Grecia, fue construido en el siglo v antes de Cristo. Sus dimensiones frontales pueden casi ajusfar en forma exacta dentro de un rectángulo dorado.

Este valor, el cual se conoce desde la antigüedad, es llamado la razón dorada (vea el

cuadro 13.1). Ya que permite encontrar en forma eficiente el óptimo, es el elemento

clave del método de la sección dorada que hemos desarrollado conceptualmente. Ahora

derivemos un algoritmo para implementar este procedimiento en la computadora.

Como se mencionó antes y se ilustra en la figura 13.4, el método comienza con dos

valores iniciales, x¡ y xu, que contienen un extremo local de f(x). Después, dos puntos

interiores x{ y x2 se escogen de acuerdo con la razón dorada,

d = — - — ( x u - x¡)

x\ = xi + d

x2 = x„ - d

La función HO evalúa en esto» dos puntos interiores. Dos resultados pueden ocu

rrir:

Page 38: Chapra12-20

368 OPTIMIZACIÓN UNIDIMENSIONAL NO RESTRINGIDA

f(x) Eliminar

Extremo (máximo)

>v ' i

f'f ,!• \ • - l • • . t- -i i i i 1 i w

x¿< d xu

a)

/W4

Xf Xg X] X Antiguo x 2 Antiguo x¡

b)

F IGURA 13 .4 o) El paso inicial del algoritmo de búsqueda de la sección dorada involucra escoger dos puntos interiores de acuerdo con la razón dorada, b) El segundo paso involucra definir un nuevo intervalo que incluya el óptimo.

1. Si, como es el caso en la figura 13.4,/(x f) > f(x2), entonces el dominio de x a I» izquierda de x2J de x¡ a x2, se puede eliminar, ya que no contiene el máximo. Para este caso, x2 pasa a ser el nuevo x¡ para la siguiente vuelta.

2. Si ha ocurrido que/ (x 2 ) > f{xx), entonces el dominio de x a la derecha de x l 5 de x, a xu podría ser eliminado. En este caso x t pasa a ser el nuevo xu para la siguiente iteración.

Ahora, éste es el beneficio real del uso de la razón dorada. Debido a que los x, y .v;

originales se han escogido mediante la razón dorada, no se tiene que recalcular todos los valores de la función para la siguiente iteración. Por ejemplo, para el caso expuesto en la figura 13.4, el anterior X j pasa a ser el nuevo x2. Esto significa que ya se tiene el valor para el nuevo/(x 2 ) , puesto que es el mismo valor de la función en el anterior xv

Para completar el algoritmo, ahora sólo se necesita determinar el nuevo xt. listo NC realiza con la misma proporcionalidad que antes,

.vi = xi -I V5 - 1 -(.v„ -.v/)

Page 39: Chapra12-20

13.1 BÚSQUEDA DG LA SECCIÓN DORADA 36*

Un procedimiento similar podría usarse para el caso alterno donde el óptimo está en la izquierda del subintervalo.

Como las iteraciones se repiten, el intervalo que contiene el extremo se reduce rápidamente. De hecho, en cada vuelta el intervalo se reduce por un factor de la razón dorada (aproximadamente el 61.8%). Esto significa que después de 10 vueltas, el intervalo se acorta a cerca de 0.618 1 0 o 0.008 o 0.8% de su longitud inicial. Después de 20 vueltas, se acerca al 0.0066%. Esta reducción no es tan buena como la que se alcanza con bisección, pero éste es un problema más difícil.

EJEMPLO 13.1 Búsqueda de la sección dorada

Enunciado del problema. Use la búsqueda de la sección para encontrar el máximo de

x1

f(x) — 2 sen* —

10

dentro del intervalo x¡ = 0 y xu — 4.

Solución. Primero, se usa la razón dorada para crear los dos puntos anteriores 0) = 2.472

2.472 1.528

La función se puede evaluar en los puntos interiores

f(x2) = / ( 1 . 5 2 8 ) = ^ - 2 sen (1.528) = 1.765

/ (* , ) = /(2.472) = 0.63

Debido a que f(x2) >/(*i), el máximo en el intervalo está definido por x¡, x2 y xx. Así, para el nuevo intervalo, la frontera inferior permanece xt = 0, y x, pasa a ser la frontera superior; esto es, xu = 2.472. Además, el primer valor x2 pasa a ser el nuevo x¡; esto es, x, = 1.528. Además, no se tiene que recalcular/(x,) ya que se determinó en la

; iteración previa como/(l .528) = 1.765. Todo lo que falta es calcular la nueva razón dorada y x 2 ,

d = 1 (2.472 - 0) = 1.528

x 2 = 4 - 1.528 = 0.944

La evaluación de la función en x 2 es/(0.994) =1.531. Como este valor es menor que el valor de la función en x ( , el máximo está en el intervalo prescrito por x2, x{ y xu.

i ül proceso se puede repetir, con los resultados tabulados en seguida:

V 5 - 1 ( 4 -

xx = 0 + 2.472 = x 2 = 4 - 2.472 =

Page 40: Chapra12-20

370 OPTIMIZACIÓN UNIDIMENSIONAL NO RESTRINGIDA

/ '(*/) x 2 í(x 2) d

1 0 0 '1 .5279 1.7647 2.4721 0 .6300 4 .0000 - 3 . 1 1 3 6 2 .4/71

2 0 0 0.9443 1.5310 1.5279- 1.7647 2 .4721 0 .6300 1.52/9

3 0 .9443 1.5310 1.5279 1.7647 1.8885 - 1.5432 2 . 4 7 2 1 ' 0 .6300 0.9443

4 0 .9443 1.5310 1.3050 1.7595 1.5279 1.7647 1.8885 1.5432 0 .5836

5 1.3050 1.7595 1.5279 1,7647 1.6656 1.7136 1.8885 1.5432 0 . 3 6 0 /

6 1.3050 1.7595 1.4427 1.7755 1.5279 1.7647 1.6656 1.7136 0 .2229

7 1.3050 1.7595 1.3901 1.7742 1.4427 1.7755 1.5279 1.7647 0.1378

8 1.3901 1.7742 1.4427 1.7755 1.4752 1.7732 1.5279 1.7647 0.0851

Observe que el máximo actual está resaltado para cada iteración. Después de ocho iteraciones, el máximo ocurre en x = 1.4427 con un valor función de 1.7755. Así, el resultado es convergente sobre el valor verdadero de 1.7757 enx = 1.4276.

Recuerde que por bisección (véase sección 5.2.1), se puede calcular un límite superior exacto en cada iteración. Usando un razonamiento similar, un límite superior para la búsqueda de la sección dorada se puede derivar como sigue.

Una vez que se completa una iteración, el óptimo estará en uno de los dos intervalos. Si x2 es el valor de la función óptima, estará en el intervalo inferior (x¡, x2, x,). Si x, es el valor de la función en el punto óptimo, estará en el intervalo superior (x 2, xv xu). Debido a que los puntos interiores son simétricos, cualquier caso se puede usar para definir el error.

Observando en el intervalo superior, si el valor verdadero estuviera en el extremo izquierdo, la máxima distancia de la estimada podría ser

A.v0 = xi - x 2

= x\ + R{xu - x¡) - x„ + R(xu - x¡) = (x, - x „ ) +2R(xu -xi) = {IR - !)(*„-*,)

o 0.236 (xu — x¡) Si el valor verdadero estuviera en el extremo derecho, la máxima distancia de la

estimada podría ser

Axft = x¡, - x\

= x„ - x¡ - R(xu - x¡)

= ( 1 - / ? ) ( * « - * / )

o 0.382 (xu — x¡). Por tanto, este caso podría representar el error máximo. Tal resultado puede entonces ser normalizado al valor óptimo para esa iteración, x o p t para dar

Sa = 0 - / 0 Xu ~ XI

100%

Esta estimación proporciona una base para terminar las iteraciones.

Page 41: Chapra12-20

13.1 BÚSQUEDA DE LA SECCIÓN DORADA

P IOURA 13 .5 FUNCTION Gold FUNCTION Gold (xíow.xhigh.maxit.es.fx)

xt — xlow; xu = xhigh ¡ter = 1 d = R*(xu- xt) xí = xt + d; x2 = xu — d fí = f(x1) f2 = f(x2) IF fí > fZ THEN IF fí < f2 THEN

xopt 1 xí fx=fí

ELSE xopt = x2 fx= f2

END ¡F DO

d = K*d IFfí>f2 THEN IFfí<f2 THEN

xt = x2 x2= x1 x1 - xt+d f2= fí fí = f(x1)

EL5E xu — xí xí = x2 x2 = xu—d fí = f2 f2 = f(x2)

END IF ¡ter = iter+1 IFfí > f2 THEN IFfí < f2 THEN

xopt = xí fx=fí

EL5E xopt - x2 fx=f2

END IF IFxopt*0. THEN

ea = (1.-R)*A8S((xu - xt)/xopt) * 100. END IF IF ea < es OK ¡ter > maxit EXlT

END DO Gold — xopt END Gold

«) Maximización b) Minlmlzaolón

Page 42: Chapra12-20

3 7 2 OPTIMIZACIÓN UNIDIMENSIONAL NO RESTRINGIDA

En la figura 13.5a, se presenta el pseudocódigo del algoritmo de búsqueda de la sección dorada. En la figura 13.5b se listan las pequeñas modificaciones para convertir el algoritmo a minimización. En ambas versiones el valor x para el óptimo se regresa como el valor función (dorado). Además, el valor def(x) en el óptimo se regresa como la variable f(x).

Usted se preguntará por qué hemos hecho énfasis en la reducción de las funciones evaluación de la búsqueda de la sección dorada. Por supuesto, para resolver una sola optimización, la velocidad ahorrada podría ser insignificante. Sin embargo, hay dos importantes contextos donde minimizar el número de evaluaciones de la función puede ser importante. Éstos son

1 . Muchas evaluaciones. Existe casos donde el algoritmo de búsqueda de la sección dorada puede ser una parte de muchos más cálculos. En tales casos, ésta podría llamarse muchas veces. Por tanto, manteniendo las evaluaciones de la función a un mínimo podría dar grandes dividendos para esos casos.

2. Tiempo consumido en la evaluación. Por razones pedagógicas, se usan funciones sim pies en la mayoría de nuestros ejemplos. Usted debería entender que una función puede-ser muy compleja y consumir mucho tiempo en su evaluación. Por ejemplo, en una parte posterior de este libro, se describirá cómo se puede usar la optimización para estimar los parámetros de un modelo que consiste de un sistema de ecuaciones difercí í-ciales. Para tales casos, la "función" involucró tiempo consumido en la integración del modelo. Cualquier método que minimiza tales evaluaciones podría ser ventaj oso.

1 3 . 2 I N T E R P O L A C I Ó N C U A D R Á T I C A

La interpolación cuadrática tiene la ventaja del hecho que un polinomio de segundo orden con frecuencia proporciona una buena aproximación a la forma de f(x) cercana a un óptimo (véase figura 13.6).

F I G U R A 13.6 Ilustración gráfica de la interpolación cuadrática.

Page 43: Chapra12-20

13.2 INTERPOLACIÓN CUADRÁTICA 373 Así como existe sólo una línea recta para conectar dos puntos, hay únicamente una cuadrática o parábola para conectar tres puntos. De esta forma, si se tiene tres puntos que juntos contienen un óptimo, se puede ajustar una parábola a los puntos. Después se puede diferenciar e igualar el resultado a cero, y resolver para una estimación de la óptima x. Se puede demostrar que después de un manejo algebraico el resultado es

/(¿o) (x 2 - xj) + f{x\) (x¡ - x 2 ) + f(x2) (x 2 - x 2 )

2 / ( x 0 ) (xi - x2) + 2f(x¡) (x 2 - x0) + 2f(x2) (x0 - x{)

donde xQ, xx y x2 son los valores que fijan el extremo, y x 3 es el valor de x que corresponde al máximo valor del ajuste cuadrático a los valores iniciales.

.2 Interpolación cuadrática

] Enunciado del problema. Use la interpolación cuadrática para aproximar el máximo i de

| x2

; f(x) = 2 sen x - — j i ¡ con valores iniciales de x0 = 0, xx = 1 y x2 — 4.

i j Solución. El valor de la función en los tres valores se puede evaluar,

j x0 = 0 / ( x 0 ) = 0

| xx = 1 / (x i ) = 1.5829 | .v2 = 4 f{x2) = -3 .1136 ! y sustituyendo en la ecuación (13.7) se obtiene, | _ 0 ( l 2 - 4 2 ) + 1.5829 (4 2 - O2) + (-3.1136) (O2 - l 2 ) = } 5 Q 5 5

| X i ~ 2(0) (1 - 4 ) +2(1.5829) ( 4 - 0 ) + 2(-3.1136) (0 - 1) ~

I la cual tiene un valor de la función d e / ( 1.5055) = 1.7691. i* Después, se puede emplear una estrategia similar a la de la búsqueda de la sección j dorada para determinar cuál punto se descartará. Ya que el valor de la función para el | nuevo punto es mayor que para el punto intermedio (x,) y el nuevo valor de x está a la \ derecha del punto intermedio, el valor de inicio inferior (x 0) se descarta. Por tanto, para I la próxima iteración,

jc0 = 1 / ( x 0 ) = 1.5829

x, = 1.5055 / (* , ) = 1.7691

x 2 = 4 / U 2 ) = - 3 . 1 1 3 6

la cual so sustituye en la ecuación (13.7) para obtener

Page 44: Chapra12-20

374 OPTIMIZACIÓN UNIDIMENSIONAL NO RESTRINGIDA _

1.5829 (1.5055' -4') + 1.7691 (4 ¿

2(1.5829)(1.5055 - 4 ) + 2(1.7691)(4 •

= 1.4903

I.505.V')

l) + 2 ( - 3 . H 3 6 ) ( l - 1.5055)

la cual tiene un valor de la función de/(1.4903) = 1.7714. El proceso se puede repetir, con los resultados tabulados abajo:

/ -«o * i x 2 flx2) * 3 4 * 3 )

1 0 .0000 0 .0000 1.0000 1.5829 4 .0000 - 3 . 1 1 3 6 1.5055 1.7691 2 1.0000 1.5829 1.5055 1.7691 4 .0000 - 3 . 1 1 3 6 1.4903 1.7/M 3 1.0000 1.5829 1.4903 1.7714 1.5055 1.7691 1.4256 1.775/ 4 1.0000 1.5829 1.4256 1.7757 1.4903 1.7714 1.4266 1.7/.'./ 5 1.4256 1.7757 1.4266 1.7757 1.4903 1.7714 1.4275 1.77'./

Así, dentro de las cinco iteraciones, el resultado es rápidamente convergente sobre i-l valor verdadero de 1.7757 enx = 1.4276.

Deberíamos mencionar que así como en el método de la falsa posición, la interpcln ción cuadrática puede quedarse con sólo un extremo de intervalo convergiendo. Así, ln convergencia puede ser lenta. Como prueba de lo anterior, observe que en nuestro ejein pío, 1.0000 fue un punto final para la mayoría de la iteraciones.

Este método, así como otros que usan polinomiales de tercer orden, se puede formu lar en algoritmos que contienen pruebas de convergencia, cuidadosas estrategias de selección para los puntos que habrán de retenerse en cada iteración e intentos de minimi/.m la acumulación del error de redondeo. En particular, vea el método de Brent's en Press y cois. (1992).

1 3 . 3 M É T O D O D E N E W T O N

Recuerde que el método de Newton-Raphson del capítulo 6, es un método abierto que encuentra la raíz de x como una función tal que f(x) = 0. El método se resume como

x¡+\ = X¡ f(x¡) fU,)

Se puede usar un planteamiento similar abierto para encontrar un óptimo de / ( \ ) ul definir una nueva función, g(x) — f\x). Así, como el mismo valor óptimo x* satisface ambos

/ ' ( x * ) = g(x*) = 0

se puede usar lo siguiente

x, ¡ + 1 X : - (M.H)

(-3.1136) ( I '

Page 45: Chapra12-20

T * . # - T W ! B 1 W B « r ü B N E W T O N " 17B como una técnica pura encontrar el mínimo o máximo de f(x). Se deberiu observar c¡uo esta ecuación puede también derivarse al escribir una serie de Taylor de segundo orden para /'(x) e igualar la derivada de la serie a cero. El método de Newton es abierto y similar al de Newton-Raphson porque no requiere de valores iniciales que contengan el óptimo. Además, también comparte la desventaja de poder ser divergente. Por último, es una buena idea verificar que la segunda derivada tenga usualmente el signo correcto para confirmar que la técnica converge sobre el resultado deseado.

EJEMPLO 13.3 Método de Newton

I Enunciado del problema. Use el método de Newton para encontrar el máximo de

f(x) = 2 senx 10

con un valor inicial de x0 = 2.5.

) Solución. La primera y segunda derivadas de la función se puede evaluar como

f(x) = 2 eos x —

-2 senx

las cuales se sustituyen en la ecuación (13.8) para obtener

_ 2 eos x¡ — x/5

—2 senx,- — 1/5

Al sustituir el valor inicial se obtiene

x 5 - 2 eos 2 . 5 - 2 . 5 / 5 = a 9 9 5 Q 8

- 2 sen 2.5 - 1/5

la cual tiene un valor de la función de 1.57859. La segunda iteración da

x, = 0.995 -2 eos 0.995 - 0.995/5

- 2 sen 0.995 - 1/5 = 1.46901

la cual tiene un valor de la función de 1.77385. El proceso se repite, con los resultados abajo tabulados:

f(x)

2.5 0 .99508 1.46901 1.42764 1,427.5.5

0 .57194 1.57859 1.77385 1.77573 1.77573

- 2 . 1 0 2 2 9 0 .88985

-0 .09058 - 0 . 0 0 0 2 0 0 .00000

-1 .39694 -1 .87761 -2 .18965 - 2 . 1 7 9 5 4 - 2 . 1 7 9 5 2

Page 46: Chapra12-20

376

Asi, dentro de las cuatro iteraciones, el resultado converge en forma rápida sobre el vulor verdadero.

Aunque el método de Newton trabaja bien en algunos casos, no es práctico en otros donde las derivadas no se pueden evaluar en forma conveniente. Para estos casos, se dispone de otros procedimientos que no involucran la evaluación de la derivada. Por ejemplo, un método de Newton, en versión como la secante, se puede desarrollar al usar aproximaciones por diferencia finita para las evaluaciones de la derivada.

Una restricción mayor con respecto al procedimiento es que puede divergir con base en la naturaleza de la función y la calidad del valor inicial. Así, usualmente se emplea sólo cuando se está cerca del óptimo. Las técnicas híbridas que usan procedimientos con intervalos lejos del óptimo y los métodos abiertos cercanos al óptimo intentan explotar los puntos fuertes de ambos procedimientos.

Esto concluye nuestro tratamiento de los métodos para encontrar el óptimo de funciones de una sola variable. Algunos ejemplos de ingeniería se presentan en el capítulo 16. Por otra parte, las técnicas descritas aquí son un importante elemento de algunos procedimientos para optimizar funciones multivariables, que se analizarán en el próximo capítulo.

P R O B L E M A S

13.1 Dada la fórmula

f(x) = x2 - 8x + 12

a) Determine en forma analítica el máximo y el valor correspondiente de x para esta función (use por ejemplo, diferenciación).

b) Verifique que con la ecuación (13.7) se obtienen los mismos resultados con base en los valores iniciales x0 = 0,xl

= 2 y x2 = 6. 13.2 Dada la función

/(,v) = -l.5x6 - 2 x 4 + 12*

a) Grafique la función. /;) Use métodos analíticos para probar que la función es cón

cava para todos los valores de x. <;) Diferencie la función y después use un método de localiza

ción de raíces para determinar el máximo de f(x) y el valor correspondiente de x.

13.3 Encuentre el valor de x que maximiza f(x) en el problema 13.2, usando la búsqueda de la sección dorada. Emplee los valores iniciales de x¡ = 0 y xu = 2 y realice 3 iteraciones. 13.4 Repita el problema 13.3, pero ahora use interpolación cuadrática. Emplee valores iniciales de x0 = 0,x, = 1 ,x2 = 2 y i'oulioc 3 iteraciones.

13.5 Repita el problema 13.3, pero ahora use el método de Newton. Emplee un valor inicial de x0 = 2 y realice tres iteraciones. 13.6 Analice las ventajas y desventajas de la búsqueda de la sección dorada, interpolación cuadrática y el método de Newton para localizar un óptimo valor en una dimensión. 13.7 Emplee los siguientes métodos para determinar el máximo de

f(x) = 2..Y - 1 J5x2 + \Ax3 - 0.25.V4

a) Búsqueda de la sección dorada (x¡ = —2, xu = 4, es = 1%).

b) Interpolación cuadrática (x0 = 1.75, x, = 2, x2 = 2.25, iteraciones = 5).

c) Método de Newton (x0 = 2.5, es = 1 %). 13.8 Considere la siguiente función:

f(x) = 6x + 1.5x2 + 3x3 + x 4

Use métodos analíticos y gráficos para mostrar que la función tiene un mínimo para algún valor de x en el rango — 2 < x < 1. 13.9 Emplee los siguientes métodos para encontrar el máximo de la función del problema 13.8: a) Búsqueda de la sección dorada (x¡ = — 2, x„ = 1, £8 —

1%).

Page 47: Chapra12-20

P R O B L E M A S

/>) Interpolación cuadrática (.v„ ~ 2, .v, = — 1, x2 = 1, iteraciones — 5).

i) Método do Newton (x0 — — 1, e t = 1 %). I l, 10 ('onsiilere la siguiente función:

I /( t ) \ I -

.v Non Mee 10 iteraciones con interpolación cuadrática para ubicar i'l IIIIIIIIIU). Comente sobre la convergencia de sus resultados (x0

- ().l , .v, -= 0.5,x 2 = 5.0). I I. 11 ('onsidere la siguiente función:

/'(\) ^ 2 + 5x + 6x2 + 2x3 + 2xA

focalice el mínimo al encontrar la raíz de la derivada de esta liiiK'ión. Use bisección con valores iniciales de x¡ = —2 y xu -I 13.12 Determine el mínimo de la función del problema 13.11 K oii los siguientes métodos: u) Método de Newton (x0 = — 1, es = 1%). Ii) Método de Newton, pero ahora usando aproximación por

diferencias finitas para estimar las derivadas.

^ ftxi + 8x¡) - f(x¡ - Sx¡) 2¿x,

_ f{x¡ + Sx¡) - 2/ (x , ) + f(x¡ - 8XJ ) M.,) = ^ ilmuli' iS — una fracción de perturbación ( = 0.01). Use un valor liitrhil de .»•„ = — 1 e itere para £, = 1%. MI' I )es!irrolle un subprograma usando un programa o lengua-|n iniiiio para implementar el algoritmo de la búsqueda de la Ntu i u'iii dorada. Diseñe el subprograma de tal forma que esté t¡H|MOHiuuentc diseñado para localizar un máximo. La subrutina IMHH'II tener las siguientes características:

• Veri fique si los valores iniciales ajustan a un máximo. Si no i\s así, la subrutina deberá implementar el algoritmo, pero deberá regresar mostrando un mensaje de error.

• Itere hasta que el error relativo esto por debajo de un criterio de paro o exceda un máximo número de ileíacionos. Regrese ambos al óptimo de x y f(x).

• Minimice el número evaluaciones de función.

Pruebe su programa con el mismo problema dado en el ejemplo 13.1. 13.14 Desarrolle un subprograma como el descrito en el problema 13.13, pero ahora haga un reconocimiento para determinar si el problema involucra minimización o maximización, y después con base en este reconocimiento implemente en forma adecuadu la búsqueda de la sección dorada. 13.15 Desarrolle un subprograma usando un programa o lenguaje macro para implementar el algoritmo de interpolación cuadrática. Diseñe el subprograma de tal forma que esté expresamente diseñado para localizar un máximo. La subrutina deberá tener las siguientes características:

• Utilice como base en dos valores iniciales y haga que el programa genere el tercer valor inicial a la mitad del intervalo.

• Verifique si los valores iniciales ajustan a un máximo. Si no es así, la subrutina no debe implementar el algoritmo, pero debe regresar un mensaje de error.

• Itere hasta que el error relativo esté por debajo de un criterio de paro o exceda un número máximo de iteraciones. Encuentre ambos, el óptimo x y f(x). Minimice el número evaluaciones de función.

Pruebe su programa con el mismo problema como en el ejemplo 13.2. 13.16 Desarrolle un subprograma mediante un programa o! lenguaje macro para implementar el método de Newton. La subrutina deberá tener las siguientes características:

• Itere hasta que el error relativo esté por debajo de un criterio de paro o exceda un número máximo de iteraciones.

• Encuentre ambos, el óptimo x y/(x).

Pruebe su programa con el mismo problema del ejemplo 13.3.

Page 48: Chapra12-20

CAPITULO 14

Optimización multidimensional sin restricciones

I Este capítulo describe las técnicas para encontrar el mínimo o máximo de una función do varias variables. Recuerde del capítulo 13 que nuestra imagen visual de una búsqueda unidimensional fue como una montaña rusa. Para el caso en dos dimensiones, la imagen es ahora como la de montañas y valles (véase figura 14.1). Para problemas de gratulen dimensiones, no son posibles imágenes adecuadas.

Se ha optado por limitar este capítulo a los casos en dos dimensiones. Se adoptar A este planteamiento debido a que las formas características esenciales de las búsqueda* multidimensionales son a menudo más comunicativas visualmente.

Las técnicas para la optimización multidimensional sin restricciones se pueden olí» sificar de varias formas. Para propósitos del presente análisis, se dividirán dependiendo de si se requiere la evaluación de la derivada. Los procedimientos que no requieren dicha evaluación se llaman métodos no gradientes o directos. Aquellos que requieren las dei i vadas son llamados métodos gradientes o métodos de descenso (o ascenso).

1 4 . 1 M É T O D O S D I R E C T O S

Estos métodos varían de procedimientos de fuerza bruta simple a técnicas más eleganlox que intentan explotar la naturaleza de la función. Se empezará el análisis con el procedí miento de fuerza bruta.

F I G U R A 1 4 . 1 La forma más tangible de visualizar búsquedas en dos dimensiones es en el contexto de ascender una montaña (maximización) o descender a un valle (minimización). a) Mapa topográfico bidimensional (2-D) de la montaña que corresponde a la gráfica tridimensional (3-D| de la montaña en el inciso b).

Líneas de f constante

Page 49: Chapra12-20

14 .1 .1 Búsqueda aleatoria

Un simple ejemplo del procedimiento de fuerza bruta es llamado el método de la búsqueda aleatoria. Como su nombre lo indica, este método evalúa en forma repelida In función mediante la selección aleatoria de valores de la variable independiente. Si un número suficiente de muestras se lleva a cabo, el óptimo será eventualmente localizado.

EJEMPLO 14.1 Método de la búsqueda aleatoria

Enunciado del problema. Use un generador de números aleatorio para localizar el máximo de

f(x, y) = y - x - 2x2 - 2xy - y 2 (E14.1.1)

en el dominio acotado porx = —2 a 2, y y = 1 a 3. El dominio se describe en la figura 14.2. Observe que un solo máximo de 1.5 ocurre enx = — 1 y y = 1.5.

Solución. Los generadores de números aleatorios en forma típica generan valores entre 0 y 1. Si se designa a tal número como r, la siguiente fórmula puede ser usada para generar valores de x aleatorios en un rango de x¡ a xu:

x = x, + (xu - x¡)r

Para la presente aplicación, x¡= — 2 y xu = 2, y la fórmula es

x = -2+(2- ( -2 ) ) r = - 2 + 4r

Esta se puede probar al sustituir 0 y 1 para obtener —2 y 2, respectivamente. De forma similar para y, una fórmula para el presente ejemplo se puede desarrollar

como

y = yi + (yu- y¡)r = 1 + (3 - l )r = 1 + 2r

FIGURA 1 4 . 2 Ecuación (E l4 .1.1) que muestra el máximo en x = - 1 y y = 1.5.

Máximo

Page 50: Chapra12-20

OPTIMIZACIÓN MULTIDIMENSIONAL SIN RESTRICCIONES

'[ El siguiente código en Fortran 90 usa la subrutina RANDOM de un número aléalo j rio hecha en un Fortran 90 visual y digital (Digital Visual Fortran 90) para generar pares ¡ (x, y). Éstos se sustituyen en la ecuación (E14.1.1). El máximo valor de entre estas prue-• bas aleatorias se guarda en la variable maxf, y los valores correspondientes de x y y en ¡ maxx y maxy, respectivamente. Se toma un total de 300 muestras y los resultados se

despliegan cada 30 iteraciones.

Program Jump

IMPLICIT N0NE INTEGER : : i , j , i t e r REAL : : x,y,f,fn,maxf,maxx,maxy,rnd

f ( x , y) - y - x - 2.*x**2 - 2.*x*y - y**2

maxf = -999.e9

00 i - 1 , 10 DO J - 1 . 30

i t e r - i t e r + 1 CALL Random(rnd) x - -2 . + 4. * rnd y - 1 . + 2. * rnd fn - f ( x , y) I F (fn.GT.maxf) THEN

maxf = fn maxx - x maxy = y

END I F END DO PRINT * , i t e r , maxx, maxy, maxf

END DO

OUTPUT: 30 -9 483753E-01 1 525812 1 241338 60 -9 483753E-01 1 525812 1 241338 90 -9 799424E-01 1 510029 1 248693

120 -9 799424E-01 1 510029 1 248693 150 -9 799424E-01 1 510029 1 248693 180 -9 799424E-01 1 510029 1 248693 210 -9 799424E-01 1 510029 1 248693 240 -9 .938087E-01 1 503096 1 249875 270 -1.003075 1 498462 1 249969 300 -1.003075 1 498462 1 249969

Los resultados indican que la técnica rápidamente arriba al máximo verdadero.

Este simple procedimiento de fuerza bruta trabaja aun en discontinuidades y luncio j

nes no diferenciables. Además, siempre encuentra el óptimo global más que el local, 1

Page 51: Chapra12-20

14; 1 MÉTODOS DIRECTOS

principal deficiencia es que como crece el número de variables independientes, ol esfuerzo de implementación requerido puede ser gravoso. Además, no es eficiente, ya que no toma en cuenta el comportamiento de la función realzada. Los procedimientos restantes descritos en este capítulo toman en cuenta el comportamiento de la función, asi como los resultados de las iteraciones previas para mejorar la velocidad de convergencia. En consecuencia, aunque la búsqueda aleatoria puede probar ser útil en un contexto de problemas específicos, los siguientes métodos tienen una utilidad más general y casi siempre tienen la ventaja de tener una convergencia más eficiente.

Se debe observar que se dispone de técnicas de búsqueda más sofisticadas. Éstas son procedimientos heurísticos que fueron desarrollados para manejar problemas no lineales y/o discontinuos que la optimización clásica usualmente no maneja bien, si no es que todos. Simulación de recocido, búsqueda tabú, redes neuronales artificiales y algoritmos genéticos son unos pocos ejemplos. El más ampliamente utilizado es el algoritmo genético, con un número disponible de paquetes comerciales. Holland (1975), iniciador del procedimiento del algoritmo genético, y Goldberg (1989) y Davis (1991) proporcionan buena revisión de la teoría y aplicación del método.

1 4 . 1 . 2 Univar iabi l idad y búsquedas patrón

Es muy agradable tener un procedimiento eficiente de optimización que no requiera evaluar las derivadas. El método de búsqueda aleatoria, antes descrito, no requiere la evaluación de la derivada, pero no es muy eficiente. En esta sección se describe un procedimiento, el método de búsqueda univariable, que es más eficiente y además no requiere la evaluación de la derivada.

La estrategia básica a resaltar del método de búsqueda univariable es que cambia una variable a la vez para mejorar la aproximación, mientras las otras variables se mantienen constantes. Dado que únicamente se cambia una variable, el problema se reduce a una secuencia de búsquedas en una dimensión, que se puede resolver mediante una variedad de métodos (entre ellos los descritos en el capítulo 13).

r i O U R A 14 .3 I ion gráfica de y i I 'HI I I i (.unduce una

Page 52: Chapra12-20

3 8 2 OPTIMIZACIÓN MULTIDIMENSIÓNAL SIN RESTRICCIONES

Realicemos una búsqueda univariable por medio de una gráfica, como se muestra en la figura 14.3. Se comienza en el punto 1, y se mueve a lo largo del eje x con la y constante hacia el máximo en el punto 2. Se puede ver que el punto 2 es un máximo al observar que la trayectoria a lo largo del eje x justo toca una línea del contorno en el punto. Luego, muévase a lo largo del eje y con la x constante hacia el punto 3. Continúe-este proceso generando los puntos 4, 5, 6, etcétera.

Aunque se está moviendo en forma gradual hacia el máximo, la búsqueda comienza a ser menos eficiente al moverse a lo largo de una angosta cresta hacia el máximo. Sin embargo, también observe que las líneas unen puntos alternos tales como 1-3, 3-5 o 2-4; el punto 4-6 va en la dirección general del máximo. Esas trayectorias presentan una oportunidad para llegar directamente a lo largo de la cresta hacia el máximo. Tales trayectorias son llamadas direcciones patrón.

Se dispone de algoritmos formales que capitalizan la idea de las direcciones patrón para encontrar los valores óptimos en forma eficiente. El más conocido de dichos algoritmos es el llamado método de Powell. Este se basa en la observación (véase l;i figura 14.4) de que si los puntos 1 y 2 se obtienen por búsquedas en una dimensión en l¡i misma dirección, pero con diferentes puntos de partida, entonces la línea formada por I y 2 podría dirigirse hacia el máximo. Tales líneas son llamadas direcciones conjugadas.

En efecto, se puede demostrar que si f(x, y) es una función cuadrática, las búsquedas secuenciales a lo largo de las direcciones conjugadas convergerán exactamente en un número finito de pasos, sin importar el punto de partida. Puesto que una función general no lineal a menudo puede estar razonablemente aproximada a una función cuadrática, los métodos basados en direcciones conjugadas son por lo común bastante eficientes y son en realidad convergentes en forma cuadrática cuando se aproximan al óptimo.

Se implementará en forma gráfica una versión simplificada del método de Powell para encontrar el máximo de

F I G U R A 1 4 . 4 Direcciones conjugadas.

Page 53: Chapra12-20

F I G U R A 14 . 5 Método de Powell.

f(x,y)=c-(x-a)2~(y~b)2

donde a,byc son constantes positivas. Esta ecuación resulta en contornos circulares en el plano x,y, como se muestra en la figura 14.5.

Se inicia la búsqueda en el punto 0 con las direcciones iniciales A, y h2. Observe que hx y h2 no son necesariamente direcciones conjugadas. Desde cero, se mueve a lo largo de hx hasta un máximo que es localizado en el punto 1. Después se busca del punto 1 a lo largo de la dirección h2 para encontrar el punto 2. Luego, para una nueva búsqueda en la dirección h-¡ a través de los puntos 0 y 2. Se busca a lo largo de esta dirección hasta que se localice el máximo en el punto 3. Luego la búsqueda va del punto 3 en la dirección h2 hasta que se localice el máximo en el punto 4. Del punto 4 se llega al punto 5, pero de nuevo buscando a lo largo de hy Ahora, obsérvese que ambos puntos, 5 y 3, se han localizado por búsqueda en la dirección ¿ 3 , desde dos puntos diferentes. Powell ha demostrado que A4 (formado por los puntos 3 y 5) y h3 son direcciones conjugadas. Así, buscando desde el punto 5 a lo largo de h4, nos llevará directamente al máximo.

El método de Powell se puede refinar para hacerlo más eficiente, pero los algoritmos formales van más allá del alcance de este texto. Sin embargo, es un método eficiente que converge en forma cuadrática sin requerir evaluación de la derivada.

1 4 . 2 M É T O D O S G R A D I E N T E

Como su nombre lo indica, los métodos gradiente usan en forma explícita información de la derivada para generar algoritmos eficientes que localicen el óptimo. Antes de describir los procedimientos específicos, primero se revisarán algunos conceptos y operaciones matemáticas clave.

Page 54: Chapra12-20

384 OPTIMIZACIÓN MULTIDIMENSIONAL SIN RESTRICCIONES

14 .2 .1 Gradientes y Hess ians

Recuerde del cálculo que la primera derivada de una función unidimensional proporciona una pendiente o tangente de la función que es diferenciada. Desde el punto de vista de la optimización, ésta es una información útil. Por ejemplo, si la pendiente es positiva, nos indica que al aumentar la variable independiente nos conducirá a un valor más alto de la función que se está explorando.

Del cálculo, también recuerde que la primera derivada puede indicarnos cuándo se ha encontrado un valor óptimo, puesto que éste es el punto donde la derivada tiende a cero. Además, el signo de la segunda derivada puede indicarnos si se ha alcanzado un mínimo (positivo en la segunda derivada) o un máximo (negativo en la segunda derivada).

Esas ideas fueron útiles para los algoritmos de búsqueda en una dimensión que se exploró en el capítulo anterior. Sin embargo, para entender por completo las búsquedas multidimensionales, se debe primero entender cómo la primera y la segunda derivada se expresan en un contexto multidimensional.

El gradiente. Suponga que se tiene una función en dos dimensiones f(x, y). Un ejemplo podría ser su altura sobre una montaña como una función de su posición. Suponga que usted está en un lugar específico sobre la montaña (a, b) y quiere saber la pendiente en una dirección arbitraria. Una forma para definir la dirección es a lo largo de un nuevo eje h que forma un ángulo 9 con el eje x (véase figura 14.6). La elevación a lo largo de este nuevo eje puede pensarse como una nueva función g (h). Si usted define su posición como si estuviera en el origen de este eje (es decir, h — 0), la pendiente en esta dirección podría designarse como g'(0). Esta pendiente, que es llamada derivada direccional, se puede calcular a partir de las derivadas parciales a lo largo de los ejes x y y por

(14.1)

donde las derivadas parciales son evaluadas con* — a y y = b.

FIGURA 14.6 El gradiente direccional se define a lo largo de un eje h que forma un ángulo 6 con el eje x.

x

h

Page 55: Chapra12-20

W f f T O D O S G R A D I E N T E tu Suponiendo que su meta es obtener la mayor clevacitSn con el siguiente paso, ahora

la pregunta lógica podría ser: ¿En qué dirección está el paso de ascenso'/ La respuosto es clara, porque matemáticamente se hace referencia a él como el gradiente, el cual so define como

vf = ir1 + -fi dx oy

(14.2)

Este vector también es referido como "del/". El cual representa la derivada direccional de f(x, y) en el punto x = a y y = b.

La notación vectorial proporciona un medio conciso para generalizar el gradiente a n dimensiones, como

^ ~ ( x )

OX\ V / ( x ) =

dx2

dx„

(x)

(x)

¿Cómo se usa el gradiente? Para el problema de subir la montaña, si lo que interesa es ganar elevación tan rápidamente como sea posible, el gradiente nos indica en qué dirección movernos y cuánto ganaremos por tomarla. ¡Observe, sin embargo, que dicha estrategia no necesariamente nos lleva en una trayectoria directa a la cima! Más tarde, en este capítulo, se analizará estas ideas con mayor profundidad.

EJEMPLO 14.2 Utilización del gradiente para evaluar la trayectoria de paso ascendente

] Enunciado del problema. Emplee el gradiente para evaluar la dirección del paso ascendente para la función

< /(-v, y) = xy2

¡ en el punto (2,2). Se considera que la x positiva está dirigida hacia el este y la y positiva apunta al norte.

i j Solución. Primero, la elevación se puede determinar como

j / ( 4 . 2) = 2(2) 2 - 8

i | Ahora, las derivadas parciales pueden ser evaluadas, i ^ = y 2 = 2 2 = 4 ; dx

i d-L=2xy = 2(2)(2) = 8

Page 56: Chapra12-20

386 OPTIMIZACIÓN MULTIDIMENSIONAL SIN RESTRICCIONES

I las cuales se pueden usar para determinar el gradiente como

| Y / = 4i + 8j

| Este vector puede ser bosquejado en un mapa topográfico de la función, como en la I figura 14.7. Esto inmediatamente nos indica que la dirección que debe tomarse es

6 = tan ' 1 (^j = 1 . 1 0 7 radianes ( = 63.4°)

j respecto al eje x. La pendiente en esta dirección, la cual es la magnitud de V/, puede ser calculada como

' V 4 2 + 8 2 = 8.944

Así, durante el primer paso, inicialmente se ha ganado 8.944 unidades de aumento de elevación de pendiente por unidad de distancia recorrida a lo largo de la trayectoria empinada. Observe que la ecuación (14.1) da el mismo resultado,

g'(0) = 4 eos (1.107) + 8 sen (1.107) = 8.944

Note que para cualquier otra dirección, digamos 9 = 1.107/2 = 0.5235, g'(0) = 4 eos ; (0.5235) + 8 sen (0.5235) = 7.608, la cual es más pequeña. ! Al moverse hacia adelante, tanto la dirección como la magnitud del paso de la tra

yectoria cambiarán. Estos cambios se pueden cuantificar en cada paso mediante el i gradiente, y la dirección del ascenso se modificará de acuerdo con esto.

F IGURA 14 .7 La flecha sigue la dirección de pasos ascendente calculado con el gradiente.

1 _

i 1 1 1 1 • 0 1 2 3 4 x

Page 57: Chapra12-20

14.2 MÉTODOS GRADIENTE 387

I Se puede obtener una cierta perspectiva al inspeccionar la figura 14.7. Como se indica, la dirección del paso ascendente es perpendicular, u ortogonal, al contorno en la

| elevación en la coordenada (2, 2). Esta es una característica general del gradiente.

Además de definir la trayectoria de paso, se puede también usar la primera derivada para discernir si se ha alcanzado un óptimo. Como en el caso para una función de una dimensión, si las derivadas parciales con respecto ax y y son cero, se ha alcanzado el óptimo en dos dimensiones.

El Hessian. Para problemas de una dimensión, ambas derivadas, la primera y la segunda, proporcionan información valiosa para la búsqueda del óptimo. La primera derivada a) proporciona una trayectoria más grande de la función y b) indica que se ha alcanzado el óptimo. Una vez en el óptimo, la segunda derivada indicará si es un máximo [negativo f"(x)] o un mínimo [positivo f"(x)]. En los párrafos anteriores, se ilustró cómo el gradiente proporciona la mejor trayectoria local para problemas multidimensionales. Ahora, se examinará cómo se usa la segunda derivada en tales contextos.

Puede esperarse que si las segundas derivadas parciales con respecto ax y y son ambas negativas, entonces se ha alcanzado un máximo. La figura 14.8 muestra una función en la que esto no es cierto. El punto (a, b) de esta gráfica parece ser un mínimo cuando se observa a lo largo, ya sea de la dimensiónx o de la>>. En ambos casos, las segundas deri-

F I G U R A 14 .8 Un punto de silla (x = o y y = b) . Observe que al ser vista la curva a lo largo de las direcciones x y y, la función parece ir hacia un mínimo (la segunda derivada es positiva), mientras que al verse a lo largo del eje x = y, es cóncava hacia abajo (la segunda derivada es negativa).

, f(x< y) t

Page 58: Chapra12-20

3 8 8 OPTIMIZACIÓN MULTIDIMENSIONAL SIN RESTRICCIONES

vadas parciales son positivas. Sin embargo, si la función se observa a L O largo de lu Unen y = x, puede verse que ocurre un máximo en el mismo punto. Esta fo R M U es llamada do silla y, claramente, no ocurren ni un máximo ni un mínimo en el p u n t o .

Ya sea que ocurra un máximo o un mínimo, esto involucra no s«ólo a las PARCIULCN

con respecto ax y y, sino también a la segunda parcial con respecto a JC y y. Suponiendo que las derivadas parciales sean continuas en y cerca del punto que hah>rá de evaluarse, se puede calcular la siguiente cantidad:

\H\ = 8x2 dy2

A 2 / (14.3) Kdxdy

Pueden ocurrir tres casos:

• Si | H | > 0 y a^fdx2 > 0, entonces f(x, y) tiene un mínimo local.

• Si | H | > 0 y (Pfdx2 < 0, entonces f(x, y) tiene un máximo local.

• Si | H | < 0, entonces f(x, y) tiene un punto de silla.

La cantidad | H | es igual al determinante de una matriz fo rmada con las scguiulim derivadas.1

" 9 2 / d2f "1

H = dx2 dxdy

H = d2f 9 2 /

_ dydx dy2 _

(14.4)

donde esta matriz se encuentra formalmente referida como el Hessia j% d e / Además proporciona un medio para discernir si una función mxiltidimensional ha

alcanzado el óptimo; el Hessian tiene otros usos en optimización ( p o r ejemplo, para lu forma multidimensional del método de Newton). En particular, p e r n o t e búsquedas qiip incluyen curvatura de segundo orden para obtener resultados superio» res.

Aproximaciones por diferencias finitas. Se debe mencionar que, jpara los casos don de son difíciles o inconvenientes de calcular en forma analítica, a m b o s , el gradiente y el determinante de Hessian, se pueden evaluar numéricamente. En la m_.ayoría de los castiN se emplea el procedimiento que se introdujo en la sección 6.3.3 p a j a el método de la secante modificado. Esto es, las variables independientes se pueder^ modificar ligera mente para generar las derivadas parciales requeridas. Por ejemplo, si se adopta el proco dimiento de diferencias centrales, éstas se pueden calcular como

9 / = f(x + Sx,y)-f(x-Sx,y)

dx 2Sx

d¿ = f(x,y+Sy)-f(x,y-Sy)

dy 2Sy

d2f = f(x + Sx, y) - 2f(x, y) - f(x - Sx, y)

dx2 Sx2

(I4..1)

(14,n)

(14.7)

' Observe que d2J!(dx dy) = d2fl(dy dx).

Page 59: Chapra12-20

rmvt m c i w w w v w i m r

&y2

_ / ( ^ y + ¿y) - 2 / ( . v , y) - / ( . v , y • M í)y2 ~

a2/ _ 3x3_y

( 14 .8 )

/ ( x + 5x, y + Sy) - /(* + Sx, y - Sy) - f(x - Sx, y + Sy) + f(x - Sx, y - Sy)

4SxSy (14.9)

donde S es un valor fraccional algo pequeño. Observe que los métodos empleados en paquetes de software comerciales también

usan diferencias hacia adelante. Además, ellos son usualmente más complicados que las aproximaciones enlistadas en las ecuaciones (14.5) a la (14.9). Por ejemplo, la librería IMSL basa la perturbación en el épsilon de la máquina. Dennis y Schnabel (1996) proporcionan más detalles sobre el procedimiento.

Sin importar cómo se implemente la aproximación, el punto importante es que se pueda tener la opción de evaluar el gradiente y/o el Hessian en forma analítica. Esto puede algunas veces ser una tarea ardua, pero el comportamiento del algoritmo puede ser lo bastante benéfico como para que el esfuerzo valga la pena. Las derivadas de forma cerrada serán exactas, pero lo más importante es que reduce las evaluaciones de la función. Este último punto tiene un impacto crítico en el tiempo de ejecución.

Por otro lado, usted practicará con frecuencia la opción de calcular estas cantidades internamente mediante procedimientos numéricos. En muchos casos, el comportamiento será el adecuado y se evita la dificultad de numerosas diferenciaciones parciales. Tal podría ser el caso de los optimizadores usados en ciertas hojas de cálculo y paquetes de software matemático (por ejemplo, Excel). En tales casos, se podría no tener la opción de introducir un gradiente y un Hessian derivado en forma analítica. Sin embargo, para problemas de tamaño pequeño o moderado esto no es una gran desventaja.

1 4 . 2 . 2 Método de pasos ascendente

Una estrategia obvia para subir una colina podría ser determinar la pendiente máxima en la posición inicial y después comenzar a caminar en esa dirección. Pero claramente surge otro problema casi de inmediato. A menos que usted realmente tenga suerte y empiece sobre una cresta que apunta directamente a la cima, tan pronto como se mueva, su camino podría divergir en la dirección de pasos ascendente.

Al darse cuenta de este hecho, usted podría adoptar la siguiente estrategia. Podría caminar una distancia corta a lo largo de la dirección gradiente. Luego podría detenerse, reevaluar el gradiente y caminar otra distancia corta. Mediante la repetición de este proceso podría llegar eventualmente al pico de la colina.

Aunque tal estrategia parece ser superficialmente buena, no es muy práctica. En particular, la reevaluación continua del gradiente puede ser demandante en términos computacionales. Se prefiere un planteamiento que involucra moverse en un camino fijo a lo largo del gradiente inicial hasta que f(x, y) detenga los incrementos; es decir, pase a ser el nivel a lo largo de su dirección de viaje. Este punto de paro pasa a ser el punto inicial donde V/es reevaluada y se sigue una nueva dirección. El proceso se repite hasta que se alcance la cima. Este procedimiento es conocido como método de pasos aseen-

Page 60: Chapra12-20

F I G U R A 1 4 . 9 Representación gráfica del método de pasos ascendente.

dente} Es la más directa de las técnicas de búsqueda del gradiente. La idea básica detrito del procedimiento se describe en la figura 14.9.

Comenzaremos en un punto inicial (x0,y0) etiquetado como "0" en la figura. En este punto, se determina la dirección de pasos ascendente; esto es, el gradiente. Entonces se busca a lo largo de la dirección del gradiente, h0, hasta que se encuentra un máximo, el cual es etiquetado como " 1 " en la figura. El proceso entonces se repite.

Así, el problema se puede dividir en dos partes: 1) determinar la "mejor" dirección para la búsqueda y 2) establecer "el mejor valor" a lo largo de esa dirección de búsqueda. Como se verá, la efectividad de varios algoritmos descritos en las siguientes páginas depende de qué tan hábil seamos en ambas partes.

Por ahora, el método de pasos ascendente usa el método del gradiente como su el ce ción para la "mejor" dirección. Se ha mostrado ya cómo se evalúa el gradiente en el ejemplo 14.1. Ahora, antes de examinar cómo se lleva el algoritmo para localizar el máximo a lo largo de la dirección de pasos, se debe hacer una pausa para explorar el modo de trans formar una función de x y y en una función de h a lo largo de la dirección gradiente.

Comenzando e n x 0 y y 0 , las coordenadas de cualquier punto en la dirección gradiente pueden expresarse como

x =x0 + —h dx

df , y = yo +

dy

(14.10)

(14.11)

2 Debido ii nuestro ónlasis sobre la maximización, se usurrt lii terniinolonla do /w.vuv u,<¡fanlfnh*. \'\

mismo en loque se puede usar también pum lu mlmmi/.ueión en esto easo no U N I I I Í I lu terminología do pimt» usctndtnte.

Page 61: Chapra12-20

14.2 MÉTODOS GRADIENTE 391

V f = 3 i + 4j

F I G U R A 1 4 . 1 0 La relación entre una dirección arbitraria hy las coordenadas x y y.

donde h es la distancia a lo largo del eje h. Por ejemplo, supóngase que x0 — 1 y y0 = 2 y V / = 3i + 4j , como se muestra en la figura 14.10. Las coordenadas de cualquier punto a lo largo del eje h están dadas por

x = 1 + 3h

y = 2 + Ah

(14.12)

(14.13)

El siguiente ejemplo ilustra la forma en que se pueden usar estas transformaciones para convertir una función de dos dimensiones de x y y en una función h de una dimensión.

EJEMPLO 14.3 Desarrollando una función 1 -D a lo largo de la dirección gradiente

Enunciado del problema. Suponga que se tiene la siguiente función de dos dimensio-i nes:

f(x, y) — 2xy + 2x — x"

Desarrolle una versión unidimensional de esta ecuación a lo largo de la dirección gradiente en el punto x = — 1 y y = 1.

Solución. Las derivadas parciales se pueden evaluar en ( — 1, 1).

= 2y + 2 - 2x = 2(1) +"2 - 2 ( - l ) = 6

2x -Ay = 2(—1) — 4(1) = - 6

9 / dx

9 /

dy

Por tanto, el vector gradiente es

V/' = 6i - 6j

Page 62: Chapra12-20

392 OPTIMIZACIÓN MULTIDIMENSIONAL SIN RESTRICCIONES

¡ Para encontrar el máximo, se podría buscar a lo largo de la dirección gradiente; esto es, a lo largo de un eje h que corre a lo largo de la dirección de este vector. La función se

| puede expresar a lo largo de este eje como

i f(xo + ?fh, y0 + d-fh) = / ( - l + 6h, 1 - 6/0 s dx dy

\ = 2 ( - l + 6A)(1 - 6/0 + 2 ( - l + 6/0 - ( - 1 + 6hf - 2(1 - 6h)2

¡ donde las derivadas parciales se evalúan en x = — lyy= 1. « Al combinar términos, se desarrolla una función de una sola dimensión g(h) que

mapea f(x, y) a lo largo del eje h.

g(h) = -180/z 2 + 72A - 7

Ahora que se ha desarrollado una función a lo largo del camino de pasos ascenden te, se puede explorar cómo resolver la segunda pregunta. Esto es, ¿qué tan lejos a lo largo de este camino se puede viajar? Un procedimiento podría ser moverse a lo largo de este camino hasta encontrar el máximo de esta función. Identificaremos la localización de este máximo como h*. El cual es el valor del paso que maximiza g (y por tanto, / ) en lu dirección gradiente. Tal problema es equivalente a encontrar el máximo de una función de una sola variable h. Lo cual se puede hacer mediante diferentes técnicas de busque da de una dimensión como las analizadas en el capítulo 13. Así, se pasa de encontrar el óptimo de una función de dos dimensiones a realizar una búsqueda de una dimensión a lo largo de la dirección gradiente.

Este método es llamado de pasos ascendente cuando se usa un paso arbitrario de tamaño h. Si se encuentra que un valor de un solo paso h* nos lleva directamente al máximo a lo largo de la dirección gradiente, el método es llamado óptimo de pasos ascendente.

EJEMPLO 14 .4 Óptimo de pasos ascendente

Enunciado del problema. Maximice la siguiente función:

; f(x,y) = 2xy+ 2x - x2-2y2

usando los valores iniciales, x = — lyy= 1.

Solución. Debido a que esta función es muy simple, se podría generar primero una solución analítica. Para hacer esto, las derivadas parciales se evalúan como

' — = 2y+ 2-2x^=0 dx

I — = 2x - 4y = 0 ; dy

Este par de ecuaciones se pueden resolver para el óptimo, x — 2 y y = I. Las segunda* derivadas parciales también se pueden determinar y evaluar en el óptimo

Page 63: Chapra12-20

m ¡)\r ;i.v-

9 y 2

3 2 /

= - 4

a2/ 9x9y 9y9x

y el determinante de Hessian se calcula [véase ecuación (14.3)],

\H\ = - 2 ( - 4 ) - 2 Z = 4

Por lo tanto, debido a que | H | > 0 y 92/73JC2 < 0, el valor de la función/(2, 1) es un máximo.

Ahora se implementará el método de pasos ascendente. Recuerde que al final del ejemplo 14.3 ya se había implementado los pasos iniciales del problema al generar

g(h) = — 180/r2 + 726 - 7

Ahora, ya que ésta es una simple parábola, se puede localizar directamente el máximo (es decir, h = h*) resolviendo el problema,

g'(h*) = 0

- 3 6 0 F + 72 = 0

h* = 0.2

Esto significa que si se viaja a lo largo del eje h, g (h) alcanza un valor mínimo cuando h = h* — 0.2. Este resultado se puede sustituir en las ecuaciones (14.10) y (14.11) y resolver .para las coordenadas (x, y) correspondientes a este punto,

x = - 1 + 6 ( 0 . 2 ) = 0.2

y = 1 - 6(0.2) = - 0 . 2

\ F I G U R A 1 4 . 1 1 ; El método del paso ascendente para alcanzar el óptimo.

Page 64: Chapra12-20

394 OPTIMIZACIÓN MULTIDIMENSIONAL SIN RESTRICCIONES

| Este paso se describe en la figura 14.11 cuando se mueve del punto 0 al 1. '• El segundo paso es simplemente implementado al repetir el procedimiento. Prime

ro, las derivadas parciales se pueden evaluar en el nuevo punto de inicio (0.2, — 0.2) pnrn obtener

— = 2 ( - 0 . 2 ) + 2 - 2 ( 0 . 2 ) = 1.2 Í ít.V

\ — = 2 ( 0 . 2 ) - 4 ( - 0 . 2 ) = 1.2

Por tanto, el vector gradiente es

| V / = 1.2Í + 1.2j

l Esto significa que la dirección de pasos es ahora dirigida hacia arriba y a la derecha a un > ángulo de 45° con respecto al ejex (véase la figura 14.11). Las coordenadas a lo largo DE ; este nuevo eje h se puede ahora expresar como

[ x = 0 . 2 + 1.2/z

* y = - 0 . 2 + 1.2/!

I Al sustituir estos valores en la función se obtiene

\ / (0.2 + 1.2/i, - 0 . 2 + 1.2/z) = g{h) = - 1 . 4 4 / ¡ 2 + 2.88/z + 0.2

El paso h* nos lleva al máximo a lo largo de la dirección buscada y puede ENTONCEN | calcularse directamente como

i g'(h*) = -2 .88/1* + 2.88 = 0

\ h* = 1

Este resultado se puede sustituir en las ecuaciones (14.10) y (14.11) y resolver para las coordenadas (x, y) correspondientes a este nuevo punto,

x = 0 . 2 + 1.2(1) = 1.4

, y = - 0 . 2 + 1.2(1) = 1

Como se describe en la figura 14.11, nos movemos a las nuevas coordenadas, etiquetailn JJ como punto 2 en la gráfica, y al hacer esto se mueve más cerca del máximo. El PROCEDÍ | miento se puede repetir con el resultado final que converge a la solución analítica, v J j y y = 1. ,

Puede demostrarse que el método de pasos descendente es linealmente convergente. Además, tiende a moverse muy lentamente a lo largo de crestas largas y angostan, listo es porque el nuevo gradiente en cada punto máximo será perpendicular a la dirección original. Así, la técnica toma muchos pasos pequeños de cruce en la dirección de la nilit hacia la cima. Por tanto, aunque es confiable, hay otros procedimientos que convergen mucho más rápido, particularmente en la vecindad de un óptimo, lil resto de lu sección es dedicada a esos métodos,

Page 65: Chapra12-20

14 .2 .3 Procedimientos de gradiente avanzado

Método del gradiente conjugado (Fletcher-Reeves). En la sección 14.1.2, se ha visto cómo en el método de Powell las direcciones conjugadas mejoran mucho la eficiencia de la búsqueda univariable. De manera similar, se puede también mejorar la convergencia lineal de pasos ascendentes por medio de gradientes conjugados. En efecto, un método de optimización que usa gradientes conjugados para definir la dirección de búsqueda, se puede demostrar que es cuadráticamenté convergente. Esto también asegura que el método optimizará una función cuadrática exactamente en un número finito de pasos sin importar el punto de inicio. Dado que muchas funciones con buen comportamiento pueden aproximarse razonablemente bien por una cuadrática en la vecindad de un óptimo, los procedimientos de convergencia cuadrática son a menudo muy eficientes cerca de un óptimo.

Se ha visto cómo empezando con dos direcciones de búsqueda arbitrarias, el método de Powell produce nuevas direcciones de búsqueda conjugadas. Este método es cuadráticamente convergente y no requiere la información del gradiente. Por otro lado, si la evaluación de las derivadas es práctica, se puede utilizar algoritmos que combinen las ideas de pasos descendente y conjugar las direcciones para lograr un comportamiento inicial más sólido y de convergencia rápida como la técnica que gravita hacia el óptimo. El algoritmo de gradiente conjugado Fletcher-Reeves modifica el método de pasos ascendente al imponer la condición de que las direcciones de búsqueda del gradiente sucesivas sean mutuamente conjugadas. La prueba y el algoritmo van más allá del alcance del texto, pero se describen en Rao (1996).

Método de Newton. El método de Newton para una sola variable (recuerde la sección 13.3) se puede extender a los casos de multivariable. Escriba una serie de Taylor de segundo orden para f(x) cerca de x = x,-,

/ (x) = / ( X / ) + V / r ( x , ) ( x - X,-) + I ( x - XifHiix - x,)

donde Hl es la matriz Hessian. En el mínimo,

= O para7 = 1, 2 , n

Así,

V / = V / ( x / ) + / / , ( x - x / ) = 0

Si H es no singular,

la cual se puede demostrar que converge en forma cuadrática cerca del óptimo. Este método de nuevo se comporta mejor que el método de pasos ascendentes (véase la figura 14.12). Sin embargo, observe que este método requiere ambos, el cálculo de las segundas derivadas y la inversión de la matriz, en cada iteración. Así, el método no es muy útil en la práctica para funciones con grandes números de variables. Además, el método de Newton puede no converger si el punto inicial no está cerca del óptimo.

Page 66: Chapra12-20

FIGURA 1 4 . 1 2 Cuando el punto inicial es cercano al punto óptimo, siguiendo el gradiente puede ser ineficiente. Los métodos de Newton intentan la búsqueda a lo largo de una trayectoria directa hacia el óptimo (línea sólida).

Método de Marquardt. Se sabe que el método de pasos ascendente aumenta el valor de la función aun si el punto inicial está lejos del óptimo. Por otro lado, ya se ha descrito el método de Newton, el cual converge con rapidez cerca del máximo. El método de Marquardt usa el método de pasos descendente cuando x está lejos de x*, y el método de Newton cuando x se acerca a un óptimo. Esto se puede llevar a cabo al modificar la diagonal del Hessian en la ecuación ( 1 4 . 1 4 ) ,

H, = H,+ai¡

donde oc, es una constante positiva e / es la matriz de identidad. Al inicio del procedimiento, oc, se supone que es grande y

la cual reduce la ecuación ( 1 4 . 1 4 ) al método de pasos ascendente. En tanto continúan IHN iteraciones, a¡ se aproxima a cero y el método pasa a ser el de Newton.

Así, el método de Marquardt ofrece lo mejor de ambos mundos: comienza en forma lenta y confiable desde valores de inicio pobres y luego acelera en forma rápida cuando se aproxima al óptimo. Por desgracia, el método todavía requiere la evaluación del Hessiun y la inversión de las matrices a cada paso.

Debería observarse que el método de Marquardt es ante todo usado para problema* de mínimos cuadrados. Por ejemplo, la librería del IMSL contiene una subrutinn para este propósito.

Page 67: Chapra12-20

PROBLEMAS 397

Métodos de Quasi-Newton. Los métodos de Quasi-Newton, o métodos de variable métrica buscan estimar el camino directo hacia el óptimo en forma similar al método de Newton. Sin embargo, observe que la matriz Hessian en la ecuación (14.14) se compone de las segundas derivadas de /que varían de paso a paso. Los métodos de Quasi-Newton intentan evitar estas dificultades al aproximar Tí con otra m a t r i z s ó l o por medio de las primeras derivadas parciales d e / El procedimiento involucra comenzar con una aproximación inicial de H~x y actualizar y mejorarla con cada iteración. Estos métodos son llamados de Quasi-Newton porque no usan el Hessian verdadero, sino más bien una aproximación. Así, se tienen dos aproximaciones al trabajar en forma simultánea: 1) la aproximación original de la serie de Taylor y 2) la aproximación Hessian.

Hay dos métodos principales de este tipo: los algoritmos de Davidon-Fletcher-Powell (DFP) y el de Broyden-Fletcher-Goldfarb-Shanno (BFGS). Ellos son similares excepto en detalles concernientes a cómo manejan los errores de redondeo y su convergencia. BFGS es por lo general reconocido como superior en la mayoría de los casos. Rao (1996) proporciona detalles y declaraciones formales de ambos algoritmos, el DFP y el BFGS.

P R O B L E M A S

H I encuentre la derivada direccional de

/(>. v) ,= 2.v2 + j 2

P i n - 2 y y = 2 en la dirección de h = 3/ + 2j. H J l'nitientre el vector gradiente y la matriz Hessian para cada tilín do las siguientes funciones

,i) íi\,y) = 2xy2 + 3 ^

/.) I\\.y,z) = x2+y2 + 2zi

.•) /U.y) = m(x2 + 2xy + 3y2) l ' M Dada

/(\, Y) ^ 2xy + \.5y - 1.25A-2 - 2y2

Construya y resuelva un sistema de ecuaciones algebraicas lineales que maximice/(*). Observe que esto se realiza al igualar a cero las derivadas parciales de/con respecto a x y y. 14.4 a) Empiece con un valor inicial de x — 1 y y = 1 y emplee dos

aplicaciones del método de pasos ascendente a f(x, y) para el problema 14.3.

b) Construya una gráfica con los resultados del inciso a) anterior mostrando la trayectoria de la búsqueda. Encuentre el valor mínimo de

/ ( A , y) = (x- 2 ) 2 + ( Y - 3 ) 2

empezando en x — 1 y y = 1, usando el método de pasos descendente con un criterio de paro de £ 5 = 1 %.

F IOURA P 1 4 . 9 lu LII'IM]II(¡cla de la malla.

- 5 - 1 0 - 1 5 - 2 0 - 2 5

-2 -1 \ 0 < Menta»,

2 X

Page 68: Chapra12-20

3 9 B OPTIMIZACIÓN MULTIDIMENSIONAL SIN RESTRICCIONES

1 4 . 6 Realice nuil iteración del método de pasos ascendente para locali/ur el máximo de

,/lv, v) = 3.5.V + 2y + .x2 - x4 - 2xy - y2

mediante los valores iniciales x = 0, y = 0. Emplee el método de bisección para encontrar el tamaño de paso óptimo en la dirección de la búsqueda del gradiente. 1 4 . 7 Efectúe una iteración del método de pasos descendente del gradiente óptimo para localizar el mínimo de

/(.v, y) = -Ix + \ .2x2 + 1 ly + 2y 2 - 2xy

con valores iniciales x = 0 y y = 0. 1 4 . 8 Desarrolle un subprograma usando un programa o lenguaje macro para implementar el método de búsqueda aleatoria.

Diseñe el subprograma do tal forma que esté expresamente di señado para localizar un máximo. Pruebe el programa con f(x,y) del problema 14.6. Use un rango de —2 a 2 para ambos xyy-14.9 La búsqueda por malla es otro procedimiento de fuer/a bruta para optimización. La versión en dos dimensiones se des cribe en la figura P14.9. Las dimensiones de x y y se dividen en pequeños incrementos para crear una malla. La función se eva lúa entonces en cada nodo de la malla. Cuanto más densa sea la malla, es más probable localizar el óptimo.

Desarrolle un subprograma por medio de un programa o lenguaje macro para implementar el método de búsqueda por malla. Diseñe el subprograma de tal forma que esté expresanien te diseñado para localizar un máximo. Pruebe su programa con el problema del ejemplo 14.1.

Page 69: Chapra12-20

CAPITULO 15

Optimización restringida

Este capítulo aborda problemas de optimización donde entran enjuego las restricciones. Primero, se analizarán problemas donde ambas, la función objetivo y las restricciones, son lineales. Para tales casos, se dispone de métodos especiales que aprovechan la linearidad de las funciones realzadas. Los llamados métodos de programación lineal y sus algoritmos resultantes, resuelven con gran eficiencia problemas muy grandes con miles de variables y restricciones. Dichos métodos se usan en un amplio rango de problemas en la ingeniería y la administración.

Después, se retomará en forma breve un problema más general de optimización restringida no lineal. Finalmente, se proporcionará una revisión de cómo se puede emplear los paquetes de software y librerías para la optimización.

1 5 . 1 P R O G R A M A C I Ó N L I N E A L

La programación lineal (o PL por simplicidad) es un procedimiento de optimización que trata de cumplir con un objetivo como el de maximizar las utilidades o minimizar el costo, en presencia de restricciones como lo son las fuentes limitadas. El término lineal

denota que las funciones matemáticas que representan ambos, el objetivo y las restricciones, son lineales. El término programación no significa "programación en computadora", más bien denota "programar" o "fijar una agenda" (Revelle y cois. 1997).

15 .1 .1 Forma estándar

El problema básico de programación lineal consiste en dos partes principales: la función objetivo y un conjunto de restricciones. Para un problema de maximización, la función objetivo es por lo general expresada como

Maximizar Z = cixl + c¿x2 + • • • + ctpcn (15.1)

donde cy = pago por cada unidad de la y-ésima actividad que se lleva a cabo y Xj = magnitud de laj'-ésima actividad. Así, el valor de la función objetivo, Z, es el pago total debido al número total de actividades, n.

Las restricciones se pueden representar en forma general como

a; 1 * 1 + a /2*2 -\ 1" amxn < b¡ (15.2)

donde a¡¡ = cantidad de z'-ésima fuente que se consume por cada unidad de /-ésima actividad y h¡ = cantidad de la /-ésima fuente que está disponible. Esto es, las fuentes Hon limitadas.

Page 70: Chapra12-20

OPTIMIZACIÓN RESTRINGIDA

El segundo tipo general de restricción especifica que todas las actividades deben tener un valor positivo.

,v, > 0 ( I . V M

En el contexto actual, esto expresa la noción realística de que, para algunos problemas, la actividad negativa es físicamente imposible (por ejemplo, no se puede producir bienes negativos).

Juntas, la función objetivo y las restricciones, especifican el problema de programo ción lineal. Estas indican que se trata de maximizar la amortización para un número do actividades bajo la restricción de que éstas utilizan cantidades finitas de fuentes. Anlos de mostrar cómo se puede obtener este resultado, se desarrollará un ejemplo.

Inicializando el problema PL

Enunciado del problema. Se desarrolla el siguiente problema del área de la ingeniet in química. Sin embargo, éste es relevante para todas las áreas de la ingeniería que (icnoii que ver con la producción de productos con fuentes limitadas.

Suponga que una planta procesadora de gasolina recibe cada semana una canlidiul fija de materia prima para gasolina. Esta última se procesa en dos tipos de gasolina, do calidad regular y prémium. Estas clases de gasolina son de alta demanda; es decir, so tiene garantizada su venta y se obtiene diferentes utilidades para la compañía. Sin om bargo, su producción involucra ambas restricciones, tiempo y almacenaje en sitio. I'oi ejemplo, sólo una de las clases se puede producir a la vez, y las instalaciones csliin abiertas solamente 80 horas por semana. Además, existe un límite de almacenamiento para cada uno de los productos. Todos estos factores se enlistan abajo (observe que umi tonelada métrica, o ton, es igual a 1 000 kg):

Producto

Recurso Regular P r é m i u m Disponibi l idad del racur t s

Materia prima para la gasolina 7 m3/tone!ada 11 m3/tonelada 77 m3/seman<i Tiempo de producción 10 hr/tonelada 8 hr/tonelada 80 hr/semanu Almacenamiento 9 toneladas 6 toneladas

Aprovechamiento 150/tonelada 175/tonelada

Desarrolle una formulación de programación lineal para maximizar las utilidades iltf esta operación.

Solución. El ingeniero que opera esta planta debe decidir la cantidad a piodueii de cada gasolina para maximizar las utilidades. Si las cantidades producidas cada semiili» de gasolinas regular y prémium son designadas x] y .v2, respectivamente, la uiiiiniiel» total se puede calcular como

S ~ 2 n n n n n ¡ n > n f a l — I < A v J . 1 7 C . V -

Page 71: Chapra12-20

13 .1 P R O G R A M A C I Ó N L 1 N I A I

¡

| 1 i

o escribirlo como una función objetivo en programación lineal,

Maximizar Z = 150*1 175x2

Las restricciones se pueden desarrollar en una forma similar. Por ejemplo, el total de gasolina cruda utilizada se puede calcular como

Total de gasolina utilizada = 7x^ + 1 \x2

Este total no puede exceder el abastecimiento disponible de 77 m 3/semana, así que la restricción se puede representar como

7x, + 1 lx2 < 77

Las restricciones restantes se pueden desarrollar en una forma similar, la formulación total resultante para la PL está dada por

Maximizar Z = 150*! + 175x2 (maximizar la ganancia)

Observe que el conjunto de ecuaciones anterior constituye la formulación completa de PL. Las explicaciones en los paréntesis de la derecha se han incluido para clarificar el significado de cada ecuación.

1 5 . 1 . 2 Solución gráfica

Debido a que las soluciones gráficas están limitadas a dos y tres dimensiones, tienen utilidad práctica limitada. Sin embargo, son muy útiles para demostrar algunos conceptos básicos que resaltan las técnicas algebraicas generales usadas para resolver problemas con grandes dimensiones en la computadora.

Para un problema en dos dimensiones, como el del ej emplo 15.1, la solución espacial se define como un plano conX] medida a lo largo de la abscisa y x2, a lo largo de la ordenada. Como las restricciones son lineales, se pueden trazar sobre este plano como líneas rectas. Si el problema de PL se formula adecuadamente (es decir, si tiene una solución), estas líneas restrictivas delinearán una región, llamada el espacio de solución factible, englobando todas las posibles combinaciones dex, y x2 que obedecen las restricciones y, por tanto, representan soluciones factibles. La función objetivo para un valor particular de Z se puede trazar como otra línea recta y sobrepuesta en este espacio. El valor de Z puede entonces ser ajustado hasta que esté en el máximo valor, mientras todavía toca el espacio factible. Este valor de Zrepresenta la solución óptima. Los valores correspondientes dex {

y x 2 , donde Z toca el espacio de solución factible, representan los valores óptimos pura las actividades. El siguiente ejemplo deberá ayudar a clarificar el procedimiento,

Sujeta a

7x, + 1lx 2 < 77 10x, + 8x 2 < 80 X ! < 9 x 2 < 6 X j , x2>0

(restricciones de materiales) (restricción de tiempo) (restricción de almacenaje "regular") (restricción de almacenaje "prémium") (restricciones positivas)

Page 72: Chapra12-20

402 OPTIMIZACIÓN RESTRINGIDA

EJEMPLO 15.2 Solución gráfica

Enunciado del problema. Desarrolle una solución gráfica para el problema de procesamiento de gasolina que se derivó antes en el ejemplo 15.1:

Maximizar Z

Sujeta a

150x, + 175x2

7JCI + l l x 2 < 77

10x, + 8x 2 < 80

x\ < 9

x 2 < 6

xi > 0

xi > 0

(1)

(2)

(3)

(4)

(5)

(6)

Se ha numerado las restricciones para identificarlas en la siguiente solución gráfica.

Solución. Primero, se pueden trazar las restricciones sobre el espacio de solución. Por ejemplo, se puede formular la primera restricción como una línea al reemplazar la desigualdad por un signo de igual y resolver para x 2 :

Xl

Así, como en la figura 15.1a, los valores posibles dex, y x 2 que obedecen dicha restricción se hallan por debajo de esta línea (la dirección es designada en la gráfica por la pequeña flecha). Las otras restricciones se pueden evaluar en forma similar, como sobrepuestas sobre la figura 15.1a. Observe cómo éstas encierran una región donde todas se encuentran. Este es el espacio de solución factible (el área ABCDE en la gráfica).

Además de definir el espacio factible, la figura 15.1a también proporciona un conocimiento adicional. En particular, se puede ver que la restricción 3 (almacenamiento de gasolina regular) es "redundante". Esto es, el espacio de solución factible no resulla afectado si fuese suprimida.

Después, se puede agregar la función objetivo a la gráfica. Para hacer esto, se debe escoger un valor de Z. Por ejemplo, para Z = 0 la función objetivo es ahora

0 = 150xi + 175x 2

o, resolviendo para x 2

150 x 2

X l

175

Como se muestra en la figura 15.16, ésta representa una línea punteada interceptando el origen. Ahora, puesto que estamos interesados en maximizar Z, se puede aumentar osla » digamos 600, y la función objetivo es

x¡ D O O

175 150

175 x\

Page 73: Chapra12-20

F IGURA 15 .1 ' » n ' m gráfica de un problema de programación lineal, a) Las restricciones definen un espacio de solución factible. M li i liilición objetivo se puede incrementar hasta que alcance el valor más alto que cumpla con todas las restricciones. < iiólii uniente, se mueve hacia arriba y a la derecha hasta que toca el espacio factible en un solo punto óptimo.

Así, incrementando el valor de la función objetivo, la línea se mueve lejos del origen. Como la línea todavía está dentro del espacio de solución, nuestro resultado es aún factible. Sin embargo, por la misma razón, todavía hay espacio para mejorarlo. Por tanto, Z se puede seguir aumentando hasta que un incremento adicional lleve la función objetivo más allá de la región factible. Como se muestra en la figura 15.1¿>, el valor máximo de Z corresponde a 1 400 aproximadamente. En este punto, x{ y x2 son casi igual a 4.9 y 3.9, en forma respectiva. Así, la solución gráfica indica que si se producen estas cantidades de gasolinas regular y prémium, se alcanzará una máxima utilidad de casi 1 400.

Además de determinar los valores óptimos, el procedimiento gráfico proporciona conocimientos adicionales en el problema. Esto se puede apreciar al sustituir de nuevo las soluciones en las ecuaciones restrictivas.

7(4.9) + 11(3.9) = 77

10(4.9) + 8(3.9) = 80

4.9 < 9

3.9 < 6

En consecuencia, como queda también claro en la gráfica, producir la cantidad óptima de cada producto nos lleva directamente al punto donde se encuentran las restricciones de las fuentes (1) y del tiempo (2). Tales restricciones se dice que están enlazadas. Además, la gráfica también hace evidente que ninguna de las restricciones de almacena-

Page 74: Chapra12-20

404 OPTIMIZACIÓN RESTRINGIDA

miento [(3) y (4)] actúan como una limitante. Tales restricciones se conocen como iu> enlazadas. Esto nos lleva a la conclusión práctica de que, para este caso, se puedo ¡ni mentar las utilidades, ya sea con un incremento en el abastecimiento de fuentes (la gasolina cruda) o en el tiempo de producción. Además, esto indica que el aumento <M almacenamiento podría no tener impacto sobre las utilidades.

El resultado obtenido en el ejemplo anterior es uno de los cuatro posibles resultados que por lo general se puede obtener en un problema de programación lineal. Éstos son:

1. Solución única. Como en el ejemplo, la función objetivo máxima intercepta un solo punto.

2. Soluciones alternas. Suponga que la función objetivo del ejemplo tuviera coeficicn tes, de tal forma que fueran paralelos precisamente a una de las restricciones, lín nuestro problema ejemplo, una forma en la cual esto podría ocurrir, sería que las utilidades fueran cambiadas a $140/ton y $220/ton. Entonces, más que un solo pun to, el problema podría tener un número infinito de óptimos correspondientes a un segmento de línea (véase figura 15.2a).

3. Solución no factible. Como en la figura 15.26, es posible que el problema esté lói mulado de tal manera que no exista solución factible. Esto puede deberse a que se trata con un problema sin solución o a errores en la formulación del problema. I o último puede resultar si el problema está tan sobrerrestringido que ninguna solución puede satisfacer todas las restricciones.

4. Problemas sin límite. Como en la figura 15.2c, esto usualmente significa que el problema está bajorrestringido y, por tanto, con finales abiertos. Como para el caso de la solución no factible, puede a menudo surgir de errores cometidos durante la especificación del problema.

Ahora supongamos que nuestro problema involucra una solución única. El procedí miento gráfico podría sugerir una estrategia numerativa para dar con el máximo. De la

F I G U R A 1 5 . 2 Adornas de una sola ecuación óptima (por ejemplo, figura 15.1b), existen otros tres resultados posibles de un problema di piogramación lineal: a) alternativa óptima, b) solución no factible y c) en resultado sin límites.

Page 75: Chapra12-20

1371 PROGRAMACIÓN LINEAL

figura 15.1, debería quedar claro que siempre ocurre el óptimo en uno de los puntos esquina donde se encuentran dos restricciones. Tal punto se conoce de manera formal como un punto extremo. Así, fuera del número infinito de posibilidades en el espacio de decisión y enfocándonos sobre los puntos extremo, claramente se reducen las opciones posibles.

Además, se puede reconocer que no todo punto extremo es factible; esto es, salislu-cer todas las restricciones. Por ejemplo, observe que el punto F en la figura 15. \a es un punto extremo, pero no es factible. Si nos limitamos a puntos extremos factibles, ,sc reduce el campo factible todavía más.

Por último, una vez que se ha identificado todos los puntos extremo factibles, el que ofrezca el mejor valor de la función objetivo representará la solución óptima. Se podría encontrar esta solución óptima mediante la exhaustiva (e ineficiente) evaluación del valor de la función objetivo en cada punto extremo factible. En la siguiente sección se analiza el método simplex, que ofrece una estrategia preferible que representa en forma gráfica un rumbo selectivo a través de la secuencia de puntos extremos factibles para arribar al óptimo de una manera extremadamente eficiente.

15 .1 .3 El método s implex

El método simplex se basa en la suposición de que la solución óptima estará en un punto extremo. Así, el procedimiento debe ser capaz de discernir si durante la solución a un problema ocurre un punto extremo. Para realizar esto, las ecuaciones con restricciones se reformulan como igualdades por medio de la introducción de las llamadas variables de holgura.

Variables de holgura. Como lo indica su nombre, una variable de holgura mide cuánto de una fuente restringida está disponible; es decir, cuánta "holgura" de la fuente está disponible. Por ejemplo, recuerde la fuente restringida que se usó en los ejemplos 15.1 y 15.2:

7x, + l l x 2 < 77

Se puede definir una variable de holgura S¡ como la cantidad de gasolina cruda que no se usa para un nivel de producción particular (x,, x 2 ) . Si esta cantidad se agrega al lado izquierdo de la restricción, forma la relación exacta

7xi + 11*2 + Si = 11

Ahora se reconoce lo que la variable de holgura nos indicaba. Si ésta es positiva, significa que se tiene algo de "holgura" para esta restricción. Esto es, se cuenta con algo más de recursos que no han sido utilizados por completo. Si es negativa, nos indica que nos hemos excedido en la restricción. Finalmente, si es cero, denota que se cumplió exactamente con la restricción. Es decir, se dispuso de todo el recurso. Puesto que ésta es exactamente la condición donde las líneas de restricción se intersectan, la variable de holgura proporciona un medio para detectar puntos extremos.

Una variable de holgura diferente se desarrolla para cada ecuación restringida, resultando en lo que se llama versión completamente aumentada,

Maximizar Z = I50*| + I75x 2

Page 76: Chapra12-20

406 OPTIMIZACIÓN RESTRINGIDA

Sujeta a

7*i + 1 1JC2 + 5i = 7 7 (15.4«)

1 0 x i + 8 x 2 + S 2 = 8 0 (15.4A)

xi + S 3 = 9 (15.4c-)

x 2 + S 4 = 6 (15 Ad)

xi, x 2 , Si, S 2 , S 3 , S 4 > 0

Advierta cómo se han formulado de igual modo las cuatro ecuaciones, de tal manera que las incógnitas están alineadas en las columnas. Se hizo así para resaltar que ahora se trata de un sistema de ecuaciones algebraicas lineales (recuerde la parte tres). En la siguiente sección se mostrará cómo se pueden usar estas ecuaciones para determinar los puntos extremo en forma algebraica.

Solución algebraica. En contraste con la parte tres, donde se tenía ra ecuaciones con // incógnitas, nuestro sistema ejemplo [ecuaciones (15.4)] está subespecificado; esto es, tiene más incógnitas que ecuaciones. En términos generales, hay n variables estructuradas (es decir, las incógnitas originales), m excedentes o variables de holgura (una por restricción), y n + m variables totales (estructuradas más excedentes). Para el problema de la producción de gasolina se tienen 2 variables estructuradas, 4 variables de holgura y 6 variables totales. Así, el problema involucra resolver 4 ecuaciones con 6 incógnitas.

La diferencia entre el número de incógnitas y el de ecuaciones (igual a 2 en nuestro problema) está directamente relacionada con la forma en que se puede distinguir un punto extremo factible. En forma específica, cada punto factible tiene 2 variables de las 6 que se igualaron a cero. Por ejemplo, los cinco puntos esquina del área ABCDE tienen los siguientes valores cero:

Punto extremo Variables cero

A x,, x 2

B C S|, s 2

D S j , s 4

E X], S 4

Esta observación nos lleva a concluir que los puntos extremo se pueden determinni en la forma estándar al igualar las dos variables a cero. En nuestro ejemplo, esto reduce el problema a una forma soluble de 4 ecuaciones con 4 incógnitas. Por ejemplo, para el punto E, haciendo x, = S 4 = 0 se reduce la forma estándar a

l l x 2 + S i = 7 7

8x 2 + S 2 = 8 0

+ S 3 = 9

X2 = 6

la cual se puede resolver para x 2 = 6, S, = 11, S2 = 32 y S 3 = 9. Junto con *| -- S 4

0, estos valores definen el punto E,

Page 77: Chapra12-20

15.1 PROGRAMACIÓN LINEAL

Para generalizar, una solución básica para m ecuaciones lineales con n incógnitas so desarrolla al igualar n — m variables a cero, y resolviendo las tn ecuaciones para las m incógnitas restantes. Las variables cero son formalmente referidas como variables no básicas, mientras las m variables restantes son llamadas variables básicas. Si todas I UN variables básicas son no negativas, el resultado es llamado solución factible básica. VA óptimo será una de éstas.

Ahora un procedimiento directo para determinar la solución óptima podría ser calcular todas las soluciones básicas, para determinar cuáles son factibles, y entre ellas, cuál tiene el valor de Z más grande. Pero éste no es un buen procedimiento por dos razones.

Primero, para problemas de tamaños moderados, el procedimiento puede involucrar resolver una gran cantidad de ecuaciones. Para m ecuaciones con n incógnitas, se deben resolver

m m\(n-m)\

ecuaciones simultáneas. ¡Por ejemplo, si hay 10 ecuaciones (m — 10) con 16 incógnitas (« = 16), se podría tener 8 008 [= 16!/(10! 6!)] sistemas 10 X 10 de ecuaciones a resolver!

Segundo, una porción significativa de éstas puede ser no factible. Por ejemplo, en el problema actual de los C\ — 15 puntos extremos, sólo 5 son factibles. Claramente, si se pudiese evitar resolver todos estos sistemas innecesarios, se podría desarrollar un algoritmo más eficiente. Un procedimiento como tal se describe a continuación.

Implementación del método simplex. El método simplex evita las ineficiencias descritas en la sección anterior. Esto lo realiza al comenzar con una solución factible básica. Luego se mueve a través de una secuencia con las otras soluciones factibles básicas que sucesivamente mejoran el valor de la función objetivo. En forma eventual, se alcanza el valor óptimo y termina el método.

Se ilustrará el procedimiento mediante el problema de procesamiento de la gasolina de los ejemplos 15.1 y 15.2. El primer paso es empezar en una solución factible básicu (es decir, en una esquina del punto extremo del espacio factible). Para casos como los nuestros, un punto de inicio obvio podría ser el A; esto es, xl = x2 = 0. Las 6 ecuaciones originales con 4 incógnitas serían

Si = 77

S2 = 80

S2 = 9

5 4 = 6

Así, los valores iniciales de las variables básicas son dados automáticamente como iguales a los lados derecho de las restricciones.

Antes de proceder al siguiente paso, la información inicial se puede ahora resumir en un formato tabular conveniente llamado representación. Como se muestra en la tabla de la siguiente página, la representación proporciona un resumen conciso de la información clave que constituye el problema de programación lineal.

Page 78: Chapra12-20

4 0 8 OPTIMIZACIÓN RESTRINGIDA

Básica Z * 1 x 2 S i s 2 s 3 s 4 Solución Intercepción

Z 1 -150 -175 0 0 0 0 0 5, 0 7 11 1 0 0 0 77 1 1 S2 0 10 8 0 1 0 0 80 íi s 3

0 1 0 0 0 1 0 9 9 5 4

0 0 1 0 0 0 1 ó

Observe que para propósitos de la representación, la función objetivo se expresa como

Z - 150*i - 175*2 - OS, - 0S2 - 0S 3 - 0S4 = 0 (15.5)

El siguiente paso implica moverse a una nueva solución factible básica que nos lleva a una mejora de la función objetivo. Esto se lleva a cabo al aumentar una variable actual no básica (en este punto, x, o x 2) por arriba de cero para que Z aumente. Recuerde que, para el ejemplo actual, los puntos extremos deben tener 2 valores cero. Por tanto, una de las variables básicas actuales (S 1 ( S2, S3 o S4) deben también igualarse a cero.

Para resumir este paso importante: una de las variables no básicas actuales debe hacerse básica (no cero). Esta variable se llama variable de entrada. En el proceso, una de las variables básicas actuales se hace no básica (cero). Esta variable se llama variable de salida.

Ahora, desarrollaremos un procedimiento matemático para seleccionar las variables de entrada y salida. Debido a la convención de cómo se escribe la función objetivo [véase ecuación (15.5)], la variable de entrada puede ser cualquier variable en la función objetivo que tenga un coeficiente negativo (ya que esto hará a Z más grande). La variable con el valor negativo más grande se escoge de manera convencional porque nos lleva usualmente al incremento más grande en Z. Para nuestro caso, x2 podría ser la variable de entrada puesto que su coeficiente, —175, es más negativo que el coeficiente dex ( , — 150.

En este punto se puede consultar la solución gráfica por visualización. Se comienza en el punto A, como se muestra en la figura 15.3. Con base en su coeficiente, se debería escogerx 2 para introducirlo. Sin embargo, para continuar con este breve ejemplo, seleccionamos x¡ puesto que se observa en la gráfica que nos llevará más rápido al máximo.

Después, se debe escoger la variable de salida de entre las variables básicas actuales S2, S3 o S4). Se puede ver gráficamente que hay dos posibilidades. Moviéndonos al

punto B se tendrá S2 igual a cero, mientras que al movernos al punto F tendremos .V, igual a cero. Sin embargo, por la gráfica también queda claro que F no es posible, ya que queda fuera del espacio de solución factible. Así, se decide mover de A a B.

¿Cómo se detecta el mismo resultado en forma matemática? Una forma es calcular los valores para los cuales las líneas de restricción interceptan el eje o línea que corresponde a la variable de salida (en nuestro caso, el eje x,). Se puede calcular este valor como la razón del lado derecho de la restricción (la columna "Solución" de la representación) al coeficiente correspondiente de x¡. Por ejemplo, para la primera variable de holgura restrictiva Sx, el resultado es

77 Intercepción = = 1 1

7

Las intersecciones restantes se pueden calcular y enlistar como la úllima columna de la tabla. Como 8 es el entero positivo más pequeño, esto significa que la segunda linea

Page 79: Chapra12-20

13,1 PROGRAMACIÓN L I N E A L m

restringida se alcanzará primero en tanto xx aumente. Por tanto, S2 debería ser la variable de entrada.

En este punto, se ha movido al punto B (x2 = S2 = 0), y la nueva solución básica es ahora

7 x i + Si = 7 7

lOx, = 80

x, + S3 = 9

S 4 = 6

La solución de este sistema de ecuaciones define en forma efectiva los valores de las variables básicas en el punto B: x, = 8, 5*, = 21, S3 = 1, S4 = 6.

La tabla se puede usar para realizar los mismos cálculos al emplear el método de Gauss-Jordan. Recuerde que la estrategia básica detrás de Gauss-Jordan implica conver tir el elemento pivote a 1 Y después eliminar los coeficientes en la misma columna arriba Y abajo del elemento pivote (recuerde la sección 9.7)

Para este ejemplo, el renglón pivote es S2 (la variable de entrada) Y el elemento pivote es 10 (el coeficiente de la variable de salida, X J ) . Al dividir el renglón ende 10 Y reemplazar S2 por x, se tiene

Básica z * 1 x 2 S i S 2 S 3 S 4 Solución

Z 1 - 1 5 0 - 1 7 5 0 0 0 0 0 s , 0 7 11 1 0 0 0 77

0 1 0.8 0 0.1 0 0 8

s3

0 1 0 0 0 1 0 9 0 0 1 0 0 0 1 ñ

Page 80: Chapra12-20

OPTIMIZACIÓN RESTRINGIDA

Después, los coeficientes x, en los otros renglones se pueden eliminar. Por ejemplo, |(M« el renglón de la función objetivo, el renglón pivote se multiplica por 150 y se IOMM »»l resultado del primer renglón para dar

Z * 1 x2 « I S 2 S 3 S 4

Solución

1 - 1 5 0 - 1 7 5 0 0 0 0 11

- 0 - ( -150) -1-120) - 0 -15) 0 0 ( 1 '.'< ii I|

1 0 - 5 5 0 15 0 0

1 :nn Operaciones similares se pueden ejecutar en los renglones restantes para obtener la mir-va tabla

Básica Z x i x 2 S i S 3 S 4 Solución Intercepción

Z 1 0 - 5 5 0 15 0 0 1 200 S , 0 0 5.4 1 - 0 . 7 0 0 21 : i .HH7

0 1 0.8 0 0.1 0 0 8 10 0 0 -0 .8 0 - 0 . 1 1. 0 1

-1 y> S 4 0 0 1 0 0 0 1 ó 6

Así, la nueva tabla resume toda la información para el punto B. Esto incluye el hecho iln que el movimiento ha aumentado la función objetivo a Z = 1 200.

Esta tabla se puede usar entonces para representar el próximo, y en este caso, el pum > final. Sólo una más de las variables, x2, tiene un valor negativo en la función objetivo, y se escoge, por tanto, como la variable de salida. De acuerdo con los valores de la intei cepción (ahora calculados como la columna de solución sobre los coeficientes de la columna x2), la primera restricción tiene el valor positivo más pequeño y, por tanto, se selecciona a S, como la variable de entrada. Así, el método simplex mueve los puntos dr B a Cen la figura 15.3. Por último, la eliminación Gauss-Jordan se puede implemcnluí para resolver las ecuaciones simultáneas. El resultado es la tabla final,

Básica Z * 1 x 2 S , S 2 S 3 S 4 Solución

Z 1 0 0 10.1852 7.8704 0 0 i 4 I : Í HHV

X 2 0 0 1 0 .1852 - 0 . 1 2 9 6 0 0

* 1 0 1 0 - 0 . 1 4 8 1 0 .2037 0 0

A HIIV 5 3

0 0 0 0 .1481 - 0 . 2 0 3 7 1 0 4 111

S 4 0 0 0 - 0 . 1 8 5 2 0.1296 0 1 '¿111

Se sabe que éste es el resultado f inal porque no quedan coeficientes negativos en el renglón de la función objetivo. La solución f inal se tabula como x¡ — 3.889 y x}

4.889, los cuales dan una función objetivo máxima de Z = I 413.889. Además, como .V, v Si O I T Á N todavía en la base, sabemos que la solución está limitudu por ln primer» y

Page 81: Chapra12-20

1 5 . 2 O P T I M I Z A C I Ó N R E S T R I N G I D A N O L I N E A L

Existe un número de procedimientos para el manejo de problemas de optimización no lineal en la presencia de restricciones. Dichos procedimientos se pueden dividir en forma general en directos e indirectos (Rao, 1996). Un procedimiento típico indirecto usa las muy conocidas funciones de penalización. Estas involucran colocar expresiones adicionales para hacer la función objetivo menos óptima en tanto la solución se aproxima n la restricción. Así, la solución será no aceptada por violar las restricciones. Aunque talos métodos pueden ser útiles en algunos problemas, pueden ser difíciles cuando el problema involucra muchas restricciones.

El método de búsqueda del gradiente reducido generalizado, o GRG (por sus siglas en inglés), es uno de los más populares métodos directos (para detalles, véase Lasdon y cois., 1978; Lasdon y Smith, 1992). Este es, de hecho, el método no lineal usado en el Solver de Excel.

Primero "reduce" el problema a uno de optimización no restringida. Esto lo hace al resolver un conjunto de ecuaciones no lineales para las variables básicas en términos do variables no básicas. Después, se resuelve el problema no restringido usando procedimientos similares a los descritos en el capítulo 14. Se escoge primero una dirección do búsqueda. La selección por default es un procedimiento cuasi-Newton (BFGS) que, como se describió en el capítulo 14, requiere el almacenamiento de una aproximación de la matriz Hessian. Este procedimiento se ejecuta muy bien en la mayoría de los casos. El procedimiento del gradiente conjugado está también disponible en Excel como una alternativa para problemas grandes. El Solver de Excel tiene la excelente característica que en forma automática cambia al método del gradiente conjugado dependiendo de la disponibilidad de almacenamiento. Una vez que se ha establecido la dirección de búsqueda, se lleva a cabo la búsqueda en una dimensión a lo largo de esa dirección mediante un procedimiento de tamaño de paso variable.

1 5 . 3 O P T I M I Z A C I Ó N C O N P A Q U E T E S DE S O F T W A R E

Los paquetes de software y librerías tienen grandes capacidades para la optimización. En esta sección, se dará una introducción a algunos de los más útiles.

15 .3 .1 Momead

Mathcad contiene una función en modo numérico llamada Find, que se puede usar parn resolver hasta 50 ecuaciones algebraicas no lineales simultáneas con restricciones de desigualdad. El uso de esta función para aplicaciones no restringidas se describió en In parte dos. Si Find falla en la localización de una solución que satisface las ecuaciones y restricciones, regresa con un mensaje de error "no se encontró solución". Sin embargo, Mathcad contiene también una función similar llamada Minerr. Esta función da resultados de solución que minimizan los errores en las restricciones aun cuando no puedan encontrarse soluciones exactas. Esta función resuelve ecuaciones y acomoda varias restricciones mediante el método Lenenberg-Marquardt tomando de los algoritmos do dominio público M1NPACK, desarrollados y publicados por el Laboratorio Nacional Argonne.

Page 82: Chapra12-20

OPTIMIZACIÓN RESTRINGIDA

Hagamos un ejemplo donde se utiliza Find para resolver un sistema de ecuaciones no lineales con restricciones que introducen los valores iniciales de x = I y y I mediante los símbolos definidos como se muestra en la figura 15.4. La instrucción (¡Ivon entonces le indica a Mathcad que se debe introducir un sistema de ecuaciones. Observe que para esta aplicación Mathcad requiere el uso de un signo de igual simbólico, teclea do como [Ctrl] = y > para separar los lados izquierdo y derecho de una ecuación. Ahora se calcula el vector que consiste de xval y yval usando Find(x, y) y los valores son mostrados con un signo igual.

Una gráfica que muestra las ecuaciones y restricciones, así como la solución, se puede insertar en cualquier lugar sobre la hoja de cálculo al hacer clic en la ubicación deseada. Esto coloca una retícula roja en esa localización. Entonces se usa la secuencia Insert/Graph/X-Y Plot en el menú para colocar un gráfico vacío sobre la hoja de cálculo con símbolos matemáticos para las expresiones que habrán de granearse y para los rau gos de los ejes x y y. Cuatro variables se trazan sobre el eje y como se muestra (las mitades inferior y superior de la ecuación para el círculo, la función lineal y un pailón cruzado que representa la restricción x > 2). Los rangos para estos casos son x para las mitades del círculo superior e inferior, ¿j para la línea y r¡ para la restricción. Mathcad realiza el resto para producir la gráfica. Una vez que se ha creado la gráfica, se puede usar del menú la secuencia Format/Graph/X-Y Plot para variar el tipo de grá l'i ca, cambiar color, tipo y grueso de la línea de la función, y agregar títulos, etiquetas y otras características. La gráfica y los valores numéricos para xval y yval ilustran excelentemente la solución, así como la intersección del círculo y la línea en la región x > 2 .

1 5 . 3 . 2 Programación lineal en Excel

Existe una variedad de paquetes de software especialmente diseñados para implemcntai programación lineal. Sin embargo, como su disponibilidad es amplia, este análisis se

F IGURA 15 .4 Pantalla de Mathcad de un problema de optimización restringida no lineal.

FILE EDIT VIEW INSERT FORMAT MATH SYMBOLICS WINDOW HELP

C O N S T K A I N E D N O N U N E A R O P T I M I Z A T I O N Gae» valué*: i:=-l y:=I Grven x1-t-y2-6 i-t-y-2 a>2 Determine mintió n: [yval] := Find(1)') xval - 2.4142136 yy«l --0.4142136 Comtratned eme (i>2)

Page 83: Chapra12-20

1 5 . 3 O P T I M I Z A C I Ó N C O N P A Q U E T E S D E S O P T W A R E 4 t t

concentrará en la hoju tic cálculo lixcel. íisln involucra usar la opción Solver que nntoH NO empleó en el capítulo 7 para localizar raíces.

La manera en la cual se usa Solver para programación lineal es similar a nuestras aplicaciones previas en el sentido de que los datos se introducen en las celdas de la hoja de cálculo. La estrategia básica es llegar a una celda que esté optimizada como una función de las variaciones de las otras celdas sobre la hoja de cálculo. El siguiente ejemplo ilustra cómo se puede realizar esto para el problema de procesamiento de lu gasolina.

EJEMPLO 15.3 Usando el Solver de Excel para un problema de programación lineal

Enunciado del problema. Utilice una hoja de cálculo en Excel para calcular los valores adecuados en el problema del procesamiento de la gasolina examinado en este capítulo.

Solución. Una hoja de cálculo de Excel para calcular los valores pertinentes en el problema de procesamiento de gasolina es mostrado en la figura 15.5. Las celdas no

! sombreadas son las que contienen los datos numéricos y leyendas. Las celdas sombreadas involucran las cantidades que se calculan con base en las otras celdas. Reconozca que la

{ celda a ser maximizada es la DI2, la cual contiene la utilidad total. Las celdas que cambian son B4: C4, en las cuales se tiene las cantidades de la gasolina producida regular y prémium.

¡ Una vez que se crea la hoja de cálculo, se selecciona Solver del menú Tools (Herra-| mientas). En esta etapa un recuadro de diálogo se mostrará, requiriendo de usted la infor-

F IGURA 15 .5 Acondicionamiento de una hoja de cálculo en Excel para usar el Solver para la programación lineal.

A | B | C | , D E 1 P rob lema para el proe es. de gasol ina 2 3 Regular Prémium Total Disponib. 4 Producido 0 0 5 6 Materia prima 7 1 1 0 " 77 7 Tiempo 10 8 0 * - 80

00

Almacén, de regular 0 "* 9 9 Almacén, de prémium 0 ^ 6 10 11 Aprov. por unidad 150 175 12 Aprovechamiento 0 o 0

= B 6 * B 4 + C 6 * C 4

= B 7 * B 4 + C 7 ' C 4

= B 4

= C4

- B 4 * B 1 1 - C4*C11 - B 1 2 + C 1 2

Page 84: Chapra12-20

4 1 4 OPTIMIZACIÓN RESTRINGIDA

marión pertinente. Estas celdas pertinentes del recuadro de dialogo de Solver se llenaran como

Ubique la celda dentro: D12

Igual a 9 máx O mín O igual a 0

Al cambiar celdas

B4-.G1

Sujeto a:

D6<=-£6 D7<=E7 D8<=E8 D9<=E9

Se debe incluir las restricciones una por una al seleccionar el botón "Add". Esto abrirá un recuadro de diálogo como el siguiente

Celda de referencia: Restricción

D6 Eó

Como se muestra, la restricción donde el total de materia prima para la gasolina (celda D6) debe ser menor o igual que el abastecimiento disponible (E6) se puede agre gar como se ejemplificó. Después de agregar cada una de las restricciones, el botón "Add" puede ser seleccionado. Cuando se haya introducido las cuatro restricciones, se leccionamos el botón OK para regresar al recuadro de diálogo del Solver.

Ahora, antes de la ejecución, se debería seleccionar el botón options del Solver y revisar el recuadro rotulado como "Assume linear model"(Suponer modelo linear). Esto hará que Excel emplee una versión del algoritmo simplex (en lugar del Solver no lineal más general que normalmente usa) que acelera su aplicación.

F I G U R A 1 5 . 6 Hoja de cálculo de Excel con la solución al problema de programación lineal.

1 ' A : | B j C | D E 1 Problema para el preces, de gasolina 2 3 Regular Prémium Total Disponib. 4 Producido 4.888889 3.888889 5 6 Materia prima 7 11 77 77 '7- Tiempo 10 8 80 80

, , * Almacén, de regular 4 .888889 9 Almacén, de prémium 3 .888889 6

o

n Aprov. por unidad 150 175

Page 85: Chapra12-20

13,3 O P T I M I Z A C I Ó N C O N P A Q U E T E S D E S O F T W A R E 411

Después de seleccionar esta opción, regrese el menú Solver. Cuando seleccione H botón OK, se abrirá un recuadro de diálogo con un reporte sobre el éxito de In operación. Para el caso actual, el Solver obtiene la solución correcta (véase figura 15.6).

Además de obtener la solución, el Solver también proporciona algunos reportes resumen útiles. Estos serán explorados en las aplicaciones de la ingeniería que se describen en la sección 16.2.

15 .3 .3 Excel para optimización no lineal

La manera de usar Solver para optimización no lineal es similar a nuestras aplicaciones anteriores en cuanto a que los datos son introducidos en las celdas de la hoja de cálculo. Una vez más, la estrategia básica es tener una sola celda a optimizar como una función de las variaciones de las otras celdas sobre la hoja de cálculo. El siguiente ejemplo ilustra cómo hacer esto para el problema del paracaidista que se acondicionó en la introducción de esta parte del libro (recuerde el ejemplo PT4.1).

EJEMPLO 15.4 Uso del Solver de Excel para la optimización restringida no lineal

Enunciado del problema. Recuerde que en el ejemplo PT4.1 se desarrolló una optimización restringida no lineal para minimizar el costo de la caída de un paracaídas en un campo de refugiados. Los parámetros para este problema son

P a r á m e t r o S ímbo lo Valor Un idades

Masa total M, 2 000 Aceleración de la gravedad 9 9.8 m/s 2

Coeficiente de costo |constante) co 200 $ Coeficiente de costo (por longitud) c i 56 $/m Coeficiente de costo (por área) =2 0.1 $ / m 2

Velocidad critica de impacto vc 20 m/s Efecto del área sobre el arrastre kc

3 kg/(sm 2) Altura inicial de caída z0 5 0 0 m

Sustituyendo estos valores en las ecuaciones (PT4.11) a (PT4.19) se obtiene

Minimizar C = «(200 + 56( + 0.L4 2)

sujeto a

v < 2 0

n > 1

donde n es un entero y todas las otras variables son reales. Además, las siguientes cantidades se definen como

Page 86: Chapra12-20

OPTIMIZACIÓN RESTRINGIDA

A = 2nr2

í = V2r c = 3,4

- ¥í m n

9.8m t = raíz 500 1

c

V = 9 ' % e - ( c / m ) f

-(I-e -(c/m)t

(15.6)

(15.7)

j Use Excel para resolver este problema para las variables diseño r y n que minimicen el | costo C.

í Solución. Antes de implementar este problema en Excel, se debe primero enfrentar el j problema de establecer la raíz en la formulación anterior [ecuación (15.7)]. Un método \ podría ser desarrollar un macro para implementar un método de localización de raíces, | tal como el de la bisección o de la secante. (Advierta que se ilustrará cómo realizar esto ] en el próximo capítulo, en la sección 16.3.)

Mientras tanto, un procedimiento más fácil es posible mediante el desarrollo de la í siguiente solución por iteración por punto fijo en la ecuación (15.7),

' ¡+1 — 500-9.8m ¿

(1 -(c/m)f,-

9.8w (15.8)

Así, t se puede ajustar hasta que se satisfaga la ecuación (15.8). Se puede demostrar que para el rango de parámetros usados en este problema, la fórmula siempre converge.

Ahora, ¿cómo se puede resolver esta ecuación en una hoja de cálculo? Como se muestra abajo, se puede fijar dos celdas de manera que tengan un valor para t y para el lado derecho de la ecuación (15.8) [es decir,/(r)]. Se puede teclear la ecuación (15.8) en la celda B21 de tal forma que toma su valor tiempo de la celda B20 y los otros valores de los parámetros de celdas de cualquier otro lugar de la hoja (véase a continuación cómo se construye toda la hoja). Después coloqúese en la celda B20 y apunte su valor a la celda B21.

A B 20 r 0 21 itl 0.480856

500 + 9.8m2 ( 1 _ e^clm)i) 9.8m

Una vez que se introducen estas fórmulas, se desplegará en forma inmediata el mensaje de error: "no se puede resolver referencias circulares", ya que B20 dependo do IÍ21 y viceversa. Ahora, vaya a las selecciones Tools/Options del menú y seleccione calculatlon

Page 87: Chapra12-20

(cálculo). Del recuadro de diálogo calculation, verifique que apurezca "iterución" y presione "OK". En forma inmediata la hoja de cálculo iterará estas celdas y el resultudo aparecerá como

A B 20 i 1 255} 21 Ht) 10.25595

Así, las celdas convergerán sobre la raíz. Si se quiere tener más precisión, sólo presione la tecla F9 para que se realicen más iteraciones (el default es 100 iteraciones, que se pueden cambiar si se desea).

En la figura 15.7 se muestra cómo establecer una hoja de cálculo en Excel para calcular los valores pertinentes. Las celdas no sombreadas son las que contienen los datos numéricos y las leyendas. Las celdas sombreadas involucran cantidades que se calculan con base en las otras celdas. Por ejemplo, la masa en B17 se calculó con la ecuación (15.6) con base en los valores de Mt (B4) y n (E5). Observe también que algunas celdas son redundantes. Por ejemplo, la celda El 1 se direcciona a la celda E5. Esta repetición en la celda El 1 muestra que la estructura de las restricciones es evidente en la hoja. Finalmente, note que la celda que habrá de minimizarse es El5 , que contiene el costo total. Las celdas a cambiar son E4:E5, en las cuales se tiene el radio y el número de paracaídas.

F I G U R A 1 5 . 7 Acondicionamiento de una hoja de cálculo en Excel para el problema de optimización no lineal referente al paracaídas. '

A | B | C | D E F G 1 Prob lema de opt imización del paracaídas 2 1 1 3 P a r á m e t r o s : Var iables de d iseño: 4 Mt 2000 r 1 5 a 9.8 n 1 6 costl 200 7 cost2 56 Restricciones: 8 cost3 0.1 9 ve 20 var iab les t ipo l ímite 10 kc 3 V < = • 11 zO 500 n i > = 1 12 13 Valores calculados: Función objet ivo: 14 A 6.283185 15 1 1.414214 Costo 283.1438 16 c 9 17 m 2000

Raiz : localización: t fifi

Page 88: Chapra12-20

418 OPTIMIZACIÓN RESTRINGIDA

Una vez que se ha creado la hoja de cálculo, se elige la selección Solver del menú Tools. En esta etapa se desplegará un recuadro de diálogo, requiriendo la información pertinente. Las celdas pertinentes en el recuadro de diálogo Solver se podrían llenar como

Ubique la celda dentro. E 1 5

Igual a O máx • mín O igual a 0

Al cambiar celdas

U E 5 i

E"?> - 3 1 0

E' K - V I

' E 5 = entero

Se debe agregar las restricciones una por una al seleccionar el botón "Add". Esto abrirá un recuadro de diálogo como el siguiente

Celda de referencia:

E.C

Restricción

F IGURA 1 5 . 8 Hoja de cálculo en Excel con la solución del problema de optimización no lineal referente ni

caídas.

A | B 1 C | D E F 1 P rob lema de opt imización del paracaidas 2 1 1 3 P a r á m e t r o s : Var iables de d iseño: 4 Mt 2000 r 5 a 9.8 n 6 6 costl 200 7 cost2 56 Restr icciones: 8 cost3 0.1 9 ve 20 var iab les t ipo l imi te

No kc 3 V < = 20 11 zO 500 n 6 > = 1 12 13 12 13 Valores calculados: Función objet ivo: 14 A 54.44432 15 1 4.162952 Costo 4377.262 16 c 163.333 17 m 333.3333 18

, 19 Ra iz : localización: 1 27.04076 fin 27,Q4v76

Page 89: Chapra12-20

15,3 O P T I M I Z A C I Ó N C O N P A Q U E T E S D E S O F T V M » 41*

Como se muestra, la restricción en la que la velocidad real del impacto (celda E10) debe ser menor o igual a la velocidad requerida (G10), puede ser agregada como se hizo en el ejemplo. Después de agregar cada restricción se puede seleccionar el botón "Add".

| Observe que la flecha hacia abajo le permite escoger entre varios tipos de restricciones ( < = , > = , = y entero). Así, se puede forzar el número de paracaídas (E5) para que sea un entero.

Cuando se hayan introducido las tres restricciones, se selecciona el botón OK para \ regresar al recuadro de diálogo Solver. Cuando seleccione el botón OK se abrirá un | recuadro de diálogo con un reporte sobre el éxito de la operación. Para el caso presente, \ el Solver obtiene la solución correcta como la que se muestra en la figura 15.8. jj De esta forma, se determina que el costo mínimo de 4 377.26 ocurrirá si se reparte I en seis paquetes con un radio del paracaídas de 2.944 m. Además de obtener la solución, ] el Solver también proporciona algunos reportes resumen útiles. Estos serán explorados ¡ en las aplicaciones de la ingeniería que se describirán en la sección 16.2.

15 .3 .4 IMSL

IMSL tiene varias subrutinas en Fortran para optimización (véase tabla 15.1). El presente análisis se concentrará en la rutina UVMÍD. Esta rutina localiza el punto mínimo de una función suave para una sola variable mediante evaluaciones de la función y primeras derivadas.

UVMID es implementado por el siguiente enunciado CALL:

C A L L U V M I D ( F , G , X G U E S S , E R R E L , G T O L , M A X F N , A , B , X , F X , G X )

donde F = FUNCIÓN suministrada por el usuario para calcular el valor de la función a ser minimizada. La forma es F(X), donde X = punto en el cual se evalúa la función. (Entrada). X no debería ser cambiada por F,. y F = valor de la función calculado en el punto X. (Salida)

G = FUNCIÓN suministrada por el usuario para calcular la derivada de la función, donde G = valor de la función calculada en el punto X. (Salida)

F y G se deben declarar como EXTERNAL en el programa de llamado XGUESS = Un valor inicial del punto mínimo de F. (Entrada) ERREL = Exactitud relativa requerida del valor final de X. (Entrada) GTOL = Tolerancia derivativa usada para decidir si el punto actual es un

mínimo. (Entrada)

MAXFN = Número máximo de ecuaciones permitido de la función. (Entrada)

A = Punto extremo inferior del intervalo en el cual se localiza el máximo. (Entrada)

B = Punto extremo superior del intervalo en el cual se localiza el máximo. (Entrada)

FX = Valor de la función en X. (Salida)

GX = Valor de la derivada en X. (Salida)

Page 90: Chapra12-20

4 2 0 OPTIMIZACIÓN RESTRINGIDA

T A I L A 15 .1 Rutinas IMSL para optimización.

Categoría Ru t ina Capacidad

Minimización no restringida

Función univariable

Función multivariable

UVMIF UVMID UVMGS

UMINF UMING UMIDH UMIAH UMCGF UMCGG UMPOL

Usando sólo valores de la función Utilizando valores de la función y de la primera derivada Función no suave

Usando gradiente por diferencias finitas Utilizando gradiente analítico Empleando Hessian por diferencias finitas Usando Hessian analítico Utilizando gradiente conjugado con gradiente por diferencias finitas Empleando gradiente conjugado con gradiente analítico Función no suave

Mínimos cuadrados no lineales UNLSF UNLSJ

Utilizando Jacobiano por diferencias finitas Usando Jacobiano analítico

Minimización con límites simples

BCONF BCONG BCODH BCOAH BCPOL BCLSF BCLSJ

Usando gradiente por diferencias finitas Utilizando gradiente analítico Empleando Hessian por diferencias finitas Usando Hessian analítico Función no suave Mínimos cuadrados no lineales mediante Jacobiano por diferencias finilun Mínimos cuadrados no lineales mediante Jacobiano analítico

Minimización restringida lineal

DLPRS QPROG LCONF LCONG

Programación lineal densa Programación cuadrática Función objetivo general con gradiente por diferencias finitas Función objetivo general con gradiente analítico

Minimización restringida no lineal

NCONF NCONG

Usando gradiente por diferencias finitas Utilizando gradiente analítico

Rutinas de servicio CDGRD FDGRD FDHES GDHES FDJAC CHGRD CHHES CHJAC GGUES

Gradiente por diferencias centrales Gradiente por diferencias hacia adelante Hessian por diferencias hacia adelante Hessian por diferencias hacia adelante mediante gradiente analítico Jacobiano por diferencias hacia adelante Verificación del gradiente proporcionado por el usuario Revisión del Hessian dado por el usuario Verificación del Jacobiano proporcionado por «I usuario

..Puntal d t Inicio jwntradoi

Page 91: Chapra12-20

PROBLEMAS " - " • ^ T t n

EJEMPLO 15.5 U J O de IMSL para localizar un 1 0 I 0 óptimo

j Enunciado del problema. Use la rutina UVMID para determinar el máximo de lii función unidimensional resuelta en el capítulo 13 (recuerde los ejemplos del 15.1 AL 15.3).

! J ¡ f(x) = 2 sen x

10

Solución. Un ejemplo del programa principal en Fortran 90 y de la función usadn ! UVMIF para resolver este problema se puede escribir como

PROGRAM Oned

! USE mimsl I

IMPLICIT NONE INTEGER::max fn - 50 REAL: :xguess-0. . e r r e l - l . E - 6 . g t o l - l . E - 6 . a — 2 . , b - 2 . REAL::x,f,g,fx,gx EXTERNAL f.g CALL UVMIDCf,g,xguess ,errrel ,gtol ,maxfn,a ,b,x,fx,gx) PRINT * .x . fx .gx END PROGRAM

FUNCTION f(x) \ IMPLICIT NONE

REAL::X,f f—(2.*SIN(X) - x**2/10.) END FUNCTION

FUNCTION g(x) IMPLICIT NONE REAL::x,g g—(2.*C0S(x) - 2 .*x/10. ) END FUNCTION

Observe que como la rutina está acondicionada para minimización, se introduce el negativo de la función. Un ejemplo de la corrida es

i 1 . 4 2 7 3 3 4 - 1 . 7 7 5 7 2 6 - 4 . 7 3 9 7 2 9 E - 0 4

P R O B L E M A S

I 11 Inii compañía produce dos tipos de productos, A y B. Esos productos se producen en una semana de trabajo de 40 horas y al I nuil de la semana son embarcados. Los productos requieren 20 y í kg de materia prima por kg de producto, respectivamente, y IN compañía tiene acceso a 10 000 kg de materia prima por se-iminii, Sólo un producto so puede fabricar a la voz, con tiempos

de producción de 0.05 y 0.15 horas, respectivamente. La plnnlii puede almacenar sólo 550 kg del producto total por semana. Pin último, la compañía obtiene utilidades de $45 y $30 por e«<ln unidad, respectivamente. a) Establezca el problema de programación linoal pare maxl

mizar la utilidad.

Page 92: Chapra12-20

4 2 2 OPTIMIZACIÓN RESTRINGIDA

/;) Resuelva el problema do programación lineal en forma gráfica.

c) Solucione el problema do programación lineal con el método simplex.

d) Resuelva el problema con un paquete de software. e) Evalúe con cuál de las siguientes opciones se obtendrá la

máxima utilidad: aumentar la materia prima, el almacenamiento o el tiempo de producción.

15.2 Suponga que para el ejemplo 15.1, la planta procesadora de gasolina decide producir una tercera clase de producto con las siguientes características:

Suprema

Materia prima para gasolina Tiempo de producción Almacenamiento Aprovechamiento

15 m3/tonelada 1 2 hr/tonelada 5 toneladas $250/tonelada

Además, suponga que una nueva fuente de materia prima para la gasolina se ha descubierto, de tal forma que el total disponible se duplica a 154 m 3 /por semana. a) Establezca el problema de programación lineal para maxi-

mizar la utilidad. b) Resuelva el problema de programación lineal con el méto

do simplex. c) Solucione el problema con un paquete de software. d) Evalúe con cuál de las siguientes opciones se obtendrá la

máxima utilidad: aumentar la materia prima, el almacenamiento o el tiempo de producción.

15.3 Considere el problema de programación lineal

Minimizar f(x, y) = —x + y 3

sujeto a

x + 2.5}' < 15 x + y < 7 2x + y < 9 x>0 y > 0

Obtenga la solución a) Gráficamente. b) Por medio del método simplex. c) Mediante un paquete de software o librería apropiado (por

ejemplo, Excel, Mathcad o IMSL). 15.4 Considere el problema de programación lineal:

Maximizar/X*, .y) = 12* + lOy

sujeto a

5x +4 .y - 1700

x +y < 7 4.5JC + 3 . 5 } ' < 1600 .v + 2y < 500 x > 0 } > 0

Obtenga la solución a) Gráficamente. b) Mediante el método simplex. c) Con un paquete de software o librería apropiado (por ejeui

pío, Excel, Mathcad o IMSL). 15.5 Use un paquete o librería de software (por ejemplo, líxiW, Mathcad o IMSL) para resolver el siguiente problema de opiitin zación no lineal restringido.

Maximizar f(x, y) l.\x+\.9y - y3

sujeto a

x + y < 0.9

x > 0

y > 0

15.Í Use un paquete o librería de software (por ejemplo, I ÍXITI , Mathcad o IMSL) para resolver el siguiente problema de opluul zación no lineal restringido.

Minimizar/(x:,}>) = I9x+ \ly

sujeto a

x2 + y2 > 0.95 x + 2 y < 2

x > 0 y > 0

15.7 Considere el siguiente problema de optimización no IIIICBI restringido:

Minimizar/(x,y) = (x - 2.5) 2 + (y - 2 . 5 ) 2

sujeto a

x + 2y = 4

a) Use un procedimiento gráfico para estimar la solución. b) Utilice un paquete o librería de software (por ejemplo, l'v

ecl, Mathcad o IMSL) pura obtener una ONlinmuion mát exacta. ,. .,

Page 93: Chapra12-20

I f t . l l UNO un pnquelc o librorln de solUvarc puní determinar el IUI'IHIIIIO de

,/'(.v..)•) 2.»>> + \.5y - \.25x2 - 2y1

lít.° Uliliee un paquete o librería de software para determinar el máximo de

/(.,•,y) = 3.5x + 2y + x2 - x 4 - 2xy - y2

15.10 Dada la siguiente función,

./'(.v.r) ~ -7 . r I I.2.V'' -1 1 ly I 2/ 2\y

use un paquete o librería de software puru determinar al mínimo a) Gráficamente. b) Numéricamente. c) Sustituya el resultado de b) en la función para determinar el

mínimo f(x, y). d) Determine el Hessian y su determinante, y sustituya el re

sultado del inciso b) en la última para verificar que se lia detectado un mínimo.

Page 94: Chapra12-20

CAPITULO 16

Aplicaciones en la ingeniería: optimización

El propósito de este capítulo es usar los procedimientos numéricos analizados en los capítulos 13 al 15 para resolver problemas reales de la ingeniería que involucran optimización. Estos problemas son importantes, ya que a los ingenieros se les pide con frecuencia que den la "mejor" solución a un problema. Como muchos de estos casos involucran sistemas complejos e interacciones, los métodos numéricos y las computado ras son con frecuencia una necesidad para desarrollar soluciones óptimas.

Las siguientes aplicaciones son típicas de aquellas que se encuentran en forma ruli nana durante los estudios superiores y de graduados. Además, ellas son representativas de problemas con los que se enfrentará el ingeniero profesionalmente. Los problemas son tomados de las áreas principales de la ingeniería: química/petrolera, eléctrica y me cánica/aeroespacial.

La primera aplicación, tomada de la ingeniería química/petrolera, tiene que ver con el uso de la optimización restringida no lineal para el diseño óptimo de un tanque cilindrico. El Solver de Excel se usa para desarrollar la solución.

Después, se utiliza la programación lineal para apreciar un problema de la ingenie ría civil/ambiental: minimizar el costo del tratamiento de aguas para cumplir con los objetivos de calidad del agua en un río. En este ejemplo, se introduce la noción de precios indefinidos y su uso para mostrar la sensibilidad de una solución por programación lineal.

La tercera aplicación, tomada de la ingeniería eléctrica, involucra maximizar la potencia a través de un potenciómetro en un circuito eléctrico. La solución involucra optimización unidimensional no restringida. Además de resolver el problema, se ilustra cómo los lenguajes macro de Visual Basic dan acceso al algoritmo de búsqueda de la sección dorada dentro del contexto del ambiente Excel.

Por último, la cuarta aplicación, tomada de la ingeniería mecánica/aeroespacial, involucra determinar los desplazamientos de la pierna al pedalear en una bicicleta do montaña al minimizar la ecuación bidimensional de energía potencial.

1 6 . 1 D I S E Ñ O D E U N T A N Q U E C O N EL M E N O R C O S T O ( I N G E N I E R Í A Q U Í M I C A / P E T R O L E R A )

Antecedentes. Los ingenieros químicos y petroleros (así como otros especialistas tales como los ingenieros mecánicos y civiles) con frecuencia se enfrentan al problema general del diseño de recipientes que transportan líquidos y gases. .Suponga que so lo pide determinar las dimensiones de un pequeño tanque cilindrico para ol transporto de

Page 95: Chapra12-20

16.1 D I S E Ñ O D E U N T A N Q U E C O N E L M E N O R C O S T O

F I G U R A 16 .1 Parámetros para determinar las dimensiones óptimas de un tanque cilindrico.

desechos tóxicos que se van a trasladar en un camión. Su objetivo general será minimizar el costo del tanque. Sin embargo, además del costo, usted debe asegurar que mantenga la cantidad requerida de líquido y que no exceda las dimensiones de la caja del camión. Debido a que el tanque transportará desechos tóxicos, se requiere de un espesor especificado por ciertos reglamentos.

Un esquema del tanque y de la caja se muestra en la figura 16.1. Como puede verso, el tanque consiste en un cilindro con dos placas soldadas en cada extremo.

El costo del tanque involucra dos componentes: 1) gastos del material, el cual está basado en el peso, y 2) gastos de soldadura que se basan en la longitud necesaria para soldar. Observe que lo último involucra soldar ambas: la costura interior y la exterior en donde se conectan las placas con el cilindro. Los datos necesarios para el problema so resumen en la tabla 16.1.

Solución. El objetivo aquí es construir un tanque a un mínimo costo. El costo está relacionado con las variables de diseño (longitud y diámetro), ya que ellas tienen efecto sobre la masa del tanque y las longitudes a soldar. Además, el problema es restringido yu que el tanque debe 1) ajustar a la caja del camión y 2) contener el volumen requerido de material.

T A B L A 16 .1 Parámetros para determinar las dimensiones óptimas de un tanque cilindrico para transporte de desechos tóxicos.

P a r á m e t r o S ímbo lo Va lo r U n i d a das

Volumen requerido 0.8 rrr' Espesor i 3 cm Densidad p 8 000 kg/rrv1

Longitud de la caja móx 2 m Ancho de la caja 1 m

Costo del material 4.5 $Afj Costo por soldadura 20 $/m

Page 96: Chapra12-20

APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN

El costo implica los valores del material del tanque y de soldarlo. Por lanío, la fluición objetivo se puede formular como una minimización

(16.1)

donde C = costo ($), m = masa (kg), íw = longitud a soldar (m), cm y cw = factores de costo para la masa ($/kg) y longitud de la soldadura ($/m), respectivamente.

Después, se reformulará cómo la masa y longitud de la soldadura se relacionan con las dimensiones del tambor. Primero, la masa se puede calcular como el volumen del material por su densidad. El volumen del material usado para crear las paredes laterales (por ejemplo, el cilindro) se puede calcular como

^cilindro — ^ n

D

Para cada placa circular en los extremos, esto es

(d aplaca = * ( — + t \2

Así, la masa se calcula con

m = p\Ljí D 2 + H -

D 2?r| y + f | t (16.2)

donde p = densidad (kg/m ). La longitud de soldadura para unir cada placa es igual a la circunferencia interior y

exterior del cilindro. Para las dos placas, la longitud total de soldadura sería

**w — ^ 2 * | § + í ) + 2 * f = 4n(D +1) (16.3)

Dados los valores de D y L (recuerde que el espesor t está fijo por códigos), las ecuaeio nes (16.1), (16.2) y (16.3) proporcionan un medio para calcular el costo. También observe que cuando las ecuaciones (16.2) y (16.3) se sustituyen en la ecuación (16.1), ol resultado de la función objetivo es no lineal en las incógnitas.

Después, se puede formular las restricciones. Primero, se debe calcular qué volu men puede ser introducido en el tanque terminado,

TTD2

Este valor debe ser igual al volumen deseado. Así, una restricción es

JTD2L = V„

donde Vü e» el volumen deseado (m 3).

Page 97: Chapra12-20

1 6 . 1 D I S E Ñ O D E U N T A N Q U E C O N E L M E N O R C O S T O 4 9 ?

Las restricciones restantes tienen que ver con que el tanque ajusto a las dimensiones de la caja del camión,

L<Lr

D<D M Á X

El problema está ahora especificado. Con la sustitución de los valores de la tabla 16.1, se puede resumir como

Maximizar C = 4.5m + 2Q€W

Sujeto a

TTD 2L

4

L < 2 D < 1

donde

= o.:

m = 8000 \ Ln D

+ 0.03 - - + 2JT[ ® + 0.03 0.03

ln : 4K(D + 0.03)

El problema ahora se puede resolver en diferentes formas. Sin embargo, el planteamiento más simple para un problema de esta magnitud es usar una herramienta como el Solver de Excel. La hoja de cálculo para realizar esto se muestra en la figura 16.2.

F IGURA 1 6 . 2 Hoja de cálculo de Excel lista para evaluar el costo de un tanque sujeto a restricciones de volumen requerido y tamaño.

A B c 0 E F G 1 Diseño de tanque ópt imo 2 1 3 P a r á m e t r o s : Var iables de diseño 4 5 . ) 0.8 D 1 6 0.03 L 2 7 rho 8000

* Lmáx 2 Restricciones 9 Dmáx 1 < = 1 10 n 4.5 D 1 = 2 11 cw 20 L 2 _ 0.8

Vol 1.570796 Valores calculados:

W3 Función objet ivo:

I F 1 m

W F \ »( ) V 11$ i » > * 1

Iw I t , , ! , C • 1 4 , 4 3 3

Vcoraza Ylaeai

Page 98: Chapra12-20

428 APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN

Para el caso mostrado, se introducen los límites D y L. Para este caso, el volumen cu mayor que el requerido (1.57 > 0.8).

Una vez creada la hoja de cálculo, la selección Solver se escoge del menú T O O I N

(Herramientas). En este punto aparecerá un recuadro de diálogo que le solicitará la información pertinente. Las celdas pertinentes del recuadro de diálogo Solver se pueden llenar como

Ubique la celda destino: E16

Igual a O máx 0 mír O igual a 0

Por cambio de celdas E5:E6

Sujeto a las restricciones: E 1 0 < G 1 0 E l l < G 1 1 E l 2 = G12

Al seleccionar el botón OK, un recuadro de diálogo se abrirá mostrado un reporte sobre el éxito de la operación. Para el caso presente, el Solver obtiene la solución correcta, la cual se muestra en la figura 16.3. Observe que el diámetro óptimo es casi el valor de la restricción de 1 m. Así, si la capacidad del tanque se aumentara, podría encararse esta restricción y el problema se reduciría a una búsqueda unidimensional para la longitud.

FIGURA 16.3 RESULTADOS DE MINLMIZACIÓN. EL PRECIO SE REDUCE DE 9 154 A 5 7 2 3 , YA QUE EL VOLUMEN MÁS PEQUEÑO TIENE LAS DIMENSIONES DE D = 0 . 9 8 M Y L = 1 .05 M.

A B C D E F O 1 Diseño de tanque ópt imo 2 1 3 Parámet ros : Var iables de diseño: 4 5 VO 0.8 D 0 . 9 8 2 9 4 9 6 t 0 .03 L 1.054235 7 rho 8000 8 Lmáx 2 Restricciones 9 Dmáx 1 < = 1 10 cm 4.5 D 0 . 9 8 2 9 4 9 < = 2 11 cw 20 L o.a 12 Vol 0 . 7 9 9 9 9 8

•13 Valores calculados:

j£ _ 1 Función objet ivo:

15 m 1 2 1 5 . 2 3 6 1 Iw 1 2 . 7 2 9 0 9 C

Vcora¿u • • • •

Page 99: Chapra12-20

1 6 . 2 M Í N I M O C O S T O ! N T R A T A M I E N T O D E A G U A S D E D E S E C H O 429

1 6 . 2 M Í N I M O C O S T O E N T R A T A M I E N T O D E A G U A S D E D E S E C H O ( I N G E N I E R Í A C I V I L / A M B I E N T A L )

Antecedentes. Las descargas de aguas de desecho de las grandes ciudades son, con frecuencia, la causa principal de la contaminación en un río. La figura 16.4 ilustra el tipo de sistema que un ingeniero ambiental podría enfrentar. Varias ciudades están localizadas sobre un río y sus afluentes. Cada uno genera contaminación a una razón de carga P que tiene unidades de miligramos por día (mg/d). La carga contaminante está sujeta al tratamiento de desechos que resulten de una remoción fraccional x. Así, la cantidad descargada al río es el exceso no removido por el tratamiento,

W, = (1 -x,)P¡ (16.4)

donde Wi — descarga de desechos desde la ciudad /-ésima. Cuando las descargas de desechos entran en la corriente, se mezclan con la contami

nación de las fuentes corriente arriba. Si se supone un mezclado completo en el punto de descarga, la concentración resultante en el punto de descarga se puede calcular con un simple balance de masa,

W¡ + Qucu

Qi (16.5)

donde Qu = flujo (L/d), cu = concentración (mg/L) en el río inmediatamente corriente arriba de la descarga, y Q¡ = flujo corriente abajo del punto de descarga (L/d).

Después que se establece la concentración en el punto de mezclado, los procesos de descomposición químicos y biológicos pueden remover algo de la contaminación cuando fluye corriente abajo. Para el presente caso, se supone que esta remoción se puede representar por una simple reducción fraccional R.

Suponiendo que los cabezales de agua (por ejemplo, las ciudades 1 y 2 en el río mostrado antes) están libres de contaminantes, las concentraciones en los cuatro nodos se pueden calcular como

F I G U R A 1 6 . 4 Cuatro plantas de tratamiento de aguas de desecho que descargan contaminantes a un sistema de ríos. Los segmentos del río entre las ciudades están indicados con números dentro de un círculo.

Page 100: Chapra12-20

A P L I C A C I O N E S E N L A I N G E N I E R Í A : O P T I M I Z A C I Ó N

(1

Gl3

Ql3

fll3<2l3Cl + R23Q21C2 + (1 - J C 3 ) f 3

Q34 R34Q34C3 + O -x4)P4 Q45

( !(>.())

£•3 =

c 4 =

Después, se observa que el tratamiento de aguas tiene un costo diferente, d¡($ 1 0 0 0 / mg removido), en cada una de las localidades. Así, el costo total de tratamiento (sobre una base diaria) se puede calcular como

donde Z es el costo total diario del tratamiento ( $ 1 000 /d) . La pieza final en la "decisión rompecabezas" involucra regulaciones ambientales

Para proteger los usos benéficos del río (por ejemplo, paseos en bote, pesca, tomar 1111 baño), las regulaciones indican que la concentración del río no debe exceder un estáiuliii de calidad de cs.

En la tabla 1 6 . 2 se resumen los parámetros para el sistema del río de la figura 16/1 Advierta que hay una diferencia en los costos de tratamiento entre las ciudades corrienlp arriba ( 1 y 2 ) y corriente abajo (3 y 4) por la naturaleza impredecible de las planilla corriente abajo.

La concentración se puede calcular con la ecuación ( 1 6 . 6 ) y el resultado se c i i I í h I i i

en la columna sombreada para el caso donde no se implemento tratamiento de aguas (e* decir, donde todas las x = 0 ) . Observe que el estándar de 2 0 mg/L se viola en todos I o n puntos de mezclado.

Use la programación lineal para determinar los niveles de tratamiento que salislii cen los estándares de calidad del agua a un mínimo costo. También, evalúe el impacto « I hacer el estándar más restringido debajo de la ciudad 3. Esto es, el mismo ejercicio, poní ahora con los estándares para los segmentos 3-4 y 4-5 disminuidos a 1 0 mg/L.

Z = d¡ P\X\ + d2P2X2 + d-iP-¡xi + Í Í 4 P 4 X 4

(16.7)

T A B L A 1 6 . 2 Parámetros para las cuatro plantas de tratamiento de aguas de desecho que descargan contaminante» a un sistema de ríos, junto con los resultados de concentración (c¡) para tratamiento cero. También se enlista el flujo, el factor de remoción y los estándares para los segmentos del río.

Page 101: Chapra12-20

16.2 MlNIMO COSTO EN TRATAMIENTO DE AGUAS DE DESECHO m Solución. Todos los factores antes mencionados se pueden combinar en el siguionto problema de programación lineal:

Minimizar Z = dlPlxl + d^P^ + d3P3x3 + d4P4x4 (16.8)

sujeto a las siguientes restricciones

(1

Q34

R34Q34C3 + (1 ~x4)P4

(1 " X2)P2

< cs2

223 ~ (16.9)

R\3<2\3C\ + R2iQ23C2 + (1 - * 3 ) P 3 „ < Cs3

< Cs4 Q45

0 < Xi,X2,X3,X4 < 1 (16.10)

De esta forma, la función objetivo es minimizar el costo de tratamiento [véase ecuación (16.8)] sujeto a la restricción de los estándares de calidad del agua que se deben satisfacer para todas las partes del sistema (16.9). Además, el tratamiento no debe ser negativo o mayor que el 100% de remoción [véase ecuación (16.10)].

El problema se puede resolver por medio de una variedad de paquetes. Para esta aplicación se usa la hoja de cálculo Excel. Como en la figura 16.5, los datos junto con los

PIOURA 1 6 . 5 I LI de cálculo de Excel lista para evaluar el costo de tratamiento de aguas sobre un sistema de ríos regulado. La columna I 1 1 MLLENE el cálculo de la concentración de acuerdo con la ecuación (16.6). Las celdas F4 y H4 están sombreadas para UN II.LINI las fórmulas usadas para calcular C, y el costo del tratamiento para la Ciudad 1. Además, está sombreada la celda IIV I|II(¡ muestra la fórmula para el costo total que es el que hay que minimizar [véase ecuación (16.8)].

" 1 A B I C | D | E F G H Costo m í n m o del t ra tamiento de aguas de desecho

N O TRATADA TRATAMIENTO DESCARQA COSTO UNIT. CONCENT. ESTÁNDAR COSTO DE CIUDAD P X W D EN EL RÍO D E C A TRATAMIENTO

1 1 .OOE + 09 0 1E + 09 2.00E-06 100 20 0 ' " " • i p ' l Í

jl||ni|iiiliiiii 2 2.00E + 09 0 2E + 09 2.00E-06 / 40.00 20 0 3 4.00E + 09 0 4E + 09 4.00E-O6 / 47.27 20 0

s u . 4 2.50E + 09 0 2.5E + 0 9 4.00E-06 / 22.48 20 0 FLUJO EN REMOCIÓN

SEQMENTO EL RÍO EN EL RÍO TOTAL 0

« f f 1-3 1.00E + 0 7 0.5

« f f 2-3 5.OOE + 0 7 0.35 / Í B i " 3-4 1.10E + 08 0.6 /

J i 4-5 2.50E + 08

$ D $ 4 / $ B $ 1 0

- S U M ( $ H $ 4 t / $ H $ 7 )

- $ B $ 4 * $ C $ 4 * $ I $ 4

Page 102: Chapra12-20

432 APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN

cálculos de la concentración se pueden introducir de manera fácil en lus celdas de la hoja de cálculo.

Una vez que se crea la hoja de cálculo, se elige la selección Solver del menú Tools. En este punto, un recuadro de diálogo se desplegará, requiriéndole la información pertinente. Las celdas pertinentes del recuadro de diálogo se podrían llenar como

Ubique la celda desiir

Igual a O máx • rnín O igual a

Por cambio de celdas C4:C7

Sujeto a las restricciones: C7< 1 C 7 > 0 F4>G4 F5 >G5 F6>G6 F7>G7

Observe que no todas las restricciones son mostradas, ya que el recuadro de diálogo despliega sólo seis restricciones a la vez.

Cuando se selecciona el botón OK, se abre un recuadro de diálogo con un reporte sobre el éxito de la operación. Para el presente caso, el Solver obtiene la solución correcta, la cual se muestra en la figura 16.6. Antes de aceptar la solución (al seleccionar el botón OK en el recuadro reporte del Solver), observe que se ha generado 3 reportes: Respuesta, Sensibilidad y Límites. Seleccione el reporte Sensibilidad y después presione el botón OK para aceptar la solución. El Solver generará automáticamente un reporte de sensibilidad, como el de la figura 16.7.

F I G U R A 1 6 . 6 RESULTADOS DE MINIMIZACIÓN. LOS ESTÁNDARES DE CALIDAD DEL AGUA SE CUMPLEN A UN COSTO DE 12 600/DIARIOS. OBSERVE quo AUN CON EL HECHO DE QUE NO SE REQUIERE TRATAMIENTO PARA LA CIUDAD 4, LA CONCENTRACIÓN EN SU PUNTO DE MEZCLADO ACTUALMENTE EXCEDE EL ESTÁNDAR.

A : B -. D i t 6 H 1 Costo mín i m o del t ra tamiento de aguas de desecho 2 No tratada Tratamiento Descarga Costo unit. Concent. Estándar Costo de 3 Ciudad P X W d en el río deCA tratamiento 4 ! 1 .OOE + 09 0.8 2E +08 2.00E-06 20 20 •16QQ.

2 2.OOE + 09 0.5 1E + 09 2.00E-06 20.00 20 2000 0 4.00E + 09 0.5625 1.75E + 09 4.00E-06 20.00 20 9000 4 2.50E + 09 0 2.5E + 09 4.00E-06 15.28 20 0

6 Flujo en Remoción Seqmento el río en el río Total

10 1-3 1.00E + 07 0.5 HfH 2-3 5.00E + 07 0.35 • P l 3-4 1.10E + Q8 0.6

4-5 2,$°§ tG§

Page 103: Chapra12-20

m Microsof t Excel 5 . 0 Sens i t lv i ty Repor t W o r k s h e e t : [CASE 1 5 0 2 . X L S ] W a s t o T reat Repor t Craated: 3 / 9 / 9 7 8 : 2 9

Cambiando celdas Valor Costo Coeficiente A u m e n t o D isminución

Celda N o m b r e f inal reducido objet ivo permis ib le permis ib le

$C $ 4 " 7 " " ' " . . " ° " 2 0 0 ° " Í " É " + 3 0 Ó

$C $5_ x 0.5 _0 4000 !.E+..30'____ 1200 $C$6 x 0.5625 0 16000 0 16000 $C $7_ x 0 10000 10000 ! I+. 30 10000

Restricciones Valor Precios Restr ic. A u m e n t o D isminución

Celda N o m b r e f ina l anticip. LD permis ib le permis ib le

$F $5 __conc 20.00 -30.00 20 20 _ _ 20 $F$6 conc_ _ 20.00 -440.00 20 17.87878788 15.90909091 $F$7 conc 15.28 6.00 20 1E+30 4.72

Ahora examinemos la solución (véase figura 16.6). Observe que el estándar ajustara en todos los puntos de mezclado. De hecho, la concentración en la ciudad 4 será en realidad menor que el estándar (16.28 mg/L), aunque no se requiere tratamiento para lo ciudad 4.

Como un ejercicio final, se puede disminuir los estándares 3-4 y 4-5 para ahora tener 10 mg/L. Antes de hacer esto, se puede examinar el reporte de Sensibilidad. Para el caso actual, la columna clave de la figura 16.7 es el precio anticipado. El precio anticipado es un valor que expresa la sensibilidad de la función objetivo (en nuestro caso, el costo) con una unidad que cambia una de las restricciones (estándares calidad-agua). Por tanto, representa el costo adicional en que se incurrirá al hacer los estándares más restrictivos. Para nuestro ejemplo, revela que el precio anticipado más grande, — $440/Ac í 3, ocurre para uno de los cambios de estándar (es decir, corriente abajo de la ciudad 3) que se están contemplando. Esto indica que nuestra modificación será costosa.

Esto se confirma cuando se vuelve a ejecutar el Solver con los nuevos estándares (es decir, se disminuye el valor en las celdas G6 y G7 a G10). Como se muestra en la tabla

T A B L A 1 6 . 3 Comparación de los dos escenarios involucrando el impacto de diferentes regulaciones sobre los costos de tratamiento.

Escenario 1 : Todas las c, = 2 0 Escenario 2 : Corr iente abajo c. - 1 0

Ciudad X c Ciudad X c

1 0.8 20 1 0.8 20 2 0.5 20 2 0.5 20 3 0.5625 20 3 0.8375 10 4 0 15.28 4 0.264 10

Costo - $12,600 Costo - $19,640

F IGURA 1 6 . 7 k'nporte de sensibilidad en uno hoja de cálculo lista |Kiia evaluar el costo de liiitumiento de aguas sobre un sistemo de ríns renulndo.

Page 104: Chapra12-20

434 APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN

16.3, el resultado es que el costo del tratamiento aumentó de $ 12 600/diarios u $ I 9 640/ diarios. Además, al reducir el estándar de concentraciones para las llegadas inferiores significará que la ciudad 4 debe comenzar a tratar sus desechos, y que la ciudad 3 debe actualizar su tratamiento. Observe también que no se afecta el tratamiento en las duda des corriente arriba.

Antecedentes. El circuito simple con resistencias mostrado en la figura 16.8 contieno tres resistores fijos y uno ajustable. Los resistores ajustables son llamados potenciómetros Los valores para los parámetros son V = 80 V, Rl = 8 Q, R2 = 12 Q. y R3 = 10 Ll. a) Encuentre el valor de la resistencia ajustable Ra que maximiza la transferencia de potencia a través de las terminales 1 y 2. b) Realice un análisis de sensibilidad paiu determinar cómo varía la máxima potencia y el valor correspondiente del potenciómetro sobre un rango de 45 a 105 V

Solución. A partir de las leyes de Kirchhoff se puede obtener una expresión para la potencia del circuito, como

Sustituyendo los valores de los parámetros dados se obtiene la gráfica mostrada en ln figura 16.9. Observe que la máxima transferencia de potencia ocurre en una resistencia de aproximadamente 16 Q.

1 6 . 3 M Á X I M A T R A N S F E R E N C I A D E P O T E N C I A P A R A U N C I R C U I T O ( I N G E N I E R Í A ELÉCTR ICA)

VRiR, P(Ra) = Ri(Ra + Ri + Ri) + RiRa + R3R2 ( 1 6 . 1 1 )

FIGURA 16.8 Un circuito resistor con un resistor ajustable, o potenciómetro.

« 1 R2

A M — F I

+ ' 3

FIGURA 16.9 Una gráfica de transferencia de potencia a través de las terminales 1-2 de la figura 16.8 como una función de la resistencia del

40 Potencia

potonciómetro R0.

P(Ra) -

2 0

0

Page 105: Chapra12-20

1 ¿.3 MÁXIMA TRANSFERENCIA DE POTENCIA PARA UN CIRCUITO 435

F IGURA 1 6 . 1 0 l>ciluminación en Excel de ln polc-ncia máxima a través i lo un potenciómetro niiKJiíinle prueba y error.

A B • t D '•'i M á x i m a t ransferencia de potencia

2 3 V 80 4 Rl 8 5 R2 12 6 R3 10 7 8 Ra 16.44445 9 P|Ra) 30.03003

= ( B 3 * B 6 * B 8 / ( B 4 ' ( B 8 + B 5 + B 6 ) + B 6 * B 8 + B 6 * B 5 ) ) A 2 / B 8

Resolveremos este problema en tres formas con la hoja de cálculo Excel. Primero, se emplea la prueba y error y la opción Solver. Después, se desarrollará un programa macro en Visual BASIC para realizar un análisis de sensibilidad.

d) En la figura (16.10) se muestra una hoja de cálculo Excel para implementar la ecuación (16.11). Como se indica, la ecuación (16.11) se puede introducir en la celda B9. Entonces el valor de Ra (celda B8) puede ser variada en forma de prueba y error hasta que se tenga un residuo mínimo. Para este ejemplo, el resultado es una potencia de 30.03 W con un valor en el potenciómetro de Ra = 16.44 Q.

Un planteamiento superior involucra usar la opción Solver del menú Tools de la hoja de cálculo. En este punto se desplegará un recuadro de diálogo requiriendo de usted la información pertinente.

Las celdas pertinentes del recuadro de diálogo Solver se llenarán como

Ubique la celda destino: B9

Igual a 9 máx O mín O igual a 0

Por cambio de celdas B8

Cuando el botón OK es seleccionado, se despliega un recuadro de diálogo con un reporte sobre el éxito de la operación. Para el caso actual, Solver obtiene la misma solución correcta mostrada en la figura 16.10.

b) Ahora, aunque el procedimiento anterior es excelente para una sola evaluación, no es conveniente para los casos donde se deben emplear múltiples optimizaciones. Tal podría ser el caso para la segunda parte de esta aplicación, donde estamos interesados en determinar en qué modo la potencia máxima varía para diferentes valores de voltaje. Está claro que el Solver podría llamar muchas veces los diferentes valores de los parámetros, pero esto será ineficiente. Una forma preferible sería involucrar el desarrollo de una función macro que llegue al óptimo.

Tal función es enlistada en la figura 16.11. Observe la similitud tan cercana con el pseudocódigo de la búsqueda de la sección dorada que se presentó en la figura 13.5. Además, observe que una función se debe definir también para calcular la potencia de Acuerdo con In ecuación (16.11).

Page 106: Chapra12-20

436 APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN

Funct lon GoldenCxlow, xh lgh , R l , R2, R3, V) maxlt - 50 : es - 0.01 : r - (5 A 0.5 - 1) / 2 x l - xlow : xu - xhlgh : 1 ter - 1 d - r * (xu - x l ) x l - x l + d : x2 - xu - d f l - PowerCxl, R l . R2, R3, V) f2 - Power(x2. R l , R2, R3, V) I f f l > f2 Then

xopt - x l : fx - f 1 Else

xopt - x2 : f x - f2 End I f Do

d - r * d I f f l > f2 Then

x l - x2 : x2 - x l x l - x l + d : f2 - f l f l - PowerCxl. R l . R2, R3, V)

Else xu - x l : x l - x2 x2 - xu - d : f l - f2 f2 - Power(x2, R l . R2, R3, V)

End I f 1 te r - i t e r + 1 I f f l > f 2 Then

xopt - x l : f x - f l Else

xopt - x2 : f x - f2 End I f I f xopt O 0 then ea - (1 - r ) * AbsCCxu - x l ) / xop t ) * 100 I f ea <- es Or i t e r > maxlt Then Ex i t 0o

Loop Gol den - xopt End Functlon

Funct ion PowerCRa, R l . R2, R3, V) Num - (V * R3 * Ra / CR1 * (Ra + R2 + R3) + R3 * Ra + R3 * R2)) A 2 Power - Num/Ra

End Funct ion

F IGURA 1 6 . 1 1 Macro para Excel escrito en Visual BASIC para determinar un mínimo con la búsqueda do la sección dorada.

En la figura 16.12 se muestra una hoja de cálculo Excel que utiliza este macro para evaluar la sensibilidad de la solución para el voltaje. Se tiene una columna de valores que cubre un rango de los voltajes (esto es, de 45 a 105 V). En la celda B9 se tiene una función de llamado del macro que referencia el valor adyacente de V (los 45 volts en A9).

Page 107: Chapra12-20

LIE. * J F > ' 1 M á x i m a t ransf•rancia de potencia

Rl 8 ' I f ' ' R2 12

1111111

l l l i i l í l i i im

R3 10 / Rmín 0.1

Rmáx 100 V Ra ^ PiRal

45 1 6 . 4 4 4 4 4 9 . 5 0 1 6 8 9 w 6 0 16.44444 16.89189 \ T I ' . 75 16.44444 26.39358 \

9 0 16.44444 38 .00676 \ 105 16.44444 51 .73142 \

L lama a la macrofunclón hecha en V i sua l BASIC

O r o ( $ B $ 6 , $ B $ 7 , $ B $ 3 , $ B $ 4 , $ B $ 5 , A 9 )

Cálculo de la potencia]

= ( A 9 * $ B $ 5 * B 9 / ( $ B $ 3 * { B 9 + $ B $ 4 + $ B $ 5 ) + $ B $ 5 * B 9 + $ B $ 3 * $ B $ 4 ) ) * 2 / B 9

F IGURA 1 6 . 1 2 I li >|u de cálculo de Excel para implementar un análisis de sensibilidad de la potencia máxima con variaciones de voltaje. I ski iijlina accesa el programa macro para la búsqueda de la sección dorada de la figura 16.1 1.

Además, se incluye también parámetros en la función argumento. Advierta que, mientras la referencia con Ves relativa, las referencias a los valores iniciales superior e inferior y las resistencias son absolutos (esto es, incluyendo el signo $). Esto se hizo de tal forma que cuando la fórmula se copie, las referencias absolutas queden fijas, mientras que la referencia relativa corresponde al voltaje en el mismo renglón. Una estrategia similar se usa para introducir la ecuación (16.11) en la celda C9.

Cuando se copian las fórmulas hacia abajo, el resultado es como el mostrado en la figura 16.12. La potencia máxima se puede trazar para visualizar el impacto de las variaciones de voltaje. En la figura 16.13 se observa que la potencia aumenta con el voltaje.

Los resultados para los valores correspondientes en el potenciómetro (Ra) son más interesantes. La hoja de cálculo indica que para un mismo valor, 16.44 £2, se tiene una

F I G U R A 1 6 . 1 3 Resultados del análisis de sensibilidad para el efecto de las variaciones de voltaje sobre la máxima potencia.

Page 108: Chapra12-20

438 APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN

potencia máxima. Tal resultado podría ser difícil de intuir basado en una inspección casual en la ecuación (16.11).

1 6 . 4 D I S E Ñ O D E U N A B ICICLETA D E M O N T A Ñ A ( I N G E N I E R Í A M E C Á N I C A / A E R O E S P A C I A l )

Antecedentes. Por su trabajo en la industria de la construcción, los ingenieros civiles son más comúnmente asociados con el diseño estructural. Sin embargo, otras especial i dades de la ingeniería deben tratar también con el impacto de fuerzas sobre los dispositivos que ellos diseñan. En particular, los ingenieros mecánicos y aeroespaciales deben cumplir tanto con la respuesta estática como con la dinámica en una amplia clase de vehículos que van desde automóviles hasta vehículos espaciales.

El interés reciente en bicicletas de competencia y recreativas ha significado que los ingenieros tengan que dirigir sus habilidades hacia el diseño y pruebas de bicicletas do montaña (véase figura 16.14a). Suponga que se le asigna la tarea de predecirlos desplazamientos horizontal y vertical de un sistema de frenos de una bicicleta como respucstn a una fuerza. Suponga que las fuerzas que usted debe analizar se pueden simplificar, como se ilustra en la figura 16.14&. A usted le interesa probar la respuesta de la mano cuando se ejerce una fuerza en cualquier número de direcciones designadas por el ángti lof t

Los parámetros para el problema son E = módulo de Young = 2 X 10 1 1 Pa, A área de sección transversal = 0.0001 m 2 , w — ancho = 0.44 m, l = longitud = 0.56 m, y h = altura = 0.5 m. Se puede resolver los desplazamientos e n * y y al determinar ION valores que den una energía potencial mínima. Determine los desplazamientos para uun fuerza de 10 000 N y un rango de los 8 desde 0°(horizontal) hasta 90° (vertical).

Solución. Este problema se puede plantear al desarrollar la siguiente ecuación para ln energía potencial del sistema de frenado.

V{x,y) = 1— J x2 + - ^ i - \ — )y2 - Fx eos 6-Fy sen 0 (16.1 ,'|

FIGURA 1 6 . 1 4 a) Una bicicleta de montaña junto con b) un diagrama de cuerpo libre para una patio <lnl marco.

Page 109: Chapra12-20

16.4 D I S E Ñ O D E U N A B IC ICLETA D E M O N T A Ñ A

Resolviendo para un ángulo en particular es tarea simple. Para 6 ~ 30°, se pueden sustituir en la ecuación (16.12) los valores de los parámetros dados y obtener

V(x,y) = 5 512 026x2 + 28 471 2 1 0 / - 5000JC - 8660v

El mínimo de esta función se puede determinar de diferentes formas. Por ejemplo, mediante el Solver de Excel, la energía potencial mínima es — 3.62 con deflexiones de x = 0.000786 y y = 0.0000878 m.

Por supuesto que se puede implementar el Solver de Excel en forma repetida para diferentes valores de 6 con el fin de verificar cómo se modifica la solución con el cambio de ángulo. En forma alterna, se puede escribir un macro en la misma forma que se hizo en la sección 16.3, de tal forma que se puedan implementar optimizaciones múltiples en forma simultánea. Queda claro que, para este caso, un algoritmo de búsqueda multidimensional debería implementarse. Una tercera forma de plantear el problema podría ser mediante el uso de un lenguaje de programación como Fortran 90, junto con un software de librerías para métodos numéricos tal como el IMSL.

En cualquiera de los casos, los resultados se muestran en la figura 16.15. Como se esperaba (véase figura 16.15a), la deflexión x es mucho más pronunciada cuando la carga está dirigida en la dirección x (6 — 0 o ) y la deflexión y tiene un máximo cuando la carga está dirigida en la dirección y (0 — 90°). Sin embargo, observe que la deflexión x es mucho más pronunciada que en la dirección y. Esto se manifiesta también en la figura 16.156, donde la energía potencial es mayor a bajos ángulos. Ambos resultados se deben a la geometría del marco de la bicicleta. Si w fuera mayor, las deflexiones podrían ser más uniformes.

o) El impacto de diferentes ángulos sobre las deflexiones (observe que Z e s la resultante de las componentes x y y| y b| energía potencial de una parte del marco de la bicicleta de montaña sujeta a una fuerza constante.

FIGURA 1 6 . 1 5

a) 0 . 0 0 1 0 r-

m 0.0005 -

0.0000 o 30 60 90 0

o I I I I I I I I I

Page 110: Chapra12-20

4 4 0 APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN

P R O B L E M A S

Ingeniería química/petrolera 16.1 Diseñe el contenedor cilindrico óptimo (véase figura P16.1) de tal forma que abra por un extremo y tenga paredes de espesor insignificante. El contenedor va a almacenar 0.2 m 3. Realice el diseño de tal forma que sean mínimos el área del fondo y sus lados. 16.2 Diseñe el contenedor cónico óptimo (véase figura P16.2) de tal forma que tenga una tapa y paredes de espesor insignificante. El contenedor va a almacenar 0.2 m 3. Realice el diseño de modo que tanto su tapa como sus lados sean minimizados. 16.3 Diseñe el tanque cilindrico óptimo con tapas semiesféricas (véase figura P16.3). El contenedor va a almacenar 0.2 m 3 y tiene paredes de espesor insignificante. Observe que el volumen de cada una de las tapas semiesféricas se puede calcular con

A=n(h2 + r2) V = —

a) Diseñe el tanque de tal forma que el área sea minimizada. Interprete el resultado.

b) Repita el inciso a), pero ahora agregue la restricción L > 2/i.

16.4 La razón de crecimiento específico de una fermentación que produce un antibiótico es una función de la concentración de comida c,

2c 8 ~~ 4 + 0.8c + c 2 + 0.2c3

F I G U R A P 1 6 . 1 Un contenedor cilindrico sin tapa.

Abierto

h

Tapa

F I G U R A P 1 6 . 2 Un contenedor cónico con tapa.

F I G U R A P l 6 . 3 Un contenedor cilindrico con tapas semiesféricas.

Como se ilustra en la figura Pl 6.4, el crecimiento parte de cero u muy bajas concentraciones debido a la limitación de la coinidn También parte de cero en altas concentraciones debido a los clbc tos de toxicidad. Encuentre el valor de c para el cual el cree i miento es un máximo. 16.5 Una planta química produce tres productos principales on una semana. Cada uno de estos productos requiere una cieiln cantidad de materia prima química de diferentes tiempos do producción, y se obtiene diferentes ganancias. La información pertinente se resume en la tabla siguiente:

Disponib i l idad Producto 2 Producto 3 do fuente*

Materia prima química 5 kg/kg 4 kg/kg lOkg/kg 3 000 k<] Tiempo de producción 0.05 hr/kg 0.1 hr/kg 0.2 hi/kg ,'),'> I I / M H I K I I U I

Nueva utilidad $30/kg $30kg $35/kcj"

Producto 1

Page 111: Chapra12-20

P R O B L E M A S 441

c (mg/L)

F IGURA P 1 6 . 4 !(i razón de crecimiento específico de una fermentación que nioduce un antibiótico contra la concentración de comida.

()bserve que hay suficiente espacio en bodega de la planta para almacenar un total de 450 kg/ a la semana. a) Establezca un problema de programación lineal para

maximizar las utilidades. />) Resuelva el problema de programación lineal con el méto

do simplex. c) Resuelva el problema con un paquete de software. </) Evalúe cuál de las siguientes opciones aumentará más las

utilidades: incrementar la materia prima química, el tiempo de producción o el almacenaje.

H>.<> Recientemente los ingenieros químicos se han involucrado on el área conocida como minimización de desechos. Esto comprende la operación de una planta química de un modo tal que los impactos sobre el ambiente sean minimizados. Suponga que IIIIII refinería desarrolla un producto, Zl, hecho de dos materias primas Xy Y. La producción de 1 tonelada métrica del producto involucra 1 tonelada de Xy 2.5 toneladas de Xy produce 1 tone-liula de un líquido de desecho, W. Los ingenieros tienen que en-l'rcntar esto con tres formas alternas para el manejo de los desechos:

• Producir una tonelada de un producto secundario, Z2, al agregar una tonelada adicional de X por cada tonelada de W.

• Producir una tonelada de otro producto secundario, Z3, al agregar 1 tonelada de Y por cada tonelada de W.

• Tratar los desechos de tal forma que su descarga sea permisible.

I os productos dan utilidades de $2 500, -$50 y $200/toneladas pin II Zl, Z2, y Z3, respectivamente. Observe que al producir Z2 NO obtiene de hecho una pérdida. El costo del proceso de tratamiento es do $3(>0/tonclada. Además, la compañía tiene acceso a un limite do 7 500 y 10 000 toneladusdo Xy Y durante el poriodo

de producción. Determine qué cantidad de productos y desechos se deben crear para maximizar las utilidades.

Ingeniería civil/ambiental 16.7 Un módulo de elemento finito de una viga en voladizo sujeta a carga y momentos (véase figura P16.7) se da para optimizarla.

f(x,y) = 5x2 -5xy +2.5y2 l.5y

donde x = desplazamiento en el extremo y y = momento en el extremo. Determine los valores de x y y que minimicen f(x, y). 16.8 Suponga que se le pide diseñar una columna para soportar una carga de compresión P, como se muestra en la figura P16.8a. La columna tiene una forma de sección transversal como la de un tubo de pared delgada, como la mostrada en la figura P16.86.

Las variables de diseño son el diámetro medio del tubo, d, y el espesor de la pared, t. El costo del tubo se calcula con

Costo = / ( / , d) = cxW + c2d

F IGURA P l 6 .8 a) Una columna que soporta una carga de compresión P. b) la columna tiene la forma de una sección transversal como la de un tubo de pared delgada.

a)

Page 112: Chapra12-20

442 APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN

donde c, -= 4 y c 2 = 2 son factores de costo y W — peso del tubo, W ndlllp donde p = densidad del material del tubo = 0.0025 kg/cm 3 . La columna debe soportar la carga bajo esfuerzo de compresión y no pandearse. Por lo tanto,

Esfuerzo real (o) < esfuerzo máximo de compresión

= 03, = 550 kg/cm 2

Esfuerzo real < esfuerzo de pandeo

El esfuerzo real está dado por

_ P _ P A jrdt Se puede demostrar que el esfuerzo de pandeo es

JiEI H2dt donde E = módulo de elasticidad e / = segundo momento de

área de la sección transversal. Se puede usar el cálculo para demostrar que

l = \dt[d> + ?) Finalmente, los diámetros disponibles para los tubos están entre di y d2 y el espesor entre í, y t2. Desarrolle y resuelva este problema al determinar los valores áedyt que minimizan el costo. Observe que H = 275 cm, P = 2 000 kg, E = 900 000 kg/cm 2, d{= 1 cm, d2 = 10 cm, tl = 0.1 cm y t2 — 1 cm. 16.9 Se puede usar el modelo de Streeter-Phelps para calcular la concentración de oxígeno disuelto en un río por debajo de un punto de descarga de desechos (véase figura P16.9),

k d L ° (,,-*«' _ _ (i

ka • os kd + ks

(P16.9)

FIGURA P 1 6 . 9 Oxígeno dísuelto "a la deriva" por debajo del punto de descarga de desechos en un río.

donde o = concentración de oxígeno disimilo |nig/L, <>x con centración saturada de oxigeno [mg/L], / = tiempo do Inivi'Nhi [d], L0 = concentración BOD en el punto de mezclado |niu/l |, kd = razón de descomposición de la demanda de oxigeno bioquímico (BOD, por sus iniciales en inglés) [d 1 1, kx iii/ón de asentamiento de (BOD) [d _ 1 ] , ka = razón de reatiaeión |il 11 y Sb = demanda de oxígeno sedimentado [mg/L/dj.

Como se indica en la figura P16.9, la ecuación (l>Id.") pin duce un oxigeno "disuelto" que alcanza un nivel mínimo cillli n, oc, en algún tiempo de travesía, tc, debajo del punto de desairan Este punto es llamado "crítico", ya que representa la uhiciuií'in para flora y fauna que dependen del oxígeno, como el pe/., i|iits sería la más esforzada. Determine el tiempo de travesía crilii-u y la concentración dados los siguientes valores:

os = 10 mg/L

ks = 0 . 0 5 d~'

kd = 0.1 d" 1 L0 = 50 mg/L

ka = O.d (I 1

Sh = 1 mp/l. / . l

16.10 La distribución bidimensional de la concentración de mn taminantes en un canal se puede describir con

c(x, y) = 7.9 + 0.13.t + 0.21y - 0.05x 2

- 0 . 0 1 6 y 2 - 0.007x>'

Determine la localización exacta de la concentración pico dinln la función y con el conocimiento de que el pico cae dentro do lun fronteras - 1 0 < x < 10 y 0 <y < 20. 16.11 El flujo Q [m 3/s] en un canal abierto se puede predecir con la ecuación de Manning (recuerde la sección 8.2)

Q = -ACR2'3S1'2 n donde n = coeficiente de rugosidad de Manning (un n ú m e r o N I I I

dimensiones usado para parametrizar la fricción del c a n a l ) ; A,, = área de sección transversal del canal (m 2 ); S = pcndienlo ilol

canal (sin dimensiones, metros de caída por metro de longitud), y R = radio hidráulico (m), el cual se relaciona para m á s purA < metros fundamentales por

Ac R = — P

donde P = perímetro mojado (m). Como su nombre lo i n d i c n , c |

perímetro mojado es la longitud de los lados del canal y l 'ondo

que están por debajo del agua. Por ejemplo, para un c a n a l i w

tangular, esto se define como

P = B +2H

donde H = profundidad (m). Suponga que u s t e d se cnaipnlrtt usando esta fórmula para d i s e ñ a r un c a n a l lineal ( o b s e r v e

l o s granjeros a l i n e a n los canales p i n a minimizar l a s pérdidiiN por goteo).

Page 113: Chapra12-20

PROBLEMAS 443

u) Dados los parámetros // - 0.0.15, .V = 0.003 y Q = I nvVs, determine los valores de H y II que minimizan el perímetro mojado. Advierta que un cálculo como éste podría minimizar el costo si los costos de alineación fueran mucho mayores que los de excavación.

b) Repita el inciso anterior, pero esta vez incluya el costo de excavación. Para realizar esto minimice la siguiente función de costos,

C = ClA + c2P

donde cx es un factor de costo por excavación = 100 $/m 2 y c 2 es un factor de costo por alineación $50/m.

c) Analice las implicaciones de sus resultados.

Ingeniería eléctrica 1 6 . 1 2 Un modelo para un solenoide se puede expresar como

L = 7a2N/b S + 6(a/b) + W(c/b)

donde L = inductancia, N = número de vueltas ya,byc describen la geometría como la mostrada en la figura P16.12.

Se quiere maximizar L para una longitud dada del alambre ( con un área de sección transversal ^ . S i € = 2 m y ^ = 1 0 ~ 6 m 2 , entonces se requiere que

2nNA = 2 y Por tanto,

bc_ 77

N 1 \Q'6N

Encuentre a y b que maximice L. 16.13 Un circuito eléctrico se diseña para usar una fuente de 40 volts para cargar baterías conectadas en paralelo de 15 V, 6 V y

40 V

F IGURA P l 6 . 1 3 Un circuito eléctrico en paralelo para cargar tres baterías.

25 V Encuentre las corrientes que maximizan la potencia transferida a las baterías.

Este problema se puede formular como el siguiente problema de programación lineal:

Maximizar P = 15/ 2 + 6 / 4 + 2 5 / 5

sujeto a:

h = h + h ¡\ < 5 ¡ 2 < 4 h < 3 U S 2

I\,h, h, h, Is > 0

16 .14 El circuito mostrado en la figura P16.14 consiste de cinco resistores y sus respectivas corrientes.

Encuentre las resistencias de modo que la potencia total disipada por el circuito sea un mínimo. Suponga que cada corriente puede variar entre los límites superior e inferior,

F I G U R A P 1 6 . 1 2 Las dimensiones de un solenoide.

;,min i — i.max

F IGURA P 1 6 . 1 4 Un circuito eléctrico.

Page 114: Chapra12-20

4 4 4 APLICACIONES EN LA INGENIERÍA: OPTIMIZACIÓN

y que la caída de voltaje a través de cada resistor sea constante; es decir,

V¡ = RJi = constante,

Formule este caso como un problema de optimización restringida. 16.15 Un sistema consiste en dos plantas de potencia que deben entregar cargas sobre una red de transmisión. El costo de generación de potencia en las plantas 1 y 2 están dadas por

Fi = 2px + 2 F2 = 10p 2

donde px y p2 = potencia producida por cada planta. Las pérdidas de potencia debido a la transmisión, L, están dadas por

Li =0.2pi + 0 . 1 p 2

L 2 =0 .2p , + 0 . 5 p 2

La demanda total de potencia es 30. Determine la generación de potencia requerida para cumplir con las demandas, mientras se minimizan las costos usando una rutina de optimización como las que se encuentran en Excel, Mathcad, IMSL, etcétera. 16.16 El par transmitido a un motor de inducción es una función de la desviación entre la rotación del campo del estator y la velocidad del rotor, donde la desviación se define como

n-riR s =

n

donde n = revoluciones por segundo de la velocidad de rotación del estándar y nR — velocidad del rotor. Se puede usar las leyes de Kirchhoff para demostrar que el par (expresado en forma adimensional) y la desviación están relacionadas por

r _ 1 5 J ( 1 - J ) (1 - Í ) ( 4 Í 2 - 3 Í +4)

La figura P16.16 muestra esta función. Use un método numérico para determinar la desviación a la cual ocurre el máximo par.

Ingeniería mecánica/aeroespacial 16.17 El arrastre total sobre un alerón se puede estimar por

fricción empuje

donde D = arrastre, a = razón de la densidad del aire entre la altitud de vuelo y el nivel del mar, W = peso y V = velocidad. Como se observa en la figura P16.17, los dos factores que contribuyen al arrastre son afectados en forma diferente cuando la velocidad aumenta. Mientras que el arrastre por fricción aumenta con la velocidad, el arrastre por empuje disminuye. La combinación de estos dos factores llevan a un arrastre mínimo, a) Si o = 0.5 y W = 15 000, determine el arrastre mínimo y la velocidad a la cual esto ocurre, b) Además, desarrolle un análisis de sensibilidad para determinar cómo varía este óptimo en respuesta a un rango que va de W = 12 000 a 18 000 con a = 0.5. 16.18 Cuatro resortes helicoidales se pueden usar para soportar un vagón de tren que transporta bicicletas de montaña a Denver. Se desea encontrar el diámetro de alambre (d), el diámetro de la espiral (D) y el número de vueltas (Af) que minimice el peso del resorte y limite la deflexión a 0.15 pulgadas, el esfuerzo constante para 9 000 psi, y se requiere que el esfuerzo cortante sea mayor de 120. Este problema se puede formular como el siguiente problema de optimización:

Minimizar^ , D, N) = -^-{nDNp) 4

sujeto a

8FD3/V Deflexión = < 0.15

F I G U R A P 1 6 . 1 6 Par transmitido a un inductor como una función de F IGURA P 1 6 . 1 7 deslizamiento. Gráfico de arrastre contra velocidad para un alerón.

T

4

3

D 20 000

Page 115: Chapra12-20

443

K/'7> Esfuerzo cortante = K<—».- < 9000

nd' •JGg d

Frecuencia natural = -—;==— _... _ > 120 Ijljin D2N d, D, N > 0

Si los valores dados para la carga y los parámetros del material se sustituyen, obtenemos

Minimizar F(d, D, N) = QJd2DN

sujeto a

d4

110—r— > 1

d3

3 D > 1

F IGURA P 1 6 . 1 9 Rodamientos de rodillo.

135- > 1 D2N

d, D,N > 0

Resuelva para d,DyN. 16.19Los rodamientos de rodillo están sujetos a fallas por fatiga

causadas por grandes cargas por contacto F (véase figura P16.19). El problema para encontrar la localización del máximo esfuerzo a lo largo del eje x se puede demostrar que es equivalente a maximizar la función

f(x) = 0.4 0.4

1 +x2 + x

Encuentre la x que maximiza/(se).

16.20 Una compañía aeroespacial está desarrollando un nuevo aditivo de combustible para aerolíneas comerciales. El aditivo se compone de tres ingredientes: X, Yy Z. Para un comportamiento máximo, la cantidad total de aditivo debe ser de al menos 6 mL/ L de combustible. Por razones de seguridad, el total de los altamente flamables ingredientes Xy Y no debe exceder de 3 mL/L. Además, la cantidad del ingrediente .Ydebe ser siempre igual o mayor que el Y, y el Z debe ser mayor que la mitad del Y. Si el costo por mililitro de los ingredientes X, Y y Z es 0.15, 0.025 y 0.05, respectivamente, determine el costo mínimo de la mezcla por cada litro de combustible.

Page 116: Chapra12-20

E P Í L O G O : P A R T E C U A T R O

Los epílogos de las otras partes de este libro contienen un análisis y un resumen tabular de los elementos de juicio entre los métodos, así como fórmulas importantes y relaciones. La mayoría de los métodos de esta parte son muy complicados y, en consecuencia, no se pueden resumir con simples fórmulas y resúmenes tabulares. Por tanto, aquí nos desviaremos un poco para proporcionar el siguiente análisis narrativo de los elementos de juicio y referencias adicionales.

P T 4 . 4 E L E M E N T O S D E J U I C I O

El capítulo 13 trató acerca de la búsqueda del óptimo para una función no restringida de una sola variable. El método de búsqueda de la sección dorada es un método cerrado que requiere de un intervalo que contenga un solo óptimo conocido. Tiene la ventaja de minimizar las evaluaciones de la función, y siempre converge. La interpolación cuadrática también trabaja mejor cuando se implementa como un método de intervalo, aunque se puede también programar como un método abierto. Sin embargo, en tales casos, puede divergir. Tanto el método de búsqueda de la sección dorada como el de interpolación cuadrática no requieren evaluaciones de la derivada. Así, ambos son apropiados cuando el intervalo puede definirse fácilmente y las evaluaciones de la función son costosas.

El método de Newton es un método abierto que no requiere que un óptimo sea acotado. Se puede implementar en una representación de forma cerrada cuando la primera y segunda derivadas pueden ser determinadas en forma analítica. Es posible imple-mentar también en una forma similar al método de la secante con representaciones por diferencias finitas de las derivadas. Aunque el método de Newton converge fácilmente cerca del óptimo, con frecuencia diverge para valores iniciales pobres. La convergencia depende también de la naturaleza de la función.

En el capítulo 14 se trató dos tipos generales de métodos para resolver problemas do optimización no restringidos de muchas dimensiones. Los métodos directos como el do búsqueda aleatoria y el univariable no requieren las evaluaciones de las derivadas de la función y con frecuencia son ineficientes. Sin embargo, proveen también una herramienta para encontrar el óptimo global más que el local. Métodos de búsqueda patrón como el de Powell pueden ser muy eficientes y tampoco requieren la evaluación de la derivada.

Los métodos gradiente usan la primera y algunas veces la segunda derivada puní encontrar el óptimo. El método de pasos ascendente/descendente proporciona un procedimiento confiable pero en ocasiones lento. En contraste, el método de Newton a moñudo converge con rapidez cuando se está en la vecindad de una raíz, pero algunas vecen sufre divergencia. El método de Marquardt usa el método de pasos descendente en In ubicación de inicio, muy lejos del óptimo, y después cambia al método de Newton coren del óptimo, en un intento por tomar las fortalezas de cada método.

El método de Newton puede ser costoso en el contexto computacional, ya que re quiere cálculos tanto del vector gradiente como de la matriz Hessian. El procedimiento de cuaii-Newton Intenta evitar eitos problemai al mar anroxim»cinn«« u n rmA,mU >I

Page 117: Chapra12-20

PT4.5 REFERENCIAS ADICIONALES 447

número de evaluaciones de la matriz (en forma particular la evaluación, almacenamiento e inversión del Hessian).

En la actualidad, las investigaciones continúan para explorar las características y ventajas correspondientes de varios híbridos y métodos en serie. Algunos ejemplos son el método del gradiente conjugado de Fletcher-Reeves y los métodos cuasi-Newton de Davidon-Fletcher-Powell.

El capítulo 15 se dedicó a la optimización restringida. Para problemas lineales, la programación lineal basada en el método simplex proporciona un medio eficiente para obtener soluciones. Procedimientos tales como el método GRG están disponibles para resolver problemas restringidos no lineales.

Los paquetes de software y librerías incluyen una amplia variedad de capacidades de optimización. El más genérico es la librería IMSL, la cual contiene muchas subrutinas para implementar la mayoría de los algoritmos de optimización estándar. No hace mucho Excel tenía las capacidades de optimización más útiles en la forma de herramienta Solver. Debido a que esta herramienta está diseñada para implementar la forma más general de optimización (la optimización restringida no lineal), esto puede ser usado para resolver problemas en todas las áreas que se cubrieron en esta parte del libro.

P T 4 . 5 R E F E R E N C I A S A D I C I O N A L E S

Para problemas en una dimensión, el método de Brent es un híbrido que intenta tomar en cuenta la naturaleza de la función para asegurar una convergencia lenta y uniforme para valores iniciales pobres y una rápida convergencia cerca del óptimo. Véase Press y cois. (1992) para detalles. Para problemas en varias dimensiones, se puede encontrar información adicional en Fletcher (1980,1981), Gilí y cois. (1981), Dermis y Schnabel (1996) y en Luenberger (1984).

Page 118: Chapra12-20

A J U S T E DE C U R V A S

P T 5 . 1 M O T I V A C I Ó N

Los datos a menudo son dados para valores discretos a lo largo de un continuo. Sin embargo, usted puede requerir una estimación en puntos entre los valores discretos. Esta parte del libro describe técnicas para el ajuste de curvas de tales datos para obtener estimaciones intermedias. Además, usted puede requerir una versión simplificada de una función en un número de valores discretos a lo largo del rango de interés. Después, se puede derivar una función más simple para ajustar esos valores. Estas dos aplicaciones se conocen como ajuste de curvas.

Existen dos procedimientos generales para el ajuste de curvas que se distinguen uno del otro con base en el grado de error asociado con los datos. Primero, donde los datos exhiban un grado significativo de error o "ruido", la estrategia será derivar una sola curva que represente la tendencia general de los datos. Debido a que cualquier dato individual puede ser incorrecto, no se necesita interceptar cada punto. En lugar de esto, se designa la curva para seguir un patrón de los puntos tomados como un grupo. Un procedimiento de esta naturaleza es llamado regresión por mínimos cuadrados (véase figura PT5.la).

Segundo, donde se conoce que los datos son muy precisos, el procedimiento básico será ajustar a una curva o a una serie de curvas que pasen directamente a través de cada uno de los puntos. Usualmente tales datos se originan de tablas. Como ejemplos se tienen los valores de la densidad del agua o la capacidad calorífica de los gases en función de la temperatura. La estimación de valores entre puntos discretos bien conocidos es llamada interpolación (véase figura PT5.1& y PT5.1 c).

P T 5 . 1 . 1 Métodos s in computadora para el ajuste de curvas

El método más simple para ajustar a una curva los datos es ubicar los puntos y después dibujar una línea que visualmente conforma a los datos. Aunque ésta es una operación válida cuando se requiere una estimación rápida, los resultados son dependientes del punto de vista subjetivo de la persona que dibuja la curva.

Por ejemplo, en la figura PT5.1 son mostrados trazos desarrollados a partir del mismo conjunto de datos por tres ingenieros. El primero no intentó conectar los puntos; en vez de ello, caracterizó la tendencia general hacia arriba de los datos con una línea recta (véase figura PT5.1 a). El segundo ingeniero usó segmentos de línea recta o interpolación lineal para conectar los puntos (véase figura PT5.16). Ésta es una práctica común en la ingeniería. Si los valores están verdaderamente cercanos a ser lineales o cercanamente espaciados, tal aproximación provee estimaciones que son adecuadas en muchos cálculos de la ingeniería. Sin embargo, donde la relación resaltada es altamente curvilínea o los datos están espaciados en forma muy amplia, se puede introducir errores por esa interpolación lineal. El tercer ingeniero usa curvas para tratar de capturar el serpenteado sugerido por los datos (véase figura PT5.1c). Un cuarto o quinto ingeniero podría, de

Page 119: Chapra12-20

4 5 0 AJUSTE DE CURVAS

F I G U R A P T 5 . 1 Tres intentos para ajustar a la "mejor" curva con cinco puntos, a) Regresión por mínimos cuadrados, b) interpolación lineal, y c) interpolación curvilínea.

igual forma, desarrollar ajustes alternativos. Es obvio que nuestra meta aquí es desarrollar métodos sistemáticos y objetivos con el propósito de obtener tales curvas.

P T 5 . 1 . 2 Ajuste de curvas y práctica de la ingeniería

Su primera situación en el ajuste de curvas podría haber sido determinar valores intermedios a partir de datos tabulados (por ejemplo, de tablas de interés para ingeniería económica, o a partir de tablas de vapor para termodinámica). En lo que resta de su carrera, usted tendrá frecuentes oportunidades para estimar valores intermedios de dichas tablas.

Aunque muchas de las amplias propiedades usadas en la ingeniería han sido tabulu-das, hay muchas más que no están disponibles en esta forma conveniente. Casos especiales y contextos de problemas nuevos a menudo requieren que usted recolecte sui propioi

Page 120: Chapra12-20

PT5.Z A N T E C E D E N T E S M A T E A A A T I C 0 5 491 datos y desarrolle sus propias relaciones predictivas. Se han encontrado dos tipos generales de aplicaciones cuando se ajustan datos experimentales: análisis de tendencia y pruebas de hipótesis.

Los análisis de tendencia representan el proceso de usar el patrón de los datos para realizar predicciones. Para casos donde se miden los datos con alta precisión, usted podría utilizar interpolación de polinomios. Con frecuencia, datos imprecisos son analizados con regresión por mínimos cuadrados.

Los análisis de tendencia se pueden usar para predecir o pronosticar valores de la variable dependiente. Esto puede involucrar una extrapolación más allá de los límites de los datos observados o una interpolación dentro del rango de los datos. Todos los campos de la ingeniería comúnmente involucran problemas de este tipo.

Una segunda aplicación de la ingeniería en el ajuste de curvas de experimentos es la prueba de hipótesis. Aquí, un modelo matemático existente se compara con los datos medidos. Si se desconocen los coeficientes del modelo, podría ser necesario determinar los valores que mejor ajusten a los datos observados. Por otro lado, si ya se dispone de la estimación de los coeficientes del modelo convendría comparar los valores predichos del modelo con los observados para probar qué tan adecuado es el modelo. Con frecuencia, los modelos alternativos son comparados y "el mejor" es seleccionado con base en observaciones empíricas.

Además de las mencionadas aplicaciones en la ingeniería, el ajuste de curvas es importante en otros métodos numéricos, tales como en integración y la solución aproximada de ecuaciones diferenciales. Por último, las técnicas de ajuste de curvas se pueden usar para derivar funciones simples con el fin de aproximar funciones complicadas.

P T 5 . 2 A N T E C E D E N T E S M A T E M Á T I C O S

Los antecedentes matemáticos como prerrequisito para interpolación se encuentran en el material sobre las expansiones de la serie de Taylor y las finitas divididas que se introdujeron en el capítulo 4. La regresión por mínimos cuadrados requiere de información adicional del campo de la estadística. Si usted conoce los conceptos de la media, desviación estándar, suma residual de los cuadrados, distribución normal e intervalos de confianza, puede omitir el estudio de las siguientes páginas y pasar directamente a la sección PT5.3. Si no recuerda muy bien estos conceptos o necesita de un repaso, el estudio del siguiente material le servirá como una breve introducción a estos temas.

P T 5 . 2 . 1 Estadística simple

Suponga que en el curso de un estudio de ingeniería se realizaron varias mediciones de una cantidad en particular. Por ejemplo, la tabla PT5.1 contiene 24 lecturas del coeficiente de expansión térmica de un acero estructural. Tomados como genuinos, los datos proporcionan una cantidad limitada de información (es decir, que los valores van de un rango mínimo de 6.395 a un máximo de 6.775). Se puede obtener un conocimiento adicional al resumir los datos en una o más funciones estadísticas bien seleccionadas que tengan tanta información como sea posible acerca de características específicas del conjunto de datos. Esas estadísticas descriptivas son seleccionadas con más frecuencia para

Page 121: Chapra12-20

452 AJUSTE DE CURVAS

TABLA P T 5 . 1 Mediciones del coeficiente de expansión térmico para acero estructural

6.495 6.595 6.615 6.635 6.485 6.555 6.665 6.505 6.435 6.625 6.715 6.655 6.755 6.625 6.715 6.575 6.655 6.605 6.565 6.515 6.555 6.395 6.775 6.685

representar 1) la posición del centro de la distribución de los datos y 2) el grado de aproximación de los datos fijos.

La localización estadística más común es la media aritmética. La media aritmética (y) de una muestra se define como la suma de los datos individuales (y¡) dividida entre el número de puntos («), o

y = A - (PT5.1)

donde la sumatoria (y todas las sumatorias que siguen en esta introducción) va de i = 1 a n.

La medida más común de espaciamiento para una muestra alrededor de la media es la desviación estándar (s ),

h - g ¿ ( P T , 2 )

donde S, es la suma total de los cuadrados de los residuos entre los datos y la media, o

S, = S {y,- - y? (PT5.3)

Así, si las mediciones individuales están muy espaciadas alrededor de la media, St (y, en consecuencia, Sy) será grande. Si están agrupadas cerca de ella, la desviación estándar será pequeña. El espaciamiento también se puede representar por el cuadrado de la desviación estándar, al cual se le llama la varianza:

(PT5.4)

Observe que el denominador en ambas ecuaciones (PT5.2) y (PT5.4) es n — 1. La cantidad n — 1 está referida como los grados de libertad. Por tanto, S, y sy se dice que se hallan basadas en n — 1 grados de libertad. Esta nomenclatura se deriva del hecho de que la suma de las cantidades sobre las cuales St se basa (es decir, y — y{, y — y2,..., y — yn) es cero. En consecuencia, si y es conocida y se especifican los valores de n — 1, el valor restante es fijo. Así, sólo n — 1 de los valores se dice que están libremente determinados. Otra justificación para dividir entre n — 1 es el hecho de que no existe como In dispersión de un solo punto. Para el caso donde n = 1, las ecuaciones (PT5.2) y (PT5.4) dan un multado lin sentido al infinito.

Page 122: Chapra12-20

I-IJJ.Ü ArNrctCDCNTC5 M A T E M Á T I C O S 4 1 »

Se debería observar que hay una fórmula alterna más conveniente para calcular ln desviación estándar.

2 _ £j¿ - (X^)2/«

Esta versión no requiere el cálculo previo de y y se obtiene un resultado idéntico al de la ecuación (PT5.4).

Una estadística final que tiene utilidad en cuantificar la dispersión de datos es el coeficiente de variación (av.). Tal estadística es la razón de la desviación estándar a la media. Como tal, proporciona una medición normalizada de la dispersión. Con frecuencia se multiplica por 100 para que se pueda expresar en la forma de porcentaje:

c.v. = ^ 100% (PT5.5) y

Observe que el coeficiente de variación es similar, en esencia, al error relativo porcentual (e () analizado en la sección 3.3. Es decir, es la razón del error de medición ( Í ) a un estimado del valor real (y).

EJEMPLO PT5.1 Estadística simple para una muestra

Enunciado del problema. Calcule la media, varianza, desviación estándar y coeficiente de variación para los datos de la tabla PT5.1.

Solución. Los datos son sumados (tabla PT5.2) y los resultados se usan para calcular [ecuación (PT5.1)]

- 1 5 8 4

y = 6.6 24

Como se observa en la tabla PT5.2, la suma de los cuadrados de los residuos es 0.217000, los cuales se pueden usar para calcular la desviación estándar [ecuación (PT5.2)]:

0.217000 „ „„ =0.097133

2 4 - 1

la varianza [ecuación (PT5.4)]:

= 0.009435

y el coeficiente de variación [ecuación (PT5.5)]:

0.097133 c.v. = — 1 0 0 % = 1.47%

6.6

Page 123: Chapra12-20

AJUSTE DE CURVAS

TABLA P T 5 . 2 Cálculos estadísticos de las lecturas del coeficiente de expansión térmico. Las frecuencias y límites son desarrolladas para construir el histograma que se muestra en la figura PT5.2.

In te rva lo

i ~. L ími te L imi te

i Yi (y,-yf Frecuencia in fe r io r super io r

1 6.395 0.042025 1 6.36 6.40 2 6.435 0.027225 1 6.40 6.44 3 6.485 0.013225 ' 4 6.495 0.01 1025 5 6.505 0.009025 4 6.48 6.52 6 6.515 0.007225 . 7 6.555 0.002025 " 2 6.52 6.56 8 6.555 0.002025 9 6.565 0.001225 '

10 6.575 0.000625 • 3 6.56 6.60 11 6.595 0.000025 12 6.605 0.000025 " 13 6.615 0.000225 14 6.625 0.000625 5 6.60 6.64 15 6.625 0.000625 . 16 6.635 0.001225' 17 6.655 0.003025 18 6.655 0.003025 3 6.64 6.68 19 6.665 0.004225. 20 6.685 0.007225 1

21 6.715 0.013225 > 3 6.68 6.72 22 6.715 0.013225 1 23 6.755 0.024025 ' 1 6.72 6.76 24 6.775 0.030625 1 6.76 6.80

I 158.4 0.217000

P T 5 . 2 . 2 La distr ibución normal

Otra característica que soporta el presente análisis es la distribución de datos (es decir, la forma con la cual se distribuyen los datos alrededor de la media). Un histograma proporciona una representación visual simple de la distribución. Como se observa en la tabla PT5.2, se construye el histograma al ordenar las mediciones en intervalos. Las unidades de medición se grafican en la abscisa y la frecuencia de ocurrencia de cada intervalo en la ordenada. Así, cinco de las mediciones se encuentran entre 6.60 y 6.64. Como se ve en la figura PT5.2, el histograma indica que la mayoría de los datos se agrupan cerca del valor de la media de 6.6.

Si se tiene un conjunto de datos muy grande, el histograma a menudo se puede aproximar a una curva suave. La curva simétrica, en forma de campana que se sobrepone como en la figura PT5.2, es una característica de forma (la distribución normal). Dadas suficientes mediciones adicionales, el histograma para este caso en purticulur se aproximará eventualmente a la distribución normal.

Page 124: Chapra12-20

PT5.Z ANTECEDENTES MATEMÁTICOS 481

F I G U R A P T 5 . 2 Se usa un histograma para ¡lustrar la distribución de datos. En tanto el número de puntos aumente, el histograma se podría aproximar a una curva suave en forma de campana, llamada distribución normal.

Los conceptos de la media, desviación estándar, suma de cuadrados de los residuos y distribución normal tienen una alta relevancia en la práctica de la ingeniería. Un ejemplo muy simple es su uso para cuantificar la confianza que se puede adscribir a una medición en particular. Si una cantidad está normalmente distribuida, el rango definido por y — sy a y + sy abarcará en forma aproximada el 68% de las mediciones totales. En forma similar, el rango definido por y — 2sy a y + 2sy abarcará alrededor del 95%.

Por ejemplo, para los datos de la tabla PT5.1 (y — 6.6 y sv = 0.097133), se puede afirmar que aproximadamente el 95% de las lecturas deberían estar entre 6.405734 y 6.794266. Si alguien nos dijera que tomó un valor de lectura de 7.35, entonces se podría sospechar que las mediciones fueron erróneas. En la siguiente sección se trabaja sobre tales evaluaciones.

P T 5 . 2 . 3 Estimación de los intervalos de confianza

Como quedó claro de la sección anterior, una de las principales metas de la estadística es estimar las propiedades de una población basada en una muestra limitada tomada de esa población. Es evidente que es imposible medir el coeficiente de expansión térmica para cada pieza de acero estructural que no se haya producido. En consecuencia, como se muestra en las tablas PT5.1 y PT5.2, se puede realizar un número de mediciones en forma aleatoria y, con base en la muestra, intentar caracterizar las propiedades de lodu población.

Page 125: Chapra12-20

AJUSTE DE CURVAS

Ya que se "infieren" propiedades de la población desconocida de una muestra limitada, el intento es llamado inferencia estadística. Ya que los resultados son a menudo reportados como estimaciones de los parámetros de población, el proceso es también referido como estimación.

Se ha demostrado cómo estimar la tendencia central (media de la muestra, y) y la dispersión (desviación estándar de la muestra y varianza) de una muestra limitada. Ahora, se describirá en forma breve cómo se pueden conjuntar los enunciados probabilísticos con la calidad de esas estimaciones. En particular, se analizará cómo se puede definir un intervalo de confianza alrededor de un estimado de la media. Se ha escogido este tópico en particular debido a su relevancia directa en los modelos de regresión que se describirán en el capítulo 17.

Observe en el siguiente análisis que la nomenclatura y y sy se refieren a la media de la muestra y su desviación estándar. La nomenclatura ¡j. y a se refieren a la media y desviación estándar de la población. Las primeras son algunas veces referidas como la media y desviación estándar "estimada", mientras que las últimas son llamadas algunas veces la media y desviación estándar "real".

Un estimador de intervalo proporciona el rango de valores dentro de los cuales el parámetro se espera que esté con una probabilidad dada. Tales intervalos se describen como si fueran de un lado o de dos lados. Como su nombre lo implica, un intervalo de un lado expresa nuestra confianza en que el parámetro estimado sea menor que o mayor que el valor real. En contraste, el intervalo de dos lados tiene que ver con una proposición más general en la que la estimación concuerda con la verdad, sin considerar el signo de la discrepancia. Como éste es más general, nos concentraremos en el intervalo de dos lados.

Un intervalo de dos lados puede ser descrito por la relación

P{L<ii<U} = \ - a

que puede leerse como, "la probabilidad que la media real de y, ¡u esté dentro del límite de L a U es 1 — a". La cantidad a es conocida como el nivel de significancia. De esta forma, el problema para definir un intervalo de confianza se reduce a estimar L y U. Aunque no es absolutamente necesario, es costumbre observar el intervalo de dos lados con la probabilidad a distribuida de manera uniforme como a/2 en cada cola de la distribución, como se muestra en la figura PT5.3.

Si la varianza real de la distribución de y, a2 es conocida (lo cual no es el caso usual), la teoría de la estadística establece que la media de la muestra y se obtiene de una distribución normal con una media n y varianza o2ln (véase cuadro PT5.1). En el caso ilustrado en la figura PT5.3, no se conoce realmente fl. Por tanto, no se sabe dónde se ubica con exactitud la curva normal con respecto a y. Para evitar este dilema, se calcula una nueva cantidad, la estimación de la normal estándar.

z = y-^L (PT5.6)

la cual representa la distancia normalizada entreyy /x. De acuerdo con la teoría estadística, esta cantidad debería estar distribuida normalmente con una media de 0 y unu variuii/,» do a2/n. Además, la probabilidad de que z esté dentro de la región no sombread* de la fiauraPT5.3dBb«ria««ri — n D n - - i — — J - J J •-•

Page 126: Chapra12-20

PT5.2 ANTECEDENTES MATEMÁTICOS

F I G U R A P T 5 . 3 Un intervalo de confianza de dos lados. La escala en la abscisa en a) se escribe en las unidades naturales de la variable aleatoria /. b] es una versión normalizada de la abscisa que toma el origen en la ubicación de la media y escala el eje de manera que la desviación estándar corresponda a un valor unitario.

— — < —Za/2 O , > Z a / 2

con una probabilidad de a. La cantidad z^ es una variable aleatoria normal estándar. Ésta es la distancia medi

da a lo largo del eje normalizado arriba y debajo de la media que cubre la probabilidad 1 — a (véase la figura PT5.36). Los valores de z^ están tabulados en libros de estadística (por ejemplo, Milton y Arnold, 1995). Ellos también pueden ser calculados mediante funciones en paquetes de software y librerías como Excel e IMSL. Como un ejemplo, para a = 0.05 (en otras palabras, definiendo un intervalo que cubre el 95%), za/2 es igual a casi 1.96. Esto significa que un intervalo alrededor de la media con ancho + 1.96 veces la desviación estándar abarcará en forma aproximada el 95% de la distribución.

Esos resultados se pueden reordenar para obtener

L < ix < U

con una probabilidad de 1 — a, donde

L = y - -^za/2 U = y + - ^ z o / 2 (PT5.7)

Ahora, aunque lo anterior proporciona un estimado de L y U, está basado en un conocimiento de la varianza real o. Para nuestro caso, conocemos solamente la varianza

Page 127: Chapra12-20

458 AJUSTE DE CURVAS

C u a d r o P T 5 . 1 Un poco de estadística

La mayoría de los ingenieros han tomado varios cursos para ser competentes en estadística. Como usted tal vez aún no ha tomado ninguno se mencionará algunas ideas con las cuales esta sección se haría más coherente.

Como se ha mencionado, el "juego" de estadística inferencial supone que la variable aleatoria que usted muestrea, y, tiene una media real (n) y varianza (a2). Además, en este análisis se supondrá que tiene una distribución particular: la distribución normal. La varianza de esta distribución normal tiene un valor infinito que especifica la "dispersión" de la distribución normal. Si la varianza es grande, la distribución es ancha. En forma opuesta, si la varianza es pequeña, la distribución es angosta. Así, la varianza real cuantifica la incertidumbre intrínseca de la variable aleatoria.

En el juego de la estadística, se toma un número limitado de mediciones de esta cantidad llamada muestra. De esta muestra, se puede calcular una media estimada (y) y la varianza (s2). Cuantas más mediciones se tomen, mejor serán las estimaciones para que se aproximen a los valores reales. Esto es, como n -> °°,y^>fiys2->o2.

Suponga que se toman n muestras y se calcula una media estimaday¡. Después se toman otras n muestras y se calcula otra, y2. Se puede repetir este proceso hasta que se haya generado una muestra de medias: yx, y2, y-¡,. •., y m, donde m es grande. Se puede entonces desarrollar un histograma de estas medias y determinar una "distribución de las medias", así como una "desviación estándar de las medias". Ahora surge la pregunta: ¿Esta nueva distribución de medias y su estadística se comportan en una forma predecible?

Existe un importante teorema conocido como el Teorema de Limite Central que responde en forma directa a esta pregunta. Se puede enunciar como

Sea y\,y2,- • •, Yn una muestra aleatoria de tamaño na partir de una distribución con una media \1 y varianza O2. Entonces, para n grandes, y es aproximadamente normal con la media \iy la varianza C2ln. Ademéis, para n grandes, la variable aleatoria (y — /i)/(o7 \/~ñ) es de manera aproximada la normal estándar.

Así, el teorema establece el resultado notable de que la distribución de las medias siempre será normalmente distribuida, ¡sin importar la distribución en uso de las variables aleatorias! Esto también da el resultado esperado, que dada una muestra lo suficientemente grande, la media de las medias debería converger sobre la media real de la población \i.

Además, el teorema dice que en tanto se tenga tamaños de muestra más grandes, la varianza de las medias deberá aproximarse a cero. Esto tiene sentido, ya que si n es pequeña, las estimaciones individuales de la media deberían ser pobres, y la varianza de las medias, grandes. En tanto n aumente, la estimación de la media mejorará y, por tanto, se acortará su dispersión. El Teorema de Límite Central claramente define en forma exacta cómo este estrechamiento relaciona tanto a la varianza real como al tamaño de la muestra; por ejemplo, como a2ln.

Por último, el teorema establece el importante resultado que se ha dado en la ecuación (PT5.6). Como se muestra en esta sección, el resultado es la base para construir con seguridad intervalos para la media.

estimada s . Una alternativa más directa podrá ser una versión de la ecuación (PT5.6) basada en sy,

t = ^ ~ jí_ (PT5.8) Sy/Vn

Aun cuando la muestra se tomó de una distribución normal, esta fracción no será normalmente distribuida, en particular cuando n sea pequeña. W. S. Gossett encontró que la variable aleatoria definida por la ecuación (PT5.8) maneja la tan conocida distribución estudiante — t o, en forma simple, la distribución t. Para este caso,

L = y - ~ztal2.„-\ U = y + ~ta/2,t, i (PT5.9)

Page 128: Chapra12-20

PT5.2 ANTECEDENTES MATEMÁTICOS 459

Normal f(n-6)

F I G U R A PT5 .4 Comparación de la distribución normal con la distribución f para n = 3 y n = ó. Observe cómo la distribución fes normalmente más plana.

donde n -\ e s ^ a variable aleatoria estándar de la distribución t para una probabilidad de a/2. Como fue el caso para z ^ , los valores están tabulados en libros de estadística, y también pueden calcularse mediante paquetes de software y librerías. Por ejemplo, si a = 0.05 y n = 20, n_ x = 2.086.

La distribución t puede pensarse como una modificación de la distribución normal que toma en cuenta el hecho de que se tiene una estimación imperfecta de la desviación estándar. Cuando n es pequeña, tiende a ser más plana que la normal (véase la figura PT5.4). Por tanto, para pequeños números de mediciones, se obtienen intervalos de confianza más amplios y, por tanto, más conservativos. Conforme n se haga más grande, la distribución t converge sobre la normal.

EJEMPLO PT5 .2 Intervalo de confianza sobre la media

\ Enunciado del problema. Determine la media y el intervalo de confianza correspon-• diente al 95% para los datos de la tabla PT5.1. Ejecute 3 estimaciones basándose en

a) las primeras 8 mediciones b) las primeras 16 y c) las 24 mediciones.

; Solución, a) La media y la desviación estándar para los primeros 8 puntos es

52.72 y = 6.59

347.4814 - (52.72) 2 /8 - 1

= 0.089921

La estadística / correcta se puede calcular como

^0.05/2,8-1 = ¿0.025,7 = 2.364623

la cual se puede usar para calcular el intervalo

0.089921 /. = 6.59 - -2.364623 = 6.5148

Page 129: Chapra12-20

4 6 0 AJUSTE DE CURVAS

y

n = 16 -M n = 24

6.50 6.55 6.60 6.65 6.70 Coeficiente de expansión térmica [x 1 0 - 6 pulg/(pulg • °F)]

F IGURA P T 5 . 5 Estimación de la media e intervalos de confianza al 95% para diferentes números de tamaño muestra.

0 089921 U = 6.59 + — — — 2 . 3 6 4 6 2 3 = 6.6652

78 o

6.5148 < ii < 6.6652

Así, con base en las primeras ocho mediciones, concluimos que existe un 9 5 % de probabilidad de que la media real esté dentro del rango de 6.5148 a 6.6652.

Los otros dos casos para b) con 16 puntos y c) con 24 puntos, se pueden calcular en una forma similar y los resultados se tabulan junto con el inciso á) como

« 9_ *y ta/2,n-\ *• U_ 8 6.5900 0.089921 2.364623 6.5148 6.6652

16 6.5794 0.095845 2.131451 6.5283 6.6304 24 6.6000 0.097133 2.068655 6.5590 6.6410

Estos resultados, los cuales también se resumen en la figura PT5 .5 , indican la respuesta esperada de que el intervalo de confianza se hace más estrecho a medida que n aumenta. Así, cuantas más mediciones se tomen, nuestra estimación del valor real se hace mhn refinado.

Lo anterior es sólo un simple ejemplo de cómo se puede usar la estadística puní tomar decisiones con respecto a datos inciertos. Esos conceptos tendrán también rele vancia en nuestro análisis de modelos de regresión. Usted puede consultar cualquier libro básico de estadística (por ejemplo, Milton y Arnold, 1995) para obtener inlbrniii ción adicional sobre este tema.

Page 130: Chapra12-20

I T 5 . 3 ORIENTACIÓN

P T 5 . 3 O R I E N T A C I Ó N

Antes de proceder a los métodos numéricos para el ajuste de curvas, alguna orientación podría ser de utilidad. Lo siguiente se intenta como una revisión del material analizado en la parte cinco. Además, se formularon algunos objetivos para ayudar a enfocar sus esfuerzos cuando estudie el material.

P T 5 . 3 . 1 Alcance y presentación

La figura PT5.5 proporciona una revisión del material que se estudiará en la parte cinco. El capítulo 17 se dedica a la regresión por mínimos cuadrados. Se aprenderá primero cómo ajustar la "mejor" línea recta a través de un conjunto de datos inciertos. Esta técnica es llamada regresión lineal. Además de analizar cómo calcular la pendiente y la intercepción de esta línea recta, se presentarán también métodos visuales y cuantitativos para evaluar la validez de los resultados.

Además de ajustar a una línea recta, se presentará también una técnica general para ajustar al "mejor" polinomio. Así, usted aprenderá a derivar una parabólica, cúbica o un polinomio de orden superior que ajuste en forma óptima datos inciertos. La regresión lineal es un subconjunto de este procedimiento más general, el cual es llamado regresión polinomio!.

El siguiente tema que se analiza en el capítulo 17 es la regresión lineal múltiple. Está diseñada para el caso donde la variable dependiente^ es una función lineal de dos o más variables independientes xu x2,..., xm. Este procedimiento tiene especial utilidad para evaluar datos experimentales donde la variable de interés es dependiente de un número de diferentes factores.

Después de la regresión múltiple, ilustramos cómo las regresiones polinomial y múltiple son ambas subconjuntos de un modelo general lineal de mínimos cuadrados. Entre otras cosas, esto nos permitirá introducir una representación de regresión de matriz concisa y analizar sus propiedades estadísticas generales.

Por último, las últimas secciones del capítulo 17 se dedican a la regresión no lineal. Este procedimiento se designa para calcular un ajuste por mínimos cuadrados de una ecuación no lineal a datos.

En el capítulo 18 se describe la técnica alterna para el ajuste de curvas llamada interpolación. Como se analizó antes, la interpolación se usa para estimar valores intermedios entre datos precisos. En el capítulo 18 se derivan los polinomios para este propósito. Se introduce el concepto básico de interpolación polinomial al usar líneas rectas y parábolas para conectar puntos. Luego, se desarrolla un procedimiento generalizado para el ajuste de un polinomio de orden n-ésimo. Se presentan dos formatos para expresar estos polinomios en forma de ecuación. El primero, llamado interpolación polinomial de Newton, es preferible cuando se desconoce el orden apropiado de los polinomios. El segundo, llamado interpolación polinomial de Lagrange, tiene ventajas cuando el orden apropiado se conoce de antemano.

La última sección del capítulo 18 presenta una técnica alterna para un ajuste más preciso de datos. Ésta, llamada interpolación segmentaria, ajusta polinomios a datos pero en forma de trozos. Como tal, es particularmente muy adecuada para ajustar datos que son por lo general suaves pero que exhiben cambios locales abruptos.

Page 131: Chapra12-20

462 AJUSTE DE CURVAS

• f.it¡\

iiír

St-i :

20.3 Ingeniería •eléctrica

20.2 Ingeniería

civil

20.1 Ingeniería química

CAPITULO 20 Aplicaciones

en la ingeniería

19.8 Librerías

y paquetes

: 19.7 Espectro

de potencia

PARTE 5 Ajuste de curvas

CAPITULO 19 Aproximación

de Fourier

19.6; Transformada

jápida de Fourier/

17.1 Regresión

lineal 17.2

Regresión polinomial

CAPITULO 17 Regresión por

mínimos cuadrados

17.3 Regresión múltiple

17.4 jMfnimos cuadrados)

.Jineal generaL

17.8 Regresión no lineal

18.1 Polinomial de Newton

CAPITULO 18 Interpolación

19.1 Sinusoidales

19.2 Serie de Fourier

continua

~íai~ Frec. y dominio

del tiempo

18 Segmentarias

19.5 Transformada

discreta de Fourier _

19.4 Transformada

de Fourier

18.2 Polinomial

^de Lagrange_,

"Ta3~ Coeficientes

^polinomialesj

18.4 Interpolación

inversa

18.5 Comentarios adicionales

F I G U R A P T 5 . 6 Organización esquemática del material de la parte cinco: Ajuste de curvas.

El capítulo 19 tiene que ver con el procedimiento de la transformada de l'ourier puní el ajuste de curvas, donde funciones periódicas se ajustan a dalos. Nucslro énfasis on esta sección seré sobre la transformada rápida de Fourier. Al final de este capitulo se

Page 132: Chapra12-20

4 t t

incluye también una revisión de algunos paquetes de software y librerías que se pueden usar para el ajuste de curvas; entre ellos se encuentran Mathcad, Excel, MATLAB e IMSL.

El capítulo 20 se dedica a las aplicaciones de la ingeniería que ilustran la utilidad de los métodos numéricos en el contexto de problemas de ingeniería. Los ejemplos se toman de las cuatro áreas principales de la ingeniería: química, civil, eléctrica y mecánica. Además, algunas de las aplicaciones ilustran cómo se pueden aplicar los paquetes de software para resolver problemas de ingeniería.

Por último, se incluye un epílogo al final de la parte cinco. Éste contiene un resumen de las fórmulas y conceptos importantes relacionados con el ajuste de curvas, así como un análisis de los elementos de juicio entre las técnicas y sugerencias para estudios en el futuro.

P T 5 . 3 . 2 Metas y objetivos

Objetivos de estudio. Después de completar la parte cinco, usted habrá depurado en gran forma su capacidad para ajustar curvas con los datos. En general, usted manejará las técnicas, habrá aprendido a asegurar la confiabilidad de sus resultados y será capaz de seleccionar el método (o métodos) para cualquier problema particular. Además, para esas metas generales, los conceptos específicos dados en la tabla PT5.3 deberán ser asimilados y manejados.

TABLA P T 5 . 3 Objetivos específicos de estudio para la parte cinco.

1. Comprender la diferencia fundamental entre regresión e interpolación, y que confundirlos puede provocar serios problemas.

2. Entender la deducción de la regresión lineal por mínimos cuadrados y ser capaz de asegurar la confiabilidad del ajuste mediante validaciones en forma gráfica y cuantitativa.

3. Saber cómo linearizar datos por transformación. 4. Entender situaciones donde son apropiadas las regresiones polinomiales, múltiples y no lineales. 5. Ser capaz de reconocer modelos lineales generales, entender la formulación de una matriz general

para mínimos cuadrados lineales y saber cómo calcular los intervalos de confianza de los parámetros.

6. Entender que hay uno y sólo un polinomial de grado n o menor que pasa exactamente a través de n + 1 puntos.

7. Saber cómo derivar la interpolación polinomial de Newton en primer orden. 8. Entender la analogía entre el polinomial de Newton y la expansión de la serie de Taylor y cómo se

relaciona el error de truncamiento. 9. Reconocer que las ecuaciones de Newton y Lagrange son simplemente formulaciones diferentes de

la misma interpolación polinomial, y entender sus respectivas ventajas y desventajas. 10. Percatarse que por lo general se obtienen resultados más exactos si los datos usados para

interpolación son más o menos centrados y cercanos del punto desconocido. 1 1. Darse cuenta que los datos de los puntos no tienen que estar igualmente espaciados en cualquier

orden particular, ya sea para los polinomiales de Newton o de lagrange. 12. Saber por qué las fórmulas de interpolación con igual espaciamiento tienen utilidad. 13. Reconocer las capacidades y riesgos asociados con la extrapolación. 14. Entender por qué las funciones segmentadas tienen utilidad para datos con áreas locales de

cambio abrupto. 15. Reconocer cómo se usan las series de Fourier para ajustar datos con funciones periódicas. 16. Entender la diferencia entre frecuencia y dominios del tiempo.

Page 133: Chapra12-20

464 AJUSTE DE CURVAS

Objetivos de cómputo. Se le ha proporcionado el software y algoritmos de cómputo simples para implementar las técnicas analizadas en la parte cinco. Usted puede también tener acceso a los paquetes de software y librerías. Todo esto tiene utilidad como herramientas de aprendizaje.

El software de Métodos Numéricos TOOLKIT incluye regresión polinomial. Los gráficos asociados con este software permiten visualizar fácilmente el problema y las operaciones matemáticas asociadas. Las gráficas son una parte esencial del aseguramiento de la validez de un ajuste por regresión. Éstas también proporcionan guías con respecto al uso correcto de la regresión polinomial y de los peligros potenciales de la extrapolación. El software es muy fácil de aplicar para resolver problemas prácticos y se puede usar para verificar los resultados de cualquier programa en computadora que usted mismo haya desarrollado.

Además, se proporcionan los algoritmos en pseudocódigo para la mayoría de los otros métodos en la parte cinco. Esta información le permitirá expandir su software de librerías para incluir técnicas más allá de la regresión polinomial. Por ejemplo, usted puede encontrar útil, desde un punto de vista profesional, tener software para implementar la regresión lineal múltiple, la interpolación polinomial de Newton, la interpolación segmentaria cúbica y la transformada rápida de Fourier.

Finalmente, una de las metas más importantes deberá ser manejar varios de los paquetes de software de utilidad general que están disponibles ampliamente. En particular, usted debería acostumbrar usar esas herramientas para implementar métodos numéricos para la solución de problemas en la ingeniería.

Page 134: Chapra12-20

CAPITULO 17

Regresión por mínimos cuadrados

Donde se asocian errores sustanciales con los datos, la interpolación polinomial es inapropiada y puede dar resultados insatisfactorios cuando se usa para predecir valores intermedios. Por ejemplo, en la figura 17.1a se muestran siete datos derivados experi-mentalmente que exhiben variabilidad significativa. Una inspección visual de dichos datos sugiere una posible relación entre y y x. Es decir, la tendencia general indica que los valores más altos de y son asociados con los valores más altos de x. Ahora, si una interpolación de sexto orden se ajusta a estos datos (figura 17.1¿»), pasará justo a través de todos los puntos. Sin embargo, a causa de la variabilidad en los datos, la curva oscila en forma amplia en el intervalo entre los puntos. En particular, los valores interpolados en x = 1.5 y JC = 6.5 parecen estar muy adelante del rango sugerido por los datos.

Una estrategia más apropiada para tales casos es derivar una función aproximada que ajuste la forma de la tendencia general de los datos sin ajustar necesariamente con los puntos individuales. La figura 17.1c ilustra cómo se puede usar por lo general una línea recta para caracterizar la tendencia de los datos sin pasar a través de un punto en particular.

Una manera para determinar la línea en la figura 17.1c es inspeccionar en forma visual los datos graneados y después trazar una "mejor" línea a través de los puntos. Aunque tales procedimientos por "vistazo" apelan al sentido común y son válidos para cálculos superficiales, resultan deficientes por ser arbitrarios. Es decir, a menos que los puntos definan una línea recta perfecta (en tal caso la interpolación podría ser apropiada), diferentes analistas podrían dibujar distintas líneas.

Para hacer a un lado la subjetividad se debe concebir algunos criterisj^n el fin de establecer una base para el ajuste. Una forma de hacerlo es derivar una curva que minimice la discrepancia entre los puntos y la curva. Una técnica para cumplir con tal objetivo se conoce como regresión por mínimos cuadrados, que se analizará en este capítulo.

1 7 . 1 R E G R E S I Ó N L I N E A L

El ejemplo más simple de una aproximación por mínimos cuadrados es mediante el ajuste de un conjunto de pares de observaciones: (xl,yl), (x2,y2), • • •. (x„ ,y„) a una línea recta. La expresión matemática para esta última es

V = c/<) + + (' (17.1)

Page 135: Chapra12-20

466 REGRESIÓN POR MÍNIMOS CUADRADOS

a)

b)

F I G U R A 17 .1 a) Datos que exhiben un error significativo, b) Ajuste polinomial oscilando más allá del rango de datos, c) Resultados más satisfactorios mediante el ajuste por mínimos cuadrados.

c)

donde a 0 y a¡ son coeficientes que representan el intercepto y la pendiente, respectivamente, y e es el error, o residuo, entre el modelo y las observaciones, las cuales se pueden representar al reordenar la ecuación (17.1) como

e = v - ero - a\x

Así, el envr o residuo es la discrepancia entre el valor real <icy y el valor aproximado, o„ + predicho por la ecuación lineal.

Page 136: Chapra12-20

17 ,1 R E G R E S I Ó N L I N E A L 4*9

17 .1 .1 Criterios para un " m e j o r " ajuste

Una estrategia para ajustar a la ¿"mejor"? línea a través de los datos podría ser minimizar la suma de los errores residuales para todos los datos disponibles, como en

J2 e'< = (-y' " °° " aix>) (17.2) í = l 1 = 1

donde n — número total de puntos. Sin embargo, éste es un criterio inadecuado, como lo ilustra la figura 17.2a, la cual muestra el ajuste de una línea recta de dos puntos. Obvia-

FIGURA 17.2 Ejemplos de algunos criterios para "el mejor ajuste" inadecuados para regresión: a) minimiza la suma de los residuos, b) minimiza la suma de los valores absolutos de los residuos y c) minimiza el error máximo de cualquier punto individual

x c)

Page 137: Chapra12-20

468 REGRESIÓN POR MÍNIMOS CUADRADOS

mente, el mejor ajuste es la línea que conecta los puntos. Sin embargo, cualquier línea recta que pasa a través del punto medio que conecta la línea (excepto una línea perfecta vertical) resulta en un valor mínimo de la ecuación (17.2) igual a cero debido a los errores que se cancelan.

Por tanto, otro criterio lógico podría ser minimizar la suma de los valores absolutos de las discrepancias, como en

n n

^ k l = Yl^y> - a o - a i x í \ 1=1 í = i

La figura 17.2b demuestra por qué este criterio es también inadecuado. Para los cuatro puntos expuestos, cualquier línea recta que esté dentro de las líneas punteadas minimizará el valor absoluto de la suma. Así, este criterio tampoco da un único mejor ajuste.

Una tercera estrategia para ajustar a la mejor línea es el criterio mirúmax. En esta técnica, la línea se elige de manera que minimice la máxima distancia que tenga un punto individual desde la línea. Como se ilustra en la figura 17.2c, tal estrategia no es adecuada para regresión, ya que tiene una excesiva influencia en puntos fuera del conjunto; es decir, un solo punto con un gran error. Debería observarse que el principio minimax es algunas ocasiones muy adecuado para ajustar una simple función a una complicada función (Carnahan, Luther y Wilkes, 1969).

Una estrategia que supera los defectos de los procedimientos mencionados es minimizar la suma de los cuadrados de los residuos entre la y medida y la y calculada con el modelo lineal

n n n ^ = 2 ^ = 2 ( y ; , m e d i d a - > ' 1 , m o d e l o ) 2 = 2<> , -ao -« l^ ) 2

( 1 7 - 3 ) k ;=1 i=l ¡=1

Este criterio tiene varias ventajas, entre ellas el hecho de que se obtiene una línea única para un cierto conjunto de datos. Antes de analizar esas propiedades, presentaremos una técnica para determinar los valores de a0 y a{ que minimizan la ecuación (17.3). 1 7 . 1 . 2 Ajuste por mínimos cuadrados de una línea recta

Para determinar los valores de a 0 y av la ecuación (17.3) es diferenciada con respecto a cada coeficiente:

2Yl(y¡ ~a° ~aiXi)

2^2[{y¡ - « o - « i ) • * • ; ]

Observe que hemos simplificado los símbolos de la sumatoria; a menos que se indique otra cosa, todas las sumatorias son de i = 1 hasta n. Al fijar esas derivadas igual a cero, resultará en un mínimo Sr. Si se hace esto, las ecuaciones se pueden expresar como

3Sr da0 dSr 9<2l

Page 138: Chapra12-20

17.1 REGRESIÓN LINEAL 4 1 9

Ahora, si hacemos que £ a 0 = na0, podemos expresar las ecuaciones como un conjunto de dos ecuaciones lineales con dos incógnitas (a 0 y a,):

na0 + (X!x') ai ~ X1' O 7 ' 4 ) a 0 + Q T X ? ) a i = £ > y ¡ . (17.5)

Estas son llamadas ecuaciones normales, y pueden ser resueltas en forma simultánea

(17.6) nlx* - (Zx,.)*

Este resultado, entonces, se puede usar en conjunto con la ecuación (17.4) y resolver para

a0 = y - axx (17.7)

donde y y x son las medias de y y x, respectivamente.

EJEMPLO 17.1 Regresión lineal

Enunciado del problema. Ajuste a una línea recta los valores de x y y en las dos i primeras columnas de la tabla 17.1.

Solución. Se calculan las siguientes cantidades:

n = i x>-y¡ = 1 1 9 5 J2 x<2 = 1 4 0

^ J C , - = : 2 8 i = y = 4

^ 24 y¡ = 24 x = — = 3.428571

Mediante las ecuaciones (17.6) y (17.7)

7 (119 .5 ) -28 (24) „ „ „ „ „ „ „ ai = — -V- = 0.8392857

7(140) - (28) 2

a 0 = 3.428571 - 0.8392857(4) = 0.07142857

T A B L A 17 .1 Cálculos para un análisis de error del ajuste lineal.

_*f y> (y;-y)2 (yz-op-*»!*;)2

1 0.5 8.5765 0.1687 2 2.5 0.8622 0.5625

1 3 2.0 2.0408 0.3473 j 4 4.0 0.3265 0.3265 í 5 3.5 0.0051 0.5896 I 6 6.0 6.6122 0.7972

7 ¿5. 54,29Qg 01993 S 24.0 22.7143 2.9911

Page 139: Chapra12-20

470 REGRESIÓN POR MÍNIMOS CUADRADOS

Por tanto, el ajuste por mínimos cuadrados es

J y = 0.07142857 + 0.8392857*

S La línea, junto con los datos, son mostrados en la figura 17.1c.

17 .1 .3 Cuantificación del e r ro r de una regresión l ineal

Cualquier otra línea que la calculada en el ejemplo 17.1 resulta en una gran suma de cuadrados de los residuos. Así, la línea es única y en términos de nuestro criterio elegido es una línea "mejor" a través de los puntos. Un número adicional de propiedades de este ajuste se puede elucidar al examinar más de cerca la forma en que se calcularon los residuos. Recuerde que la suma de los cuadrados se define como [véase ecuación (17.3)]

Observe la similitud entre las ecuaciones (PT5.3) y (17.8). En el primer caso, el cuadrado del residuo representa el cuadrado de la discrepancia entre los datos y una sola estimación de la medida de tendencia central (la media). En la ecuación (17.8), el cuadrado de los residuos representa el cuadrado de la distancia vertical entre los datos y otra medida de tendencia central: la línea recta (véase figura 17.3).

La analogía se puede extender más para casos donde 1) la dispersión de los puntos alrededor de la línea es de magnitud similar junto con todo el rango de datos, y 2) la distribución de esos puntos cerca de la línea es normal. Se puede demostrar que si estos criterios se cumplen, la regresión por mínimos cuadrados proporcionará la mejor (es decir, una de las mejores) estimación de a0 y a{ (Draper y Smith, 1981). Esto es conocido en estadística como el principio de probabilidad máxima. Además, si estos criterios se

El residuo en la regresión lineal representa la distancia vertical entre un dato y la línea recta.

(17.8) í = i

F IGURA 1 7 . 3

Medición

a 0 + a,*,

x

Page 140: Chapra12-20

17.1 REGRESIÓN LINEAL

cumplen, una "desviación estándar" para la línea de regresión se puede determinar como [compare con la ecuación (PT5.2)]

(17.9)

donde sy/x es llamado el error estándar del estimado. La notación del subíndice "y/x" designa que el error es para un valor predicho de y correspondiente a un valor particular de x. También, observe que ahora dividimos entre n — 2 debido a los dos datos estimados (aQ y ÍZJ), que se usaron para calcular Sr; así, se tiene dos grados de libertad. Como lo hicimos en nuestro análisis para la desviación estándar en PT5.2.1, otra justificación para dividir entre n — 2 es que no existe algo como "datos dispersos" alrededor de una línea recta que conecte dos puntos. De esta manera, para el caso donde n — 2, la ecuación (17.9) da un resultado sin sentido al infinito.

Justo como fue el caso con la desviación estándar, el error estándar de la estimación cuantifica la dispersión de los datos. Sin embargo, sy/x cuantifica la dispersión alrededor de la línea de regresión, como se muestra en la figura 17.4¿, en contraste con la desviación estándar original sy que cuantifica la dispersión alrededor de la media (figura 17.4a).

Los conceptos anteriores se pueden usar para cuantificar la "bondad" de nuestro ajuste. Esto es en particular útil para comparar diferentes regresiones (véase figura 17.5). Para hacer esto, regresamos a los datos originales y determinamos la suma total de los cuadrados alrededor de la media para la variable dependiente (en nuestro caso, y). Como fue el caso para la ecuación (PT5.3), esta cantidad se designa por S¡. Ésta es la magnitud del error residual asociado con la variable dependiente antes de la regresión. Después de realizar la regresión, calculamos 5 r , la suma de los cuadrados de los residuos alrededor de la línea de regresión. Esto caracteriza el error residual que queda después de la regresión. Esto es, por tanto, algunas veces llamado la suma inexplicable de los cuadrados. La

F I G U R A 17 .4 Datos de regresión que muestran o) la dispersión de los datos alrededor de la media de la variable dependiente y b) la dispersión de los datos alrededor de la mejor línea de ajuste. La reducción en la dispersión va de a) a b), como lo indican las curvas en forma de campana a la derecha, representan la mejora debida a la regresión lineal.

Page 141: Chapra12-20

472 REGRESIÓN POR MÍNIMOS CUADRADOS

F I G U R A 17 .5 Ejemplos de regresión lineal con errores residuales a) pequeños y b) grandes.

diferencia entre estas dos cantidades, St — Sr, cuantifica la mejora o reducción de error debido a que describe los datos en términos de una línea recta en vez de como un valor promedio. Como la magnitud de esta cantidad es dependiente de la escala, la diferencia es normalizada a St para obtener

r2 = S t ~ S r (17.10) S, donde r 2 es conocido como el coeficiente de determinación y r es el coeficiente de conflación (— Vr5). Para un ajuste perfecto, Sr — 0yr = r2 = 1, significa que la línea explica el 100% de la variabilidad de los datos. Para r = r2 = 0, Sr = S, y el ajuste no representa ninguna mejora. Una formulación alternativa para r que es mas conveniente para implementarse en una computadora es

Page 142: Chapra12-20

17.1 REGRESIÓN LINEAL

EJEMPLO 17.2 Estimación de errores para el ajuste lineal por mínimos cuadrados

Enunciado del problema. Calcule la desviación estándar total, el error estándar del estimado y el coeficiente de correlación para los datos en el ejemplo 17.1.

Solución. Las sumatorias se realizan y se presentan en la tabla 17.1. La desviación estándar es [véase ecuación (PT5.2)]

22 7143 ͱ1}ZÍ = 1.9457 7 - 1

y el error estándar del estimado es [véase ecuación (17.9)]

/2.9911 n „ „ , s y / x = ^ T - J = 0.7735

Así, ya que sy/x < Sy, el modelo de regresión lineal tiene mérito. La mejora adicional se puede cuantificar por [véase ecuación (17.10)]

22.7143 - 2.9911 r" =

2 - — = 0 . 8 6 8 22.7143

r = V0 .868 = 0.932

Los resultados indican que el 86.8% de la incertidumbre original ha sido explicada por el modelo lineal.

Antes de proceder con el programa de cómputo para regresión lineal, debemos tomar en cuenta algunas consideraciones. Aunque los coeficientes de correlación proporcionan una manera fácil para medir la bondad del ajuste, se deberá tener cuidado de no darle más significado que el que ya tiene. Así como r es "cercana" a 1 no significa que el ajuste es necesariamente "bueno". Por ejemplo, es posible obtener un valor relativamente alto de r cuando la relación en turno entre y y x no es lineal. Draper y Smith (1981) proporcionan guías y material adicional con respecto al aseguramiento de los resultados para regresión lineal. Además, como mínimo, usted debería siempre inspeccionar una gráfica de los datos junto con su curva de regresión. Como se describe en la siguiente sección, el software de métodos numéricos TOOLKIT incluye esas capacidades.

17 .1 .4 P rograma de cómputo para regresión l ineal

Esto es una cuestión relativamente trivial para desarrollar un pseudocódigo para regresión lineal (véase figura 17.6). Como se mencionó antes, una opción de gráfica es crítica para el uso efectivo e interpretación de regresión y se incluye en el software suplementario de métodos numéricos TOOLKIT. Además, paquetes de software populares como Excel y Mathcad pueden implementar regresión y tienen capacidades de graficación. Si su lenguaje de computadora tiene capacidades de graficación, recomendamos que expanda su programa para incluir una gráfica de y contra x mostrando ambos: los datos y la línea de regresión. La inclusión de la capacidad resaltará mucho la utilidad del programu en los contextos de solución de problemas.

Page 143: Chapra12-20

4 7 4 REGRESIÓN POR MÍNIMOS CUADRADOS

5U3 Regres(x, y, n, al, aO, syx, r2)

sumx = 0: sumxy = 0: st ~ 0 sumy = 0: sumx2 = 0: sr = 0 DO ¡ = 1, n

sumx = sumx + x¡ sumy = sumy + y¡ sumxy = sumxy + x¡y¡ sumx2 = sumx2 + x^x,

EHDDO xm = sumx/n ym = sumy/n a1 — (n*sumxy ~ sumx*sumy)/(n*sumx2 — sumx*sumx) aO — ym — aUxm DO i= 1,n

st = st + (y¡ - ymf sr=sr+ (y¡ — a1*x¡ — aO) 2

END DO syx = (sr/(n - 2)) 0 3

r2 = (st - s r j / s t

END Regres

F I G U R A 1 7 . 6 Algoritmo para regresión lineal.

EJEMPLO 17.3 Regresión lineal usando la computadora

Enunciado del problema. El paquete de software de Métodos Numéricos TOOLKIT s adjunto a este texto, contiene un programa de cómputo para implementar regresión li-: neal. Podemos usar este software para resolver un problema de prueba hipotético asocia-! do con la caída del paracaidista que se analizó en el capítulo 1. Un modelo matemático i teórico para la velocidad del paracaidista fue dado como el siguiente [véase ecuación ! (1.10)]:

S " 1 (\ _0{-clm)t^ C v{t) = — (1 - e

donde v = velocidad (m/s), g = constante gravitacional (9.8 m/s 2), m = masa del para caidista igual a 68.1 kg y c = coeficiente de arrastre de 12.5 kg/s. El modelo predice la velocidad del paracaidista como una función del tiempo, como se describe en el ejemplo 1.1. En el ejemplo 2.1 se desarrolló una gráfica de la variación de la velocidad.

Un modelo empírico alternativo para la velocidad del paracaidista está dado por

i;»; / l \

Page 144: Chapra12-20

17.1 REGRESIÓN LINEAL

TABLA 1 7 . 2 Velocidades medidas y calculadas para la caída del paracaidista,

v calculada v calculada v medida. con el modelo, con el modelo ,

m/s m/s [ec. (1.10)] m/s [ec. ( E l 7 .3 .1 ) ] T iempo, s o) b) c)

1 10.00 8.953 1 1.240 2 16.30 16.405 18.570 3 23.00 22 .607 23 .729 4 27.50 27 .769 27.5.56 5 31.00 32.065 30 .509 ó 35.60 35.641 32.855 7 39.00 38 .617 34 .766 8 41 .50 41 .095 36.351 9 42 .90 43 .156 37 .687

10 45 .00 44 .872 38 .829 11 46 .00 46.301 39 .816 12 45 .50 47 .490 40 .678 13 46 .00 48 .479 41 .437 14 49 .00 49.303 42.1 10 15 50 .00 49 .988 42 .712

Suponga que a usted le gustaría probar y comparar lo adecuado de esos dos modelos matemáticos. Esto se podría cumplir al medir la velocidad real del paracaidista con valores conocidos de tiempo y comparar estos resultados con las velocidades predichas de acuerdo con cada modelo.

Tal programa de colección de datos experimentales se implemento, y los resultados se enlistan en la columna a) de la tabla 17.2. Las velocidades calculadas para cada modelo se enlistan en las columnas b) y c).

Solución. La adecuidad de los modelos se puede probar al graficar la velocidad del modelo calculado contra la velocidad medida. Se puede usar regresión lineal para calcular la pendiente y el intercepto de la gráfica. Esta línea tendrá una pendiente de I , un intercepto de 0 y una r1 = 1 si el modelo concuerda perfectamente con los datos. Una desviación significativa de esos valores se puede usar como un indicador de la inadecuidad del modelo.

La figura 17.7a y 17.76 son gráficas de la línea y datos para las regresiones de las columnas b) y c), respectivamente, contra la columna a). Para el primer modelo [ecuación (1.10) como se ilustra en la figura 17.7a]

«Wwo = - 0 - 8 5 9 + 1.032u m e d l d a

y para el segundo modelo [ecuación (E17.3.1) como se ilustra en la figura 17.7/>]

"modelo = 5 - 7 7 6 + ° - 7 5 2 u m e d i d a

Esas gráficas indican que la regresión lineal entre los datos y cada uno de los modelos ON altamente significativa. Ambos modelos ajustan los datos con un coeficiente de concia ción mayor que 0.99.

I os modelos de prueba y selección son comunes y extremadiimenle imporliinlcN para la realización de actividades en todos los campos de lu ingeniciiu, lil iniitcrinl pro

Page 145: Chapra12-20

476 REGRESIÓN POR MÍNIMOS CUADRADOS

!

5 30 X

55

30 55 X

F IGURA 17 .7 a) Resultados que usan regresión lineal para comparar las predicciones calculadas con el modelo teórico [véase ecuación (1.10)] contra valores medidos, b) Resultados usando regresión lineal para comparar predicciones calculadas con el modelo empírico [véase ecuación (E l7 .3 .1] contra valores medidos.

porcionado en este capítulo como antecedente, junto con su software, le proporcionará una guía muy práctica para problemas de este tipo.

Sin embargo, el modelo descrito por la ecuación (1.10) conforma para nuestra hipótesis criterios de prueba mucho mejores que los descritos por la ecuación (E17.3.1) ya que la pendiente y el intercepto son más cercanos o casi igual a 1 y 0. Así, aunque cada gráfica está bien descrita poruña línea recta, la ecuación (1.10) parece ser mejor modelo quela(E17.3.1).

Hay un defecto eon el análisis en el ejemplo 17.3. El ejemplo no fue ambiguo, yn que el modelo empírico [véase ecuación (El 7.3.1)] fue claramente inferior al de la ecuación (1.10). Así, la pendiente y el intercepto para el modelo empírico fueron mucho más cercano! que el resultado deseado de 1 y 0, fue obvio cuál modelo fue superior.

Page 146: Chapra12-20

17.1 REGRESIÓN LINEAL 477 Sin embargo, suponga que la pendiente fuera de 0.85 y que el intercepto lliorn de 2,

Obviamente esto haría de la conclusión de que la pendiente y el intercepto fueran I y 0, un debate abierto. De manera clara, más que recaer en un juicio subjetivo, sería preferible basar tal conclusión sobre un criterio cuantitativo.

Esto se puede hacer al calcular los intervalos de confianza para los parámetros del modelo en la misma forma que desarrollamos los intervalos de confianza para la media en la sección PT5.2.3. Regresaremos a este punto al final del presente capítulo.

1 7 . 1 . 5 Linearización de relaciones no l ineales

La regresión lineal proporciona una técnica poderosa que ajusta a la "mejor" línea los datos. Sin embargo, está predicha sobre el hecho de que la relación entre las variables dependientes e independientes es lineal. Este no es siempre el caso, y el primer paso en cualquier análisis de regresión debería ser graficar e inspeccionar en forma visual para asegurarnos si se puede usar un modelo lineal. Por ejemplo, la figura 17.8 muestra algunos datos que son obviamente curvilíneos. En algunos casos, técnicas tales como regresión por polinomios, las cuales se describen en la sección 17.2, son apropiadas. Para otros, se puede usar transformaciones para expresar los datos en una forma que sea compatible con la regresión lineal.

F IGURA 17 .8 o) Datos no adecuados para la regresión lineal por mínimos cuadrados, b) Indicación de que es preferible una parábola.

x b)

Page 147: Chapra12-20

478 REGRESIÓN POR MÍNIMOS CUADRADOS

Un ejemplo es el modelo exponencial

y = a i e h l X (17.12) donde ax y bx son constantes. Este modelo se usa en muchos campos de la ingeniería para caracterizar cantidades que aumentan (b{ positivo) o disminuyen (b¡ negativo) u una velocidad que es directamente proporcional a sus propias magnitudes. Por ejemplo, el crecimiento poblacional o el decaimiento radiactivo pueden exhibir tal comportamiento. Como se ilustra en la figura 17.9a, la ecuación representa una relación no lineal (para /),

0) entre y y x. Otro ejemplo de modelo no lineal es la simple ecuación de potencias

y = a2xhl (17.13)

F I G U R A 1 7 . 9 o) La ecuación exponencial, b) la ecuación por potencias y c) la ecuación de razón de crecimiento saturado. Los incisos < e] y f] son versiones linearizadas de estas ecuaciones producto de transformaciones simples.

y f

c)

1/y A

Pendiente • /y*j

Page 148: Chapra12-20

17.1 REGRESIÓN LINEAL 47?

Enunciado del problema. Ajustar la ecuación (17.13) con los datos en la tabla 17.3 mediante transformaciones logarítmicas de los datos.

donde a2 y b2 son coeficientes constantes. Este modelo tiene amplia uplicnbiliclud 0 1 1 todos los campos de la ingeniería. Como se ilustra en la figura 17.9/), la ecuación (pura b2^0o 1) es no lineal.

Un tercer ejemplo de un modelo no lineal es la ecuación de razón de crecimiento saturado [recuerde la ecuación (El7.3.1)]

y = a ' l 7 ^ - <17-14>

donde a3 y b3 son coeficientes constantes. Este modelo, el cual es de manera particular muy adecuado para caracterizar la razón de crecimiento poblacional bajo condiciones limitadas, también representa una relación no lineal entre y y x (véase figura 17.9c) que iguala o "satura", en tanto x aumenta.

Las técnicas de regresión no lineal están disponibles para ajustar esas ecuaciones a datos experimentales de manera directa. (Observe que analizaremos la regresión no lineal en la sección 17.5.) Sin embargo, una alternativa simple es usar manipulaciones matemáticas para transformar las ecuaciones en una forma lineal. Después, se puede emplear la regresión lineal simple para ajustar las ecuaciones a datos.

Por ejemplo, la ecuación (17.12) se puede linearizar al tomar su logaritmo natural para dar

ln y = ln a\ + b\X ln e

Pero como ln e = 1,

ln y = ln ax + b\X (17.15)

Así, una gráfica de ln y contra x dará una línea recta con una pendiente de ¿>, y un intercepto de ln al (véase la figura 17.9c/).

La ecuación (17.14) es linearizada al tomar su base logaritmo 10 para dar

log y = b2 log x + log a2 (17.16)

De este modo, una gráfica de log y contra log x dará una línea recta con una pendiente de b2 y un intercepto de log a2 (figura 17.9e).

La ecuación (17.14) es linearizada al invertirla para dar

1 b3 1 1 - = + — (17.17) y « 3 X a 3

De esta forma, una gráfica de 1/y contra l/x será lineal, con una pendiente de b-¡/a3 y un intercepto de l /a 3 (véase la figura 17.9/).

En sus contornos transformados, estos modelos se ajustan mediante regresión lineal para evaluar los coeficientes constantes. Podrían ser de nuevo convertidos en su estado original y usados para propósitos predictivos. El ejemplo 17.4 ilustra este procedimiento para la ecuación (17.13). Además, la sección 20.1 proporciona un ejemplo de ingeniería de la misma clase de cálculo.

EJEMPLO 17.4 Linearización de una ecuación de potencias

Page 149: Chapra12-20

4 8 0 REGRESIÓN POR MÍNIMOS CUADRADOS

Solución. La figura 17. IOÍÜ es una gráfica de los datos originales en su estado no transformado. La figura 17.10¿> muestra la gráfica de los datos transformados. Una regresión lineal de éstos mediante log dan el resultado

l o g v = 1.75 log x - 0.300

TABLA 17 . 3 Datos que serán ajustados con la ecuación de potencias.

x y log x log y 1 0.5 0 -0.301 2 1.7 0.301 0.226 3 3.4 0.477 0.534 4 5.7 0.602 0.753 5 8.4 0.699 0.922

l F IGURA 1 7 . 1 0 | a) Gráfica de datos no transformados con la ecuación de potencias que ajusta los datos. ¡; b] Gráfica de datos transformados que se usan para determinar los coeficientes

de la ecuación de potencias.

Page 150: Chapra12-20

17.2 REGRESIÓN DE POLINOMIOS 411

i Así, el intercepto, log a2, igual —0.300, y por tanto, al tomar el antilogaritmo, u¡ — \ 1 0 _ 0 3 = 0.5. La pendiente es b2 = 1.75. En consecuencia, la ecuación de potencias es

y • 0 .5 .v l 7 S

Esta curva, como se gráfica en la figura 17.10a, indica un buen ajuste.

1 7 . 1 . 6 Comentarios generales sobre regresión l ineal

Antes de proceder con regresión curvilínea y lineal múltiple, debemos enfatizar la naturaleza introductoria del material anterior sobre regresión lineal. Nos hemos concentrado en la derivación simple y uso práctico de ecuaciones para ajustar datos. Debería estar consciente del hecho de que hay aspectos teóricos de regresión que son de importancia práctica, pero que van más allá del alcance de este libro. Por ejemplo, algunas suposiciones estadísticas que son inherentes en los procedimientos por mínimos cuadrados lineales son

1. Cada x tiene un valor fijo; no es aleatorio y es conocido sin error. 2. Los valores y son variables aleatorias independientes y todas tienen la misma varianza. 3. Los valores de y para una x dada deben ser normalmente distribuidos.

Tales suposiciones son relevantes para la derivación adecuada y uso de regresión. Por ejemplo, la primera suposición significa que 1) los valores x deben estar libres de errores y 2) la regresión de y contra x no es la misma que la de x contra y (pruebe el problema 17.4 al final del capítulo). Usted debe consultar otras referencias tales como Draper y Smith (1981) para apreciar aspectos y matices de regresión que están más allá del alcance de este libro.

1 7 . 2 R E G R E S I Ó N D E P O L I N O M I O S

En la sección 17.1 se desarrolló un procedimiento para obtener la ecuación de una línea recta por medio del criterio de mínimos cuadrados. Algunos datos de ingeniería, aunque exhiben un patrón marcado como el que se vio en la figura 17.8, está pobremente representado por una línea recta. Para esos casos, una curva podría ser más adecuada para el ajuste de los datos. Como se analizó en la sección anterior, un método para cumplir con este objetivo es usar transformaciones. Otras alternativas son ajustar polinomios con los datos mediante regresión de polinomios.

El procedimiento de mínimos cuadrados se puede fácilmente extender al ajuste de datos con un polinomio de orden superior. Por ejemplo, suponga que ajustamos un polinomio de segundo orden o cuadrático:

y = a 0 + a\X + atx1 + e

Para este caso la suma de los cuadrados de los residuos es [compare con la ecuación (17.3)]

Sr = ]T] (yi ~ «o - a\x¡ - a2xf) (17.18)

Page 151: Chapra12-20

482 REGRESIÓN POR MÍNIMOS CUADRADOS

Siguiendo el procedimiento de la sección anterior, tomamos la derivada de la ecuación (17.18) con respecto de cada uno de los coeficientes desconocidos del polinomio, como en

Estas ecuaciones se pueden igualar a cero y reordenar para desarrollar el siguiente conjunto de ecuaciones normal:

donde todas las sumatorias son de i = 1 hasta n. Observe que las tres ecuaciones anteriores son lineales y tienen tres incógnitas: aQ, ai y a2. Los coeficientes de las incógnitas se pueden evaluar de manera directa a partir de los datos observados.

Para este caso, vemos que el problema de determinar un polinomio por mínimos cuadrados de segundo orden es equivalente a resolver un sistema de tres ecuaciones lineales simultáneas. Las técnicas para resolver tales ecuaciones fueron analizadas en la parte tres.

El caso en dos dimensiones puede extenderse con facilidad a un polinomio de m-ésimo orden como

y = a0 + a\x + a2x2 H h amxm + e

El análisis anterior se puede fácilmente extender a este caso más general. Así, podemos reconocer que la determinación de los coeficientes de un polinomio de /n-ésimo orden es equivalente a resolver un sistema de m + 1 ecuaciones lineales simultáneas. Para este caso, el error estándar se formula como

Esta cantidad es dividida entre n — (m + 1), ya que (m + 1) coeficientes obtenidos de los datos (a0, a , , . . . , am) se usaron para calcular S,.; así, hemos perdido m + 1 grados de libertad. Además del error estándar, un coeficiente de determinación puede ser calculado para una regresión de polinomios con la ecuación (17.10).

(17.19)

(17.20)

E J E M P L O 1 7 . 5 Regresión de polinomios

Enunciado del problema. Ajustar a un polinomio de segundo orden los datos en IUN dos primeras columnas de la tabla 17.4.

Page 152: Chapra12-20

17.2 REGRE5IOIN D E P O L I N O M I O S

T A B L A 17 .4 Cálculos para un análisis de error del ajuste cuadrático por mínimos cuadrados.

x ¡ y, ( y ; - y ) 2 ( y / - O O - O I X f - o 2 x ? )

0 2.1 544 .44 0 .14332 1 7.7 314.47 1.00286 2 13.6 140.03 1.08158 3 27.2 3.12 0 .80491 4 4 0 . 9 239.22 0 .61951 5 61.1 1 272.1 1 0 .09439

2 152.6 2 5 1 3 . 3 9 3 .74657

F I G U R A 1 7 . 1 1 Ajuste de un polinomio de segundo orden.

Solución. A partir de los datos dados,

m = 2 X> = 15 X>4 = 979

n = 6 í>-152.6 = 585.6

X = 2.5 2>?-55 = 2488.

y = 25.433 225

Por tanto, las ecuaciones lineales simultáneas son

" 6 15 55 " « 0 152.6 15 55 225 0\ • = • 585.6 55 225 979 «2 2488.8

Page 153: Chapra12-20

484 REGRESIÓN POR MÍNIMOS CUADRADOS

Resolviendo estas ecuaciones con una técnica tal como la eliminación de Gauss se tiene a0 = 2.47857, a, = 2.35929 y a 2 = 1.86071. Por tanto, la ecuación cuadrática por mínimos cuadrados para este caso es

y = 2.47857 + 2.35929* + 1.86071* 2

El error estándar del estimado con base en la regresión de polinomios es [véase ecuación (17.20)]

Sy/, 3.74657

= 1.12 6 - 3

El coeficiente de determinación es , 2 5 1 3 . 3 9 - 3.74657

r2 = = 0.99851 2513.39

y el coeficiente de correlación es r — 0.99925. Estos resultados indican que el 99.851% de la incertidumbre original la resolvió el

modelo. Este resultado soporta la conclusión de que la ecuación cuadrática representa un excelente ajuste, como es también evidente de la figura 17.11.

17.2 .1 Algor i tmo para regresión de pol inomios

Un algoritmo para regresión de polinomios es expuesto en la figura 17.12. Observe que la principal tarea es la generación de los coeficientes de las ecuaciones normal [véase ecuación (17.19)]. (El pseudocódigo para el cumplimiento de esto se halla presente en la figura 17.13.) Entonces, las técnicas de la parte tres se pueden aplicar para resolver estas ecuaciones simultáneas para los coeficientes.

Un problema potencial asociado con la implementación de regresión de polinomios en la computadora es que las ecuaciones normales algunas veces están mal condicionadas. Esto es en particular cierto para versiones de orden superior. Para esos casos, los coeficientes calculados podrían ser altamente susceptibles al error de redondeo y, en consecuencia, los resultados pueden ser inexactos. Entre otras cosas, este problema se relaciona con la estructura de las ecuaciones normal y por el hecho de que para los polinomios de orden superior las ecuaciones normales pueden tener coeficientes muy grandes y muy pequeños. Esto se debe a los coeficientes y sumatorias de los datos elevados a potencias.

F IGURA 1 7 . 1 2 Algoritmo para la implementación de polinomios y regresión lineal múltiple.

Paso 1 : Introduzca el orden del polinomio sujeto a ajuste, m. Paso 2 : Integre el número de datos, n. Paso 3 : Si n < m + 1, imprima un mensaje de error que indique que la regresión no es posible

y termine el proceso. Si n S m + 1, continúe. Paso 4 : Calcule los elementos de la ecuación normal en la forma de una matriz aumentada. Paso 5 : Resuelva la matriz aumentada para los coeficientes a 0 , d i , a 2 , . . ., a m , por medio de un

método de eliminación. Paso di Imprima los coeficientes.

Page 154: Chapra12-20

17.2 REGRESIÓN DE POLINOMIOS 4 1 9

DO i = 1, ordí r + 1 PO j = 1, i

eum — 0 DOi = 1, n

eum — eum + ¿£ END DO a¡j = eum ap — eum

END DO eum = 0 D0£ = 1,n

eum — eum + y( • x£~1

END DO ai, arder + 2 = 5 U M

END DO

F IGURA 1 7 . 1 3 Pseudocódigo para ensamblar los elementos de las ecuaciones normal para regresión de polinomios.

Aunque las estrategias para disminuir el error de redondeo analizado en la parte tres, tal como el pivoteo, pueden ayudar a remediar en forma parcial este problema, una alternativa más simple es usar una computadora cotí más aira precisión. Por fortuna, la mayoría de los problemas prácticos están limitados a polinomios de orden inferior para los cuales el error de redondeo es insignificante. En situaciones donde se requieren versiones de orden superior, se dispone de otras alternativas para ciertos tipos de datos. Sin embargo, esas técnicas (tal como polinomios ortogonales) están más allá del alcance de este libro. El lector debería consultar textos sobre regresión, como el de Draper y Smith (1981), para información adicional con respecto al problema y posibles alternativas.

EJEMPLO 17.6 Regresión de polinomios por medio de la computadora

Enunciado del problema. En el software de Métodos Numéricos TOOLKIT adjunto a este libro se tiene un programa de computadora de uso amigable para implementar la regresión de polinomios. Se puede usar este software para el ajuste de polinomios con los siguientes datos:

X 2 4 5 6 6 7 9 1 0.5 7.5

y 6 2 3 7 8 8 1 5 3 7

Solución. Presione el ajuste de datos con el botón Curve sobre el menú principal del TOOLKIT para obtener una pantalla en blanco similar a la de la figura 17.14. Esta pan-

I talla contiene espacios para la entrada y salida de información necesaria para ajustar los I datos con un polinomio de regresión por mínimos cuadrados de nj-ésimo orden, J El primer paso es presionar los valores de entrada X contra Y en la tabla e introducir I hasta 100 pares de valores para X y Y. Después usted podría decidir graficar los datos

Page 155: Chapra12-20

484 REGRESIÓN POR MÍNIMOS CUADRADOS

Resolviendo estas ecuaciones con una técnica tal como la eliminación de Gauss se tiene a 0 = 2.47857, ax = 2.35929 y a2 — 1.86071. Por tanto, la ecuación cuadrática por mínimos cuadrados para este caso es

y = 2.47857 + 2.35929x + 1.86071* 2

El error estándar del estimado con base en la regresión de polinomios es [véase ecuación (17.20)]

3.74657 = 1.12

6 - 3 El coeficiente de determinación es

, 2513.39 - 3.74657 r2 = = 0.99851

2513.39 y el coeficiente de correlación es r = 0.99925.

Estos resultados indican que el 99.851% de la incertidumbre original la resolvió el modelo. Este resultado soporta la conclusión de que la ecuación cuadrática representa un excelente ajuste, como es también evidente de la figura 17.11.

17 .2 .1 Algor i tmo para regresión de pol inomios

Un algoritmo para regresión de polinomios es expuesto en la figura 17.12. Observe que la principal tarea es la generación de los coeficientes de las ecuaciones normal [véase ecuación (17.19)]. (El pseudocódigo para el cumplimiento de esto se halla presente en la figura 17.13.) Entonces, las técnicas de la parte tres se pueden aplicar para resolver estas ecuaciones simultáneas para los coeficientes.

Un problema potencial asociado con la implementación de regresión de polinomios en la computadora es que las ecuaciones normales algunas veces están mal condicionadas. Esto es en particular cierto para versiones de orden superior. Para esos casos, los coeficientes calculados podrían ser altamente susceptibles al error de redondeo y, en consecuencia, los resultados pueden ser inexactos. Entre otras cosas, este problema se relaciona con la estructura de las ecuaciones normal y por el hecho de que para los polinomios de orden superior las ecuaciones normales pueden tener coeficientes muy grandes y muy pequeños. Esto se debe a los coeficientes y sumatorias de los datos elevados a potencias.

F IGURA 1 7 . 1 2 Algoritmo para la implementación de polinomios y regresión lineal múltiple.

Paso 1 : Introduzca el orden del polinomio sujeto a ajuste, m. Paso 2 : Integre el número de datos, n. Paso 3 : Si n < m + 1, imprima un mensaje de error que indique que la regresión no es posible

y termine el proceso. Si n 5: m + 1, continúe. Paso 4 : Calcule los elementos de la ecuación normal en la forma de una matriz aumenlada. Paso 5 : Resuelva la matriz aumentada para los coeficientes o 0 , ai, a 7 , . . ., a,„, por medio do un

método de eliminación. P A S O 6 L Imprjma los coeficientes.

Page 156: Chapra12-20

17.2 REGRESIÓN DE POLINOMIOS 483

DO i = 1, order + 1 DOj = 1, i

k=i + j - 2 eum = 0 DOt =\n

eum = eum + >¿€ END DO a, • = eum ap = eum

END DO eum = 0 D0€ = 1,n

eum — eum + y( • x ¿ - ' END DO

ai. arder + 2= 5U™ END DO

F I G U R A 1 7 . 1 3 Pseudocódigo para ensamblar los elementos de las ecuaciones normal para regresión de polinomios.

Aunque las estrategias para disminuir el error de redondeo analizado en la parte tres, tal como el pivoteo, pueden ayudar a remediar en forma parcial este problema, una alternativa más simple es usar una computadora cor/ más alta precisión. Por fortuna, la mayoría de los problemas prácticos están limitados a polinprriios de orden inferior para los cuales el error de redondeo es insignificante. En situaciones donde se requieren versiones de orden superior, se dispone de otras alternativas para ciertos tipos de datos. Sin embargo, esas técnicas (tal como polinomios ortogonales) están más allá del alcance de este libro. El lector debería consultar textos sobre regresión, como el de Draper y Smith (1981), para información adicional con respecto al problema y posibles alternativas.

EJEMPLO 17 .6 Regresión de polinomios por medio de la computadora

Enunciado del problema. En el software de Métodos Numéricos TOOLKIT adjunto a este libro se tiene un programa de computadora de uso amigable para implementar la regresión de polinomios. Se puede usar este software para el ajuste de polinomios con los siguientes datos:

2 4 5 6 6 7 9 1 0.5 7.5

Solución. Presione el ajuste de datos con el botón Curve sobre el menú principal del TOOLKIT para obtener una pantalla en blanco similar a la de la figura 17.14. Esta pantalla contiene espacios para la entrada y salida de información necesaria para ajustar los datos con un polinomio de regresión por mínimos cuadrados de m-ésimo orden.

El primer paso es presionar los valores de entrada X contra Y en la tabla e introducir hasta 100 pares de valores para X y Y. Después usted podría decidir granear los datos

Page 157: Chapra12-20

486 RKMMIÓN POR MÍNIMOS CUADRADOS

solos antas de realizar decisiones con respecto al orden del polinomio. Esto se hace mediante un procedimiento similar al descrito en el ejemplo 2.1. La inspección de los datos muestra dos picos y sugiere que un polinomio de al menos cuarto orden sería el adecuado. Para nuestro ejemplo, primero intentaremos un polinomio de quinto orden. Simplemente introduzca un valor de 5 para el orden del polinomio y grafique los parámetros en el cuadro Entrada de parámetros y haga clic en los botones de red Cale y Plot (en el proceso cambian los botones a un color negro) para producir la figura 17.14. La forma para determinar el mejor orden se puede explorar al examinar cómo el error estándar varía como una función del orden de regresión. Los resultados para varios órdenes de regresión en el ajuste se tabula en la siguiente página:

F I G U R A 1 7 . 1 4 Pantalla del TOOLKIT de métodos numéricos para una regresión polinomial de quinto orden.

P^iwaete* ~ Valué :| OÍdet of Paíy h í Plot Xmtn 0

Delta X 1 Plot Ymin 0 Delta Y 1

liillli +

'i ' 1 2 6

3 2 4 2 , 3 5 3

4 6 7 5 6 8 6 7 8

, 7 9 1 8 1 5 9 .5 3

V. 10 7.5

I ;.>,;.«8SftÉ!£ ; ¿J.:. X - 3 * >, fiettift ,.. . . Wm...:, Y « 2.304472 Standard Erior 1 000334

Coef of Deter .3332087 Coir Coef .3660273

Oth oider coef -6.573234

J B É B J ' C S 3 Q 5 E 3 * ' C H C 3 - i m« i XMjml

F I G U R A 1 7 . 1 5 Gráfica de una regresión polinomial de octavo orden.

Vafc» Ordet of Poly 8 Plot Xmro 0 Delta X 1 1 Plot Ymin 0 Delta Y 1 i

lwputXv*¥Vafoe*

x v 1 2 6

i 2 4 2 í 3 5 3 1 4 6 7 í 5 6 8 1 6 7 . 8 Ü 7 9 1

8 1 5 9 .5 3

10 7 5 7

CafcYÍOT InputX

ftewft Vafe» ' Standatd Enot 1 154277 Coef of Detei .9777941

Con Coef .9888347 Oth order coef -1 057965 | £

Page 158: Chapra12-20

17.3 REGRESIÓN LINEAL MÚLTIPLE 487

Orden 2 3 A 6 /

Error estándar 2.71 2.69 2.34 1.38 1 . 0 0 1.12 1 . 1 7

Observe que el error estándar cae de manera dramática del orden 3 al 4 y alcanza un mínimo para el polinomio de orden 5. Esto sugiere que no se ha ganado mucho al gastar en esfuerzo de cómputo para ejecutar la regresión más alta que la de quinto orden.

La figura 17.15 muestra las gráficas para el caso de un octavo orden. Para este caso, los puntos extremo empiezan a ser un problema en una manera similar a la de la interpolación de orden superior (analizaremos este fenómeno con más detalle en el próximo capítulo). La figura 17.15 muestra que el polinomio de octavo orden produce valores de Y negativos para valores de X entre 8 y 9. Observe también en las figuras 17.14 y 17.15 que mientras las curvas de regresión siguen la tendencia de los datos, es altamente inapropiado extrapolar los valores Y más allá del rango de los datos para X.

La interpolación se puede ejecutar al introducir un valor en la tabla para X en el Cale Y para una X introducida. Por ejemplo, en X = 3, Y = 2.304472 como calculada con el polinomio de quinto orden (véase la figura 17.14).

Por último, demos un vistazo a la tabla de resultados en la parte derecha inferior. Los primeros tres resultados son resúmenes estadísticos de la regresión: error estándar, coeficiente de determinación y coeficiente de correlación. Observe cómo esos valores cambian para diferentes órdenes de regresión. La barra de despliegue sobre la tabla de resultados se usa para observar los coeficientes reales de la regresión de polinomios. De nuevo, esos valores cambian con diferentes órdenes.

Una extensión útil de la regresión lineal es el caso donde y es una función lineal de dos o más variables independientes. Por ejemplo, y podría ser una función lineal de xl y x2, como en

y = c?o + «i A'i + a2X2 + e Tal ecuación es en particular útil cuando se ajustan datos experimentales donde la variable sujeta a estudio es a menudo una función de otras dos variables. Para este caso en dos dimensiones, ta "línea" de regresión pasa a ser un "plano" (véase la figura 17.16).

Como en los casos anteriores, los "mejores" valores de los coeficientes son determinados al realizar la suma de los cuadrados de los residuos,

R E G R E S I Ó N L I N E A L M Ú L T I P L E

(17.21)

y diferenciando con respecto a cada uno de los coeficientes desconocidos,

Page 159: Chapra12-20

488 REGRESIÓN POR MÍNIMOS CUADRADOS

F IGURA 1 7 . 1 6 Ilustración gráfica de regresión lineal múltiple donde yes una función lineal de x, y x 2 .

dSr

3(3? = - 2 ^ x 2 / (y, - í/0 - a i x a ~ « 2 * 2 / )

Los coeficientes dan la suma mínima de los cuadrados de los residuos y se obtienen al igual las derivadas parciales a cero y expresando el resultado en forma de matriz como

n Ex,/ E x 2 í Exi,-x2 l

E x 2 /

Ex2,. T,xi¡x2¡ E x 2

a0 Ey,-ai = • Exi,y,-a2 Sx 2 í y, '

(17.22)

¡EJEMPLO 1 7 . 7 Regresión lineal múltiple

Enunciado del problema. Los siguientes datos se calcularon con la ecuación y = 5 + 4x, — 3x 2:

x l X2 y

0 0 5 2 1 10 2.5 2 9 1 3 0 4 6 3 7 2 27

Use regresión lineal múltiple para ajustar estos datos.

Page 160: Chapra12-20

17.3 REGRESIÓN LINEAL MÚLTIPLE

Solución. Las sumatorias requeridas para desarrollar la ecuación (17.22) se calculan en la tabla 17.5. El resultado es

6 16.5 14 16.5 76.25 48 14 48 54

la cual se puede resolver mediante un método como el de eliminación de Gauss para

ao = 5 ai = 4 a2 = — 3

que es consistente con la ecuación original a partir de la cual los datos se derivaron.

T A B L A 17 .5 Cálculos requeridos para desarrollar las ecuaciones normal para el ejemplo 17.7.

y * i X2 X 2 A x , x 2 * i y x 2 y

5 0 0 0 0 0 0 0 10 2 1 4 i 2 20 10 9 2.5 2 6.25 4 5 22.5 18 0 1 3 1 9 3 0 0 3 4 6 16 36 24 12 18

27 7 2 49 4 14 189 54

1 54

16.5 14 76.25 54 48 243.5 100

a0 54 a\ • = • 243.5 a2 100

El caso anterior en dos dimensiones se puede fácilmente extender a m dimensiones, como en

y = an + a\X\ + a2x2 -| Y amxm + e

donde el error estándar se formula como

S y , X ~\¡n-(m + l)

y el coeficiente de determinación se calcula como en la ecuación (17.10). En la figura 17.17 se enlista un algoritmo para preparar las ecuaciones normal.

Aunque hay ciertos casos donde una variable está linealmente relacionada con otras dos o más variables, la regresión múltiple tiene utilidad adicional en la derivación de ecuaciones de potencias de la forma general

y=a0x1

1x2

2---xm"

Tales ecuaciones son extremadamente útiles cuando se ajustan datos experimentales. Para usar regresión lineal múltiple, la ecuación se transforma al tomar su logaritmo para obtener

log y = log üo + a\ log x\ + a2 log xj-i Y am log xm

Page 161: Chapra12-20

REGRESIÓN POR MÍNIMOS CUADRADOS

DOI = 1, order + 1 DOj = 1, i

eum — 0 DOÍ= 1,n

eum = eum + x¡-^( • XJ-K

END DO au = eum a-s — eum

END DO eum — 0 DOl = \,n

eum = eum + ye • x¡_1(

END DO A¡,CRDER+2 = 5 U M

END DO

F I G U R A 1 7 . 1 7 Pseudocódigo para ensamblar los elementos de las ecuaciones normal para regresión múltiple. Observe que además de guardar las variables independientes en X ] , x 2 ¡, etcétera, los 1 se deben guardar en XQ ,• para trabajar este algoritmo.

Esta transformación, es similar en esencia a la que se usó en la sección 17.1.5 y en el ejemplo 17.4 para ajustar a una ecuación por potencias cuandoy fue una función de una sola variable x. La sección 20.4 proporciona un ejemplo de tal aplicación para dos variables independientes.

1 7 . 4 F O R M A G E N E R A L L I N E A L P O R M Í N I M O S C U A D R A D O S

Hasta este punto nos hemos concentrado en la mecánica de obtención de ajustes por mínimos cuadrados para algunas funciones simples con datos. Antes de cambiar a regresión no lineal, hay varios puntos que nos gustaría analizar para enriquecer nuestra comprensión del material precedente.

17 .4 .1 Formulación general de una mat r i z para mín imos cuadrados lineales

En páginas anteriores hemos introducido tres tipos de regresión: lineal simple, polinomial y lineal múltiple. De hecho, estas tres pertenecen al siguiente modelo general de mínimos cuadrados lineales:

y — a r j z o + a \ z \ + a 2 z 2 ^ 1" amzm + e (17.23)

donde z 0 , z , , . . . , zm son las m + 1 funciones diferentes. Se puede ver con facilidad cómo la regresión lineal simple y múltiple encajan dentro de este modelo; es decir z ( ) — 1, z, j C | , z 2 = x2, • •., z„, = xm. Además, la regresión de polinomios se incluye también si Iris ; son monomios simples como en z 0 = xü — I , z, = x, Z 2 = x2,..., Z M — x"1.

Page 162: Chapra12-20

Observe que la terminología "lineal" se refiere sólo a la dependencia del modelo sobre sus parámetros (es decir, las a). Como en el caso de regresión de polinomios, las mismas funciones pueden ser altamente no lineales. Por ejemplo, las z pueden ser sinusoidales, como en

y = a0 + a, eos (coi) + a2 sen (coi) Tal formato es la base del análisis de Fourier descrito en el capítulo 19.

Por otro lado, un modelo de apariencia simple como

f(x) = a0 (1 - e-"'*)

es ciertamente no lineal porque no puede ser manejado en el formato de la ecuación (17.23). Regresaremos a tales modelos al final de este capítulo.

Mientras tanto, la ecuación (17.23) se puede expresar en notación matricial como

{Y} = [Z]{A] + {E} (17.24)

donde [2] es una matriz de los valores calculados de las funciones z en los valores medidos de las variables independientes,

[Z] =

Z 0 2 Zl2

Zrj« z l «

zm 1 zm2

donde m es número de variables en el modelo y n es el número de datos. Como n>m + 1, usted debería reconocer que la mayoría de las veces [Z] no es una matriz cuadrada.

El vector columna {Y} contiene los valores observados de la variable dependiente

{Y}T = [yi yi ••• y„J El vector columna {A} contiene los coeficientes desconocidos

{A}T — [a0 a¡ ••• a m \

y el vector columna {E} contiene los residuos

[E}T = \_e\ e2 ••• e„ \

Como se realizó a través de este capítulo, la suma de los cuadrados de los residuos para este modelo se pueden definir como

n / m \ 2 Sr = Y,\x-Y,a¡zA i = \ \ j=0 I

Esta cantidad se puede minimizar al tomar su derivada parcial con respecto a cada uno de los coeficientes y fijar los resultados de la ecuación igual a cero. La salida de este proceso son las ecuaciones normal que se pueden expresar brevemente en forma de matriz como

Page 163: Chapra12-20

492 REGRESIÓN POR MÍNIMOS CUADRADOS

[lZ]r[Z]]{A} = {[Z]T{Y}} (17 .25)

Se puede demostrar que la ecuación (17.25) es, de hecho, equivalente a las ecuaciones normal desarrolladas antes para regresión lineal simple, polinomial y múltiple.

Nuestra principal motivación para las anteriores ha sido ilustrar la unión entre los tres procedimientos y mostrar cómo se pueden expresar de manera simple en la misma notación matricial. También acondiciona la etapa para la siguiente sección donde asimilaremos algo de conocimiento en las estrategias preferidas para resolver la ecuación (17.25). La notación matricial tendrá también relevancia cuando veamos regresión no lineal en la última sección de este capítulo.

17 .4 .2 Técnicas de solución

En los análisis anteriores en este capítulo hemos encubierto el tema de las técnicas numéricas específicas para resolver las ecuaciones normales. Ahora que hemos establecido la unión entre los diversos modelos, podemos explorar esta cuestión con mayor detalle.

Primero, debería quedar claro que Gauss-Seidel no puede usarse aquí debido a que las ecuaciones normal no son diagonalmente dominantes. De esta manera dejamos a un lado los métodos de eliminación. Para los actuales propósitos, podemos dividir esas técnicas en tres categorías: 1) métodos de descomposición LU, incluyendo eliminación de Gauss, 2) método de Cholesky y 3) procedimiento de inversión de matrices. Obviamente hay traslapes en esta clasificación. Por ejemplo, el método de Cholesky es, de hecho, una descomposición L U, y todos los procedimientos se pueden formular de tal forma que pueden generar la matriz inversa. Sin embargo, esta clasificación tiene su mérito en cada categoría y ofrece beneficios con respecto a la solución de las ecuaciones normales.

Descomposición LU. Si usted está interesado sólo en aplicar un ajuste por mínimos cuadrados para el caso donde se conoce de antemano el modelo adecuado, cualquiera de los procedimientos de descomposición LU descritos en el capítulo 9 son perfectamente aceptables. De hecho, se puede también emplear la formulación de una descomposición no L t /de eliminación de Gauss. Ésta es una tarea de programación relativamente directa para incorporar cualquiera de estos procedimientos en un algoritmo de mínimos cuadrados lineales. De hecho, si se ha seguido un enfoque modular, esto es casi trivial.

Método de Cholesky. El algoritmo de descomposición de Cholesky tiene varias ventajas con respecto a la solución del problema general de regresión lineal. Primero, está expresamente diseñado para resolver matrices simétricas como las ecuaciones normal. De este modo, es rápido y requiere menos espacio de almacenamiento para resolver tales sistemas. Segundo, es idealmente adecuado para casos donde el orden del modelo [es decir, el valor de m en la ecuación (17.23)] no es conocido de antemano (véase Ralston y Rabinowitz, 1978). Un caso sujeto a tratamiento sería la regresión de polinomios. Para este caso, podríamos saber a priori si un polinomio lineal cuadrático, cúbico o de orden superior es el "mejor" modelo para describir nuestros datos. Debido tanto a la forma en la cual las ecuaciones normales se construyen como a la manera en la que procede el algoritmo de Cholesky (véase figura 11.3), podemos desarrollar en forma sucesiva modelos de orden superior de un modo en extremo eficiente. En cada paso podríamos examinar la suma residual del error de los cuadrados (¡y una gráfica!) para examinar si la inclusión de términos de orden superior mejoran de manera significativa el ajuste.

Page 164: Chapra12-20

i fA F O R M A GENERAL LINEAL POR MÍNIMOS CUADRADOS

493

La situación análoga para regresión lineal múltiple ocurre cuando se agregan variu-bles independientes, una a la vez, al modelo. Suponga que la variable dependiente de interés es una función de un número de variables independientes: por ejemplo, temperatura, contenido de humedad, presión, etcétera. Podríamos primero realizar una regresión lineal con la temperatura y calcular un error residual. En seguida se podría incluir el contenido de humedad para realizar una regresión múltiple de dos variables y ver si la variable adicional resulta en una mejora al ajuste. El método de Cholesky hace eficiente el proceso, ya que la descomposición del modelo lineal podría solamente ser añadido al incorporar una nueva variable.

Procedimiento de la matriz inversa. De la ecuación (PT3.6), recuerde que la matriz inversa se puede emplear para resolver la ecuación (17.25), como en

{A} = [[Z]T[Z]YL {[Z]T{Y}} (17.26)

Cada uno de los métodos de eliminación se puede usar para determinar la inversa y, así, pueden ser usados para implementar la ecuación (17.26). Sin embargo, como aprendimos en la parte tres, éste es un enfoque ineficiente para resolver un conjunto de ecuaciones simultáneas. Así, si estuviéramos justamente interesados en resolver los coefientes de regresión, es preferible utilizar la aproximación de descomposición LU sin inversión. No obstante desde una perspectiva estadística, hay un número de razones por las cuales podríamos estar interesados en obtener la inversa y examinar sus coeficientes. Esas razones se analizarán después.

17.4.3 Aspectos estadísticos de la teoría de mín imos cuadrados

En la sección PT5.2.1, revisamos un número de estadística descriptiva que puede usarse para describir una muestra. Aquéllas incluyen la media aritmética, la desviación estándar y la varianza.

Además de obtener una solución para los coeficientes de regresión, la formulación de la matriz de la ecuación (17.26) proporciona estimaciones de su estadística. Se puede demostrar (Draper y Smith, 1981) que la diagonal y los términos fuera de la diagonal de la matriz [[Z]T [ Z ] ] _ 1 dan, respectivamente, las varianzas y las covarianzas1 de las a. Si los elementos de la diagonal de [[Z]r [Z]]~1 son designados como z j l , entonces

var (ai-i) = zj¡l52

y/x (17-27)

y

cov (ai-i,aj)=zr}ijs*/x ( 1 7 2 g )

Estas estadísticas poseen un número de aplicaciones importantes. Para nuestros actuales propósitos, ilustraremos cómo se pueden usar para desarrollar intervalos de confianza para el intercepto y la pendiente.

'Lacovarianza es una estadística que mide la dependencia de una variable con otra. As i , cov (x,y) indica la dependencia ácxy y. Por ejemplo, cov (x,y) 0 podría indicar queje y y son totalmente indcpcndienlo».

Page 165: Chapra12-20

494 REGRESIÓN POR MÍNIMOS CUADRADOS

Mediante un enfoque similar al visto en la sección l'T'5.2.3, se puede demostrar que los límites inferior y superior del intercepto se pueden formular como (véase Milton y Arnold 1995 para más detalles)

<•><) — ta/2.,¡-2 í(«o) U = fln + í a / 2 . H - 2 - V ( « ( ) ) (17.29)

donde s(a¡) — error estándar del coeficiente a- = K vai(ap. De manera similar, los límites inferior y superior de la pendiente se pueden formular como

L — a\ - ta/2.„-is(a\) U = a\+tai2.n-2s(ci\) (17.30)

El siguiente ejemplo ilustra cómo esos intervalos se pueden usar para hacer inferencias cuantitativas relacionadas con la regresión lineal.

EJEMPLO 17.8 Intervalos de confianza para regresión lineal

\ Enunciado del problema. En el ejemplo 17.3 usamos regresión para desarrollar la i siguiente relación entre mediciones y predicciones del modelo:

j y = - 0 . 8 5 9 + 1.032x

i donde y = predicciones del modelo y x = mediciones. Concluimos que había una buena S concordancia entre los dos debido a que el intercepto fue aproximadamente igual a 0 y la i pendiente, a 1. Recalcule la regresión pero ahora use la aproximación matricial para i estimar los errores estándar de los parámetros. Después emplee esos errores para desa-j rrollar los intervalos de confianza y úselos para hacer declaraciones probabilísticas con i respecto a la bondad del ajuste. ¡ ] Solución. Los datos se pueden escribir en un formato matricial para regresión lineal j simple como:

[ Z ] =

Se puede entonces usar la transposición y multiplicación de la matriz para generar las ecuaciones normal como

" 1 10 " 8.953 1 16.3 16.405 1 23 22 .607

\Y) =

1 50 49 .988

[ÍZ]T[Z]] {A} = {ÍZ]T{Y}}

15 548 .3 f 552 .741 548.3 22191.21 _ [ 22421 .43

La inversión de la matriz puede ser usada para obtener la pendiente e intercepto como

[A}= [íZflZ]]

0 .688414 - 0 . 0 1 7 0 1 - 0 . 0 1 7 0 1 0 .000465

{[Z]r{Y)

552.741 22421.43

- 0 . 8 5 8 7 2 1.031592

Page 166: Chapra12-20

I i i

I i, i

17.4 FORMA GENERAL LINEAL ruK /vuNimt» wmmwww» De esta manera, el intercepto y la pendiente se determinan como aQ = — 0.85872 y <7| » 1.031592, respectivamente. Estos valores a su vez se pueden usar para calculnr el error estándar del estimado como s /x = 0.863403. Este valor puede utilizarse junto con los elementos diagonal de la matriz inversa para calcular los errores estándar de los coeficientes,

La estadística, í n-i necesaria para un 95% de intervalo de confianza con n — 2 = 15 — 2= 13 grados de libertad puede ser determinada de una tabla estadística o mediante software. Usamos una función de Excel, TINV, para obtener el valor adecuado, como en

= TINV(0.05, 13) la cual da un valor de 2.160368. Las ecuaciones (17.29) y (17.30) se pueden entonces usar para calcular los intervalos de confianza como

a0 = -0.85872 ± 2.160368(0.716372) = -0.85872 ± 1.547627 = [-2.40634, 0.688912]

a, = 1.031592 ±2.160368(0.018625) = 1.031592 ± 0.040237 = [0.991355, 1.071828]

Observe que los valores deseados (0 para el intercepto y pendiente, y 1 para el intercepto) están dentro de los intervalos. Sobre la base de este análisis podríamos hacer las siguientes declaraciones con respecto a la pendiente: tenemos fuertes fundamentos para pensar que la pendiente de la línea de regresión real está dentro del intervalo de 0.991355 a 1.071828. Debido a que 1 está dentro de este intervalo, tenemos también bases fuertes para creer que el resultado soporta la concordancia entre las mediciones y el modelo. Como cero está dentro del intervalo del intercepto, una declaración similar se puede hacer con respecto del intercepto.

Lo anterior es una introducción limitada al enriquecedor tema de la inferencia estadística y su relación con la regresión. Hay muchas más que están lejos del alcance de este libro. Nuestra principal intención ha sido mostrar el poder del enfoque matricial al ajuste general lineal por mínimos cuadrados. Usted debería consultar algunos de los excelentes libros sobre el tema (por ejemplo, Draper y Smith 1981) para información adicional. Además, debería observar qué paquetes de software y librerías pueden generar ajustes de regresión por mínimos cuadrados junto con información relevante para la estadística inferencial. Exploraremos algunas de esas capacidades cuando se describan esos paquetes al final del capítulo 19.

Page 167: Chapra12-20

496 REGRESIÓN POR MÍNIMOS CUADRADOS

1 7 . 5 R E G R E S I Ó N N O L I N E A L

Hay muchos casos en ingeniería donde modelos no lineales deben ser ajustados con datos. En el contexto actual, esos modelos se definen como aquellos que tienen dependencia no lineal de sus parámetros. Por ejemplo,

Esta ecuación no puede ser manejada de acuerdo con el formato general de la ecuación

Como se hizo con los mínimos cuadrados lineales, la regresión no lineal se basa en la determinación de los valores de los parámetros que minimizan la suma de los cuadrados de los residuos. Sin embargo, para el caso no lineal, la solución debe proceder en una forma iterativa.

El método de Gauss-Newton es un algoritmo para minimizar la suma de los cuadrados de los residuos entre datos y ecuaciones no lineales. El concepto clave que resalta la técnica es que una expansión por serie de Taylor se usa para expresar la ecuación no lineal original en una forma lineal aproximada. Entonces, la teoría de mínimos cuadrados se puede usar para obtener nuevas estimaciones de los parámetros que se mueven en la dirección de minimizar el residuo.

Para ilustrar cómo se hace esto, primero se puede expresar de manera general la relación entre la ecuación no lineal y los datos como

y¡ - f {x¡; ao, a u . . . , am) + e¡

dondey¡ = valor medido de la variable dependiente,/"^,; a0, ax,..., am) = ecuación que es una función de la variable independiente x¡ y una función no lineal de los parámetros a0, at,..., am, y e, = error aleatorio. Por conveniencia, este modelo se puede expresar de forma abreviada al omitir los parámetros,

El modelo no lineal puede ser expandido dentro de una serie de Taylor alrededor de valores de parámetro y reducido después de las primeras derivadas. Por ejemplo, para un caso de dos parámetros

(17.31)

(17.23).

(17.32)

/(*;),-+, - f(x¡)j + df(x¡\

da0 j Aa0 + a / t a ) .

(17.33)

donde j = son los valores iniciales, j + 1 = predicción, Aa 0 = « 0 j+i ~~ aoj> y = aij+i ~ aij- ^ e esta forma, hemos linearizado el modelo original con respecto a los parámetros. La ecuación (17.33) se puede sustituir en la (17.32) para obtener

o en forma matricial [compárela con la ecuación (17.24)],

\i>\ = [ / , J | A / \ ¡ , ( / : ¡ (17.34)

Page 168: Chapra12-20

donde [Z¡\ es la matriz de las derivadas parciales de la función evaluada en el valor inicial y,

[Z,] =

dfi/dao dfi/dcn 3/ 2 /3ao df2/dai

df„/da0 dfn/dax donde n = número de datos y df¡/dak = derivada parcial de la función con respecto al k-ésimo parámetro evaluado en el /-ésimo punto. El vector {£>} contiene las diferencias entre las mediciones y los valores de la función,

y\ - f(x\) >'2 - f(x2)

¡D} =

y„ - f(x„)

y el vector {AA} contiene los cambios en los valores de los parámetros,

Arto Aa\ {AA} =

Aa„ Si se aplica la teoría de mínimos cuadrados lineales a la ecuación (17.34) resulta en las siguientes ecuaciones normal [recuerde la ecuación (17.25)]:

[[ZJ]T[ZJ}]{AA} = {[Z/]T{D}} (17.35)

Así, el procedimiento consiste en resolver la ecuación (17.35) para {A/4}, la cual se puede emplear para calcular valores mejorados para los parámetros, como en

a0j+i = OQJ + AaQ y

Este procedimiento se repite hasta que la solución converge (es decir, hasta)

\S„h = ak,j+\ 100% (17.36)

está por debajo de un criterio de paro aceptable.

Page 169: Chapra12-20

498 REGRESIÓN POR MÍNIMOS CUADRADOS

EJEMPLO 17.9 Método de Gauss-Newton

I Enunciado del problema. Ajuste la función f(x;a0, «,) = a0( 1 ) con los dalos:

X 0,25 0.75 1.25 1.75 2.25

y 0.28 0.57 0.68 0.74 0.79

Use los valores iniciales de a0 = 1.0 y ax = 1.0 para los parámetros. Observe que para estos valores la suma inicial de los cuadrados de los residuos es 0.0248.

Solución. Las derivadas parciales de la función con respecto a los parámetros son

da o = 1

= aQje

(E17.9.1)

(E17.9.2)

Las ecuaciones (E17.9.1) y (E17.9.2) se pueden usar para evaluar la matriz

[Z0] =

0.2212 0.1947 0.5276 0.3543 0.7135 0.3581 0.8262 0.3041 0.8946 0.2371

Esta matriz multiplicada por su traspuesta resulta en

'2.3193 0.9489" 0.9489 0.4404 [Z0]r[Z0]

mi de nueve

[[Z0]r[Zo]p = la cual de nuevo se puede invertir para dar

3.6397 -7.8421 -7.8421 19.1678

El vector {D} consiste en las diferencias entre las mediciones y las predicciones del modelo,

0.28 -0 2212 ' 0.0588 0.57 -0 5276 0.0424 0.68 -0 7135 . — , -0.0335 0.74 -0 8262 -0.0862 0.79 -0 8946 -0.1046

{D} =

Ésta es multiplicada por [Z0]T para obtener

¡Z()]T{D}

oí -0.1533 -0.0365

Page 170: Chapra12-20

17.5 REGRESIÓN NO LINEAL m El vector {AA} es entonces calculado al resolver la ecuación (17.35) para

AA = - 0 . 2 7 1 4 0 .5019

la cual puede ser agregada al parámetro inicial supuesto para dar

I «o

I 1.0 1.0 + I

- 0 . 2 7 1 4 0.5019 i 0.7286

1.5019 1 Así, las estimaciones mejoradas de los parámetros son a0 = 0.7286 y ax = 1.5019. Los nuevos parámetros resultan en una suma de los cuadrados de los residuos igual a 0.0242. La ecuación (17.36) se puede usar para calcular £Q y ex igual a 37 y 33%, respectivamente. El cálculo podría repetirse hasta que esos valores estén abajo del criterio de paro preescrito. El resultado final es a0 = 0.79186 y a, = 1.6751. Estos coeficientes dan una suma de los cuadrados de los residuos de 0.000662.

Un problema potencial con el método de Gauss-Newton como se ha desarrollado hasta ahora es que las derivadas parciales de la función pueden ser difíciles de evaluar. En consecuencia, muchos programas de computadora usan diferentes ecuaciones para aproximar las derivadas parciales. Un método es

dfi ^ f(x¡; a0,...,ak+ Sak, . . . , a m ) - f{x¡\a0, ..., ak,..., am)

dak 5ak

donde 8 = perturbación fraccional pequeña. El método de Gauss-Newton tiene una variedad de otros posibles defectos:

1. Puede converger con lentitud. 2. Puede oscilar ampliamente; es decir, cambia en forma continua de dirección. 3. Puede no converger.

Se han desarrollado modificaciones del método (Booth y Peterson, 1958; Hartley, 1961) para remediar los defectos.

Además, aunque hay varios procedimientos expresamente diseñados para regresión, uno más general es usar rutinas de optimización no lineal como las descritas en la parte cuatro. Para hacer esto, se hace una suposición de los parámetros, y se calcula la suma de los cuadrados de los residuos. Por ejemplo, para la ecuación (17.31) esto se podría calcular como

Entonces, los parámetros se podrían ajustar de manera sistemática para minimizar Sr

mediante técnicas de búsqueda descritas previamente en el capítulo 14. Ilustraremos el modo para hacer esto cuando describamos las aplicaciones del software al final del capí-

(17.38)

tulo 19.

Page 171: Chapra12-20

REGRESIÓN POR MÍNIMOS CUADRADOS

P R O B L E M A S

17.1 Dados los datos

0.90 1.42 1.30 1.55 1.63 1.32 1.35 1.47 1.95 1.66 1.96 1.47 1.92 1.35 1.05 1.85 1.74 1.65 1.78 1.71 2.29 1.82 2.06 2.14 1.27

determine a) la media, b) la desviación estándar, c) la varianza, d) el coeficiente de variación y e) el intervalo de confianza al 95% para la media. 17.2 Construya un histograma para los datos del problema 17.1. Use un rango de 0.6 a 2.4 con intervalos de 0.2. 17.3 Con los datos

15 6 18 21 26 28 32 39 22 28 24 27 27 33

2 12 17 34 29 31 38 45 36 41 37 43 38 26

determine a) la media, b) la desviación estándar, c) la varianza, d) el coeficiente de variación y é) el intervalo de confianza al 90% para la media./) Construya un histograma. Use un rango de 0 a 55 con incrementos de 5. g) Suponga que la distribución es normal y que su estimación de la desviación estándar es válida, calcule el rango (esto es, los valores inferior y superior) que abarquen el 68% de las lecturas. Determine si esto es una estimación válida para los datos en este problema. 17.4 Use la regresión por mínimos cuadrados para ajustar a una línea recta a

X l 3 7 10 12 13 16 18 20

y 4 5 6 5 8 7 6 9 12 11

Junto con la pendiente y el intercepto, calcule el error estándar del estimado y el coeficiente de correlación. Grafique los datos y la línea de regresión. Después repita el problema, pero ahora haga la regresión de x contra y (es decir, cambie las variables). Interprete sus resultados. 17.5 Use regresión por mínimos cuadrados para ajustar una línea recta a

X 5 6 10 14 16 20 22 28 28 36 38

30 22 28 14 22 16 8 8 14 0 4

Junto con la pendiente y el intercepto, calcule el error estándar del estimado y el coeficiente de correlación. Grafique los datos y la línea de regresión. Si alguien hizo una medición adicional de x = 5, y = 5, ¿podría usted esperar, con base en un asegura

miento visual y en el error estándar, que la medición fue válida o fallida? Justifique su conclusión. 17.6 Use regresión por mínimos cuadrados para ajustar una línea recta a

x 2 3 4 7 8 9 5 5

y I 9 6 5 K) 9 ñ 2 3

a) Junto con la pendiente y el intercepto, calcule el error estándar de la estimación y el coeficiente de correlación. Grafique los datos y la línea recta. Valide el ajuste.

b) Recalcule a), pero ahora use regresión polinomial para ajustar los datos a una parábola. Compare los resultados con aquellos de a).

17.7 Ajuste un modelo de razón de crecimiento saturado con

X 0.75 2 2.5 4 6 8 8.5

y 0.8 1.3 1.2 1.6 1.7 l . í 3 1.7

Grafique los datos y la ecuación. Encuentre el error estándar. 17.8 Ajuste los datos del problema 17.7 a una ecuación de potencias. Grafique los datos y la ecuación y encuentre el error estándar. 17.9 Adecúe los datos del problema 17.7 a una parábola. Grafique los datos y la ecuación y encuentre el error estándar. 17.10 Ajuste los siguientes datos a una ecuación de potencias

X 2.5 3.5 5 6 7.5 10 12.5 15 17.5 20

/ 7 5.5 3.9 3.6 3.1 2.8 2.6 2.4 2.3 2.3

Grafique y contra x junto con la ecuación de potencias. 17.11 Adecué los siguientes datos a un modelo exponencial

X 0.4 0.8 1.2 1.6 2.0 2.3

y 750 1 000 1 400 2 000 2 700 3 750

Grafique los datos y la ecuación en papel estándar así como en gráfico logarítmico. Analice sus resultados. 17.12 Ajuste los datos del problema 17.11 a una parábola. Grafique los datos y la ecuación. 17.13 Con los datos

X 5 10 15 20 25 30 35 40 45 50

y 16 25 32 33 38 36 39 40 42 42

use regresión por mínimos cuadrados para ajustar a) a una línea recta, b) a una ecuación de potencias, c) a una ecuación de razón de crecimiento saturado y d) a una parábola. Grafique los datos junto con todas las curvas. ¿Es superior alguna de las curvas? Si es así, justifique.

Page 172: Chapra12-20

PROBLEMAS 5 0 1

17.14 Use regresión lineal múltiple para ajustar

x, 0 1 1 2 2 3 3 4 4

0

y 15 18 12.8 25.7 20.6 35.0 29.8 45.5 40.3

Calcule los coeficientes, el error estándar del estimado y el coeficiente de correlación. 17.15 Use regresión lineal múltiple para ajustar

0 0 1 2 0 1 2 2 1

x 2 0 2 2 4 4 6 ó 2 1

y 15 19 12 11 24 22 15 5 19

Calcule los coeficientes, el error estándar del estimado y el coeficiente de correlación.

17.16 Use regresión no lineal para ajustar los siguientes datos a una parábola

y

0.075 0.5 1.2 1.7 2.0 2.3

600 800 1 200 1 400 2 050 2 650 3 750

17.17 Use regresión no lineal para ajustar los datos del problema 17.13 a una ecuación de razón de crecimiento saturado. 17.18 Recalcule el ajuste por regresión de los problemas a) 17.4 y b) 17.13 mediante el procedimiento de la matriz. Estime los errores estándar y desarrolle intervalos de confianza al 90% para la pendiente y el intercepto. 17.19 Desarrolle, depure y pruebe un subprograma en ya sea un lenguaje de alto nivel o en lenguaje macro de su elección para implementar regresión lineal. Entre otras cosas: a) Agregue comentarios para documentar el código y b) determine el error estándar y el coeficiente de determinación. 17.20 Use el software de Métodos Numéricos TOOLKIT para resolver los problemas a) 17.4, b) 17.5,c) 17.6, d) 17.9 ye) 17.12.

Page 173: Chapra12-20

CAPÍTULO 18

Interpolación

Usted a menudo habrá tenido la oportunidad de estimar valores intermedios entre datos precisos. El método más común que se usa para este propósito es la interpolación del polinomio. Recuerde que la fórmula general para un polinomio de n-ésimo orden es

f(x) = a0 + aix + a2x2 + •••+ anx" (18.1)

Para n + 1 puntos, hay uno y sólo ún polinomio de orden n que pasa a través de todos los puntos. Por ejemplo, hay sólo una línea recta (es decir, un polinomio de primer orden) que conecta dos puntos (vea la figura 18.1a). De manera similar, únicamente una parábola conecta un conjunto de tres puntos (ver figura 18.1Z>). Interpolación polinomial consiste en determinar el único polinomio de n-ésimo orden que ajuste n + 1 puntos. Este polinomio entonces proporciona una fórmula para calcular valores intermedios.

Aunque hay uno y sólo un polinomio de n-ésimo orden que ajusta n + 1 puntos, existe una variedad de formatos matemáticos en los cuales este polinomio puede expresarse. En este capítulo describiremos dos alternativas que son muy adecuadas para la implementación en computadora: los polinomios de Newton y de Lagrange.

F IGURA 18 .1 Ejemplos de interpolación polinomial: a] de primer orden [lineal) conectando dos puntos, b) de segundo orden (cuadrática o parabólica) enlazando tres puntos y c) de tercer orden (cúbica) conectando cuatro puntos.

a) b) c)

Page 174: Chapra12-20

18.1 DIFERENCIA DIVIDIDA DE NEWTON PARA LA INTERPOLACIÓN 503

1 8 . 1 D I F E R E N C I A D I V I D I D A D E N E W T O N P A R A L A I N T E R P O L A C I Ó N DE P O L I N O M I O S

Como se mencionó antes,'existe una variedad de formas alternativas para expresar una interpolación de un polinomio. La diferencia dividida de Newton para la interpolación de polinomios está entre los modelos más populares y útiles. Antes de presentar la ecuación general, introduciremos la primera y segunda versión debido a su interpretación visual simple.

18.1 .1 Interpolación lineal

El modo más simple de interpolación es conectar dos puntos con una línea recta. Esta técnica, llamada interpolación lineal, se ilustra en forma gráfica en la figura 18.2. Mediante triángulos semejantes,

/ l ( - r ) ~ / ( S o ) = / ( * ! ) - / ( * » ) s

X — XQ X\ — Xo la cual se puede reordenar para dar

/ ,(*) = /(%> + / ( j C l ) ~ / ( X o ) (* - %> (18-2)

que es una fórmula de interpolación lineal. La notación f(x) designa que es una interpolación de polinomios de primer orden. Observe que además de representar la

FIGURA 18.2 Ilustración gráfica de interpolación lineal. Las áreas sombreadas indican los triángulos semejantes usados para obtener la fórmula de interpolación lineal [véase la ecuación! 1 8.2)]

AQ X X-\ X

Page 175: Chapra12-20

rrvrcKruLACTurN

pendiente de la línea que conecta los puntos, el término \f(xx) — f(x0)]/(xx — x 0 ) es una aproximación por diferencia dividida finita de la primera derivada [recuerde la ecuación (4.17)]. En general, cuanto más pequeño sea el intervalo de datos, mejor será la aproximación. Esto se debe al hecho de que, en tanto el intervalo disminuya, una función continua se aproximará mejor por una línea recta. Esta característica se demuestra en el siguiente ejemplo.

EJEMPLO 18.1 Interpolación lineal

Enunciado del problema. Estime el logaritmo natural de 2 mediante interpolación lineal. Primero, realice el cálculo por interpolación entre ln 1 = 0 y ln 6 = 1.791759. Después, repita el procedimiento, pero use un intervalo más pequeño de ln 1 a ln 4 (1.386294). Observe que el valor real de ln 2 es 0.6931472.

Solución. Usaremos la ecuación (18.2) y una interpolación lineal para ln(2) de x0 = 1 a X] = 6 para dar

1 791759 - 0 /,(2) = 0 + — (2 - 1) = 0.3583519

6 — 1

que representa un error de et = 48.3%. Con el intervalo más pequeño de, x0 = 1 a xx = 4 se obtiene

/ , ( 2 ) = 0 +

L 3 8

4

6 ^ - ° (2 - 1 ) = 0.4620981

Así, con el intervalo más corto se reduce el error relativo porcentual a et — 33.3%. Ambas interpolaciones se muestran en la figura 18.3, junto con la función real.

F I G U R A 1 8 . 3 Dos interpolaciones lineales para estimar ln 2. Observe cómo el intervalo más pequeño proporciona una mejor estimación.

f(x) = ln j f .

Estimaciones lineales

l i l i l í

Page 176: Chapra12-20

18.1 DIFERENCIA DIVIDIDA DE NEWTON PARA LA INTERPOLACIÓN 5 0 5

1 8 . 1 . 2 Interpolación cuadrática

El error en el ejemplo 18.1 resulta de nuestra aproximación a una curva con una línea recta. Por consiguiente, una estrategia para mejorar la estimación es introducir alguna curvatura en la línea que conecta los puntos. Si t ies^uiüo^dejas datos están disponibles, esto puede realizarse con un polinomio de segundo orden (también conocido como polinomio cuadrático o parábola). Una forma en particular conveniente para este propósito es

fi(x) = bo +bi(x- x0) + b2(x - x0){x - x{) (18.3)

Observe que aunque la ecuación (18.3) parecería diferir del polinomio general [véase ecuación (18.1)], las dos ecuaciones son equivalentes. Esto puede demostrarse al multiplicar los términos de la ecuación (18.3) para dar

f2(x) = b0 + b\x - b]X0 + b2x2 + b2xQx\ - b2xx0 - b2xx\

o, agrupando términos,

f2(x) = ao + a\x + a2x2

donde

a o = bo - btxo + h2X{)X\

a\ = b\ — b2xu — b2x\ a2 = b2

Así, las ecuaciones (18.1) y (18.3) son formulaciones alternativas equivalentes del único polinomio de segundo orden que une los tres puntos.

Un procedimiento simple puede usarse para determinar los valores de los coeficientes. Para Z>0, la ecuación (18.3) conx — XQ puede ser usada para calcular

b0 = / ( * o ) (18.4)

La ecuación (18.4) puede sustituirse en la (18.3), la cual puede evaluarse enx = xx para

= f^)-f(xo) X\ - XQ

Por último, las ecuaciones (18.4) y (18.5) se pueden sustituir en la (18.3), la cual puede evaluarse en x = x2 y resolver (después de algunas manipulaciones algebraicas) para

/ ( * 2 ) - / ( * i ) / ( * i ) - / ( * o ) , xo -x\ xi - x0 (18.6) f>2 = =

x2 - Xo Note que, como fue el caso con la interpolación lineal, bx todavía representa la

pendiente de la línea que une los puntos x 0 y xx. Así, los primeros dos términos de la ecuación (18.3) son equivalentes a la interpolación lineal d e x 0 ax , , como se especificó antes en la ecuación (18.2). El último término, b2(x — x 0)(x — X j ) , introduce la curvatura de segundo orden en la fórmula.

Page 177: Chapra12-20

5 0 6 INTERPOLACIÓN

EJEMPLO 18.2

i j

| ¡ í

Antes de ilustrar cómo usar la ecuación (18.3), debemos examinar la forma del coeficiente b2. Es muy similar a la aproximación por diferencias divididas finitas de la segunda derivada que se introdujo antes en la ecuación (4.24). Así, la ecuación (18.3) comienza a manifestar una estructura que es muy similar a la serie de expansión de Taylor. Esta observación será objeto de más exploración cuando relacionemos los polinomios de interpolación de Newton con la serie de Taylor en la sección 18.1.4. Pero primero, desarrollaremos un ejemplo que muestra cómo se usa la ecuación (18.3) para interpolar entre tres puntos.

Interpolación cuadrática

Enunciado del problema. Ajuste los tres puntos usados en el ejemplo 18.1 a un polinomio de segundo orden:

xo = 1 f(xo) - 0 Xl=4 / (xj) = 1.386294

x2 = 6 / ( J C 2 ) = 1.791759

Use el polinomio para evaluar ln 2.

Solución. Aplicando la ecuación (18.4) se obtiene

b0 = 0

La ecuación (18.5) da

F I G U R A 18 .4 Uso de interpolación cuadrática para estimar ln 2. Para comparación se incluye también la interpolación lineal de x = 1 a 4.

2

0

1

x 0 5

Page 178: Chapra12-20

18.1 DIFERENCIA DIVIDIDA DE NEWTON PARA LA INTERPOLACIÓN 507

y con la ecuación (18.6) se obtiene 1.791759 - 1.386294

0.4620981 b2 = 6 - 4 ^ = -0.0518731

6—1 Sustituyendo estos valores en la ecuación (18.3) se obtiene la fórmula cuadrática

f2(x) = 0 + 0.462098l(x - 1) - 0.0518731 (x - ])(x - 4)

que puede evaluarse en x — 2 para

/ 2 (2) = 0.5658444

la cual representa un error relativo de et = 18.4%. Así, la curvatura introducida por la fórmula cuadrática (véase la figura 18.4) mejora la interpolación comparada con el resultado que se obtiene mediante líneas rectas en el ejemplo 18.1 y figura 18.3.

18 .1 .3 Forma general de la interpolación de pol inomios de N e w t o n

El análisis anterior puede ser generalizado para ajustar un polinomio de «-ésimo orden a n + 1 datos. El polinomio de «-ésimo orden es

f„(x) = b0 + bi(x - x0) + • • • + b„(x - x0)(x -*,)•••(*- x„-i) (18.7)

Como se hizo antes con las interpolaciones lineales y cuadráticas, los puntos de los datos evaluaban los coeficientes b0, b¡,..., bn. Para un polinomio de «-ésimo orden se requiere n + 1 puntos: [x 0 , / (x 0 ) ] , [x^fix^],. .., [xn,f(xn)]. Usamos estos datos y las siguientes ecuaciones para evaluar los coeficientes:

bQ = f(x0) (18.8)

b\=f[xux0] (18.9)

bi = f[xz,xi, x„) (18.10)

bn = f[x„,x„-i, . . . , I l , A ' 0 ] (18.11)

donde las evaluaciones de la función puestas entre paréntesis son diferencias divididas finitas. Por ejemplo, la primera diferencia dividida finita se representa por lo general como

rr T / ( • * / ' ) ~ f ( X j ) / 1 0 n \

f[xj,Xj] = (18.12) X¡ - Xj

La segunda diferencia dividida finita, la cual representa la diferencia de las dos primeras diferencias divididas, se expresa por lo general como

Page 179: Chapra12-20

508 INTERPOLACIÓN

; */

0 xo f (x 0 ) -i x\ f (x , ) -2 x 2 f ( x 2 | -

3 *3 f[x3h

P r i m a r a

: f [ x , , x 0 ] -

: f [ x 2 , x , ]

: f [ x 3 . x 2 ] "

Segundo

|. x„]

Tareero

| X | , X , , X,„

F IGURA 18 .5 Ilustración gráfica de la naturaleza recursiva de las diferencias divididas finitas.

, r , f[Xi,Xj] - f[.Xj,XK] f \x¡ ,x,,x¡Á = - -

J 1 x¡-xk (18.13)

En forma similar, la n-ésima diferencia dividida finita es j . r , fíxni xn — \ > • • • i x \ \ — / [ x „ _ i , X „ _ 2 , . . . , XQ] (Wl\A\

f[x„,X„-u...,XUXo] = - - - - - ( . 1 8 . 1 4 ) X„ — XQ

Estas diferencias pueden usarse para evaluar los coeficientes en las ecuaciones (18.8) hasta la (18.11), las cuales entonces se sustituirán en la ecuación (18.7) para obtener el polinomio de interpolación

/«(*) = ñ xo) + (x- * 0 y i * i » *o] + ( x~ x0)(x - x^x^ xu x0] + -+ (x - Xo)(x - x,) ... (x - xn_1Y[xn,xn_l,...,x0] (18.15)

que es conocido como polinomio de interpolación por diferencias divididas de Newton. Debe observarse que no es necesario que los datos utilizados en la ecuación (18.15) sean igualmente espaciados o que los valores de la abscisa deban estar en orden ascendente, como se ilustra en el siguiente ejemplo. También, observe cómo las ecuaciones (18.12) a (18.14) son recursivas (es decir, las diferencias de órdenes mayores se calculan al tomar diferencias de orden menor, véase la figura 18.5). Esta propiedad será aprovechada cuando desarrollemos un programa eficiente en la computadora dentro de la sección 18.1.5 para implementar el método.

EJEMPLO 18.3 Interpolando polinomios mediante la diferencia dividida de Newton

Enunciado del problema. En el ejemplo 18.2, los datos e n x 0 = \,xx = 4 yx2 — 6 se utilizaron para estimar ln 2 con una parábola. Ahora, agregando un cuarto punto (x 3 = 5; f(x3) = 1.609438], calcule el ln 2 con una interpolación del polinomio de Newton de tercer orden.

Solución. El polinomio de tercer orden utilizando la ecuación (18.7) con n — 3, es

/ l ( . v ) = b{) + l>l(X - X T ) ) + l>2(.\ - .«o) (.V - .V|) | /0,(.\ .loK.v • -.»| )(\ .v>)

Page 180: Chapra12-20

1 5.1 UirCKCrNUA U l V I V I U r t u c P I S Y T I W I ^

F I G U R A 1 8 . 6 Uso de la interpolación cúbica para estimar ln 2.

Las primeras diferencias divididas para el problema son [véase la ecuación (18.12)]

1 .386294-0 f[X],X0] =

f[x2,Xi] =

f[X3,X2] =

4 - 0

1.791759 - 1.386294

6 - 4

1.609438 - 1.386294 5 - 6

= 0.4620981

0.2027326

0.1823216

Las segundas diferencias divididas son [véase la ecuación (18.13)]

0 .2027326-0.4620981 f[X2,Xi,X0] =

f[XT,,X2,Xi

6 - 1

0 .1823216-0.2027326 5 - 4

= -0.05187311

= -0.02041100

La tercera diferencia dividida es [véase la ecuación (18.14) con n = 3]

-0 .02041100- (-0.05187311) 5 - 1

= 0.007865529

Los resultados para/[*, , x0],f[x2, X^XQ] y f[x3, x2, xx, x0] representan los coeficientes 6,, b2 y ¿>3 de la ecuación (18.7). Junto con b0 =f(x0) = 0.0, la ecuación (18.7) es

Page 181: Chapra12-20

310 INTERPOLACIÓN

fr(x) = 0 + 0.4620981 ( J I - 1) - 0.05187311 (x I )(.v - 4)

+ 0.007865529(x - l)(x - 4)(x - 6)

que puede usarse para e v a l u a r / ^ ) = 0.6287686, el cual representa un error relativo de e¡ = 9.3%. El polinomio cúbico completo se muestra en la figura 18.6.

1 8 . 1 . 4 E r rores al interpolar pol inomios de N e w t o n

Observe que la estructura de la ecuación (18.15) es similar a la serie de expansión de Taylor en el sentido de que se agrega términos en forma secuencial para capturar el comportamiento de alto orden de la función en turno. Estos términos son diferencias divididas finitas y, así, representan aproximaciones de las derivadas de orden mayor. Por consiguiente, como ocurrió con la serie de Taylor, si la verdadera función subyacente es un polinomio de w-ésimo orden, el polinomio sujeto a interpolación de n-ésimo con base en n + 1 puntos dará resultados exactos.

También, como fue el caso con la serie de Taylor, puede obtenerse una formulación para el error de truncamiento. Recuerde de la ecuación (4.6) que el error de truncamiento para la serie de Taylor podría expresarse por lo general como

f (n+l)(t\

(n+ 1)1 (4.6)

donde ¿j está en alguna parte en el intervalo x¡ a x , + 1 . Para una interpolación de n-ésimo orden, una relación análoga para el error es

R„ r"+1)(£) (n + 1)!

(x - x 0 ) ( x - x t ) • • • (x -x„) (18.16)

donde £ está en alguna parte en el intervalo que contiene la incógnita y los datos. Para esta fórmula que habrá de usarse, la función en turno debe ser conocida y < iferenciable. Por lo común éste no es el caso. Por fortuna, una formulación alternativa ei tá disponible y no requiere conocimiento previo de la función. Más bien, usa una diferí ncia dividida finita para aproximar la derivada (n + l)-ésima,

R„ = fíx,x„,x„^i , XQ](X - X0)(X - X\) • • • (X - X„)

donde f[x, xn,xnA,..., x0)] es la (n + 1 )-ésima diferencia dividida finita. D :bido ecuación (18.17) contiene la incógnita/(x), no puede resolverse para el err >r. go, si se dispone de un dato adicional f(xn+1), la ecuación (18.17) pue<e estimar el error, como en

R„ = f[x„+u x„ , . . . , x0](x - x0)(x - x , ) • • • (x - x„) (18.18)

EJEMPLO 18.4 Estimación del error para el polinomio de Newton

Enunciado del problema. Use la ecuación (18.18) para estimar el error para la ¡ interpolación del polinomio de segundo orden del ejemplo 18.2. Use los datos adiciona-! les / (x 3 ) = / (5 ) = 1.609438 para obtener sus resultados.

(18.17)

a que la Sin embar-

usarse para

Page 182: Chapra12-20

• •».* n u i n r w i v i v n v e r w H m w m i u s ' n i m i w n O f f ¥17

F I G U R A 1 8 . 1 0 Una ilustración visual del racional detrás del polinomio de Lagrange. Esta figura muestra un caso de segundo orden. Cada uno de los tres términos en la ecuación (18.23) pasa a través de uno de los puntos y es cero en los otros dos. La sumatoria de los tres términos, por tanto, es un polinomio único de segundo orden f2|x) que pasa exactamente a través de los puntos.

Observe que, como en el caso del método de Newton, la versión de Lagrange tiene un error estimado de [véase ecuación (18.17)]

n

Rn = f[x,x„,x„-i,... ,x0] Y\(x -x¡)

De este modo, si se tiene un punto adicional en x — xn+l, se puede obtener un error estimado. Sin embargo, como no se emplean las diferencias divididas finitas como parte del algoritmo de Lagrange, esto se hace muy ocasionalmente.

Las ecuaciones (18.20) y (18.21) se programan de manera muy simple para implementarse en una computadora. La figura 18.11 muestra el pseudocódigo que se puede emplear para este propósito.

En resumen, para casos donde el orden del polinomio es desconocido, el método de Newton tiene ventajas en el conocimiento que proporciona respecto al comportamiento de las fórmulas de diferente orden. Además, el error estimado expuesto por la ecuación (18,18) se integra de manera usual en el cálculo del polinomio de Newton debido a que

Page 183: Chapra12-20

5 1 8 INTERPOLACIÓN

FUNCTION Lagrng(x, y, n, x) sum = 0 DO i = 0,n

product - y i DO j = 0,n

IF i # j THEN product = product*(x - Xj)/(x ; - Xj)

ENDIF EWDO sum = sum + product

EWDO Lagmg = sum

END Laqrftq

F IGURA 1 8 . 1 1 Pseudocódigo para ¡mplementar la interpolación de Lagrange. Este algoritmo se acondiciona para calcular una sola predicción de n-ésimo orden, donde n + 1 es el número de datos.

la estimación emplea una diferencia finita (véase el ejemplo 18.5). De esta manera, para cálculos exploratorios, a menudo se prefiere el método de Newton.

Cuando se ejecuta sólo una interpolación, las formulaciones de Lagrange y Newton requieren un notable esfuerzo computacional. Sin embargo, la versión de Lagrange es un poco más fácil de programar. Debido a que no requiere de cálculos y almacenaje de diferencias divididas, la forma de Lagrange se usa a menudo cuando el orden del polinomio se conoce a priorí.

EJEMPLO 18 .7 Interpolación de Lagrange usando la computadora

Enunciado del problema. Podemos usar el algoritmo de la figura 18.11 para estudiar un análisis de tendencia para un problema que se relaciona con nuestio conocido caso del paracaidista en caída. Suponga que desarrollamos cierta instrumentación para medula velocidad del paracaidista. Los datos de medición obtenidos para un caso de prueba en particular son

T iempo, s

Velocidad medida v ,em/s

1 800 3 2 310 5 3 090 7 3 940

13 4 755

í Nuestro problema es estimar la velocidad del paracaidista en t — 10 s para tener las mediciones faltantes entre t — lyt= 13 s. Estamos conscientes que el comportamiento de la interpolación de polinomios puede ser inesperado. Por tanto, construiremos polinomios de 4, 3, 2 y 1 órdenes para comparar los resultados.

Page 184: Chapra12-20

18.3 COEFICIENTES DE UN POLINOMIO DE INTERPOLACIÓN

| F I G U R A 1 8 . 1 2 ] Gráficas que exponen a) cuarto orden, b) tercer orden, c) segundo orden ¡ y d) interpolaciones de primer orden.

Solución. El algoritmo de Lagrange se usa para construir polinomios de interpolación de cuarto, tercer, segundo y primer orden.

El polinomio de cuarto orden y los datos de entrada se pueden graficar como se muestra en la figura 18.12a. Es evidente a partir de esta gráfica que el valor estimado de y en x = 10 es mayor que la tendencia global de los datos.

Desde la figura 18.12b hasta la 18.12d se muestran las gráficas de los resultados de los cálculos para las interpolaciones de los polinomios de tercer, segundo y primer orden. Se observa que mientras más bajo sea el orden, menor será el valor estimado de la velocidad en t = 10 s. Las gráficas de la interpolación de polinomios indican que los polinomios de alto orden tienden a sobrepasar la tendencia de los datos. Esto sugiere que las versiones de primer o segundo orden son las más adecuadas para este análisis de tendencia en particular. Debe recordarse, que debido a que tratamos con datos inciertos, la regresión de hecho podría ser la más adecuada.

El ejemplo anterior ilustró que los polinomios de alto orden tienden a ser mal condicionados; esto es, tienden a ser altamente sensibles a los errores de redondeo. El mismo problema se aplica a la regresión con polinomios de orden superior. La aritmética de doble precisión ayuda algunas veces a disminuir el problema. Sin embargo, en tanto el orden aumente, habrá un punto para el cual el error de redondeo interferirá con la habilidad para interpolar mediante el procedimiento simple que se abordó en este punto.

1 8 . 3 C O E F I C I E N T E S D E U N P O L I N O M I O P E I N T E R P O L A C I Ó N

Aunque el polinomio de Newton y el de Lagrange son adecuados para determinar valores intermedios entre puntos, no proporcionan un polinomio conveniente de la forma convencional

Page 185: Chapra12-20

520 INTERPOLACIÓN

f(x) =a0 + axx + a2x2 + •••+ anxn (18.24)

Un método directo para calcular los coeficientes de este polinomio se basa en el hecho de que n + 1 puntos se requieren para determinar los n + 1 coeficientes. Así, se puede usar ecuaciones algebraicas lineales simultáneas para calcular las a. Por ejemplo, suponga que usted desea calcular los coeficientes de la parábola

f(x) = a0 + a\x + a2x2 (18.25)

Se requiere tres puntos: [x0,f(x0)], [ X ] , / ( x j ) ] y [x2,f(x2)].Cada uno se puede sustituir en la ecuación (18.25) para dar

f(x0) — a0 + aix0 + a2x\

f(x\) = a0 + a\x\ + a2x\ (18.26)

f(x2) = a0 + a\x2 + a2x\

De esta manera, las x son los puntos conocidos y las a las incógnitas. Como hay el mismo número de ecuaciones que incógnitas, la ecuación (18.26) se podría resolver con un método de eliminación de la parte tres.

Debe observarse que el procedimiento anterior no es el método disponible más eficiente para determinar los coeficientes de una interpolación de polinomios. Press y cois. (1986) proporcionan un análisis y códigos de cómputo para procedimientos más eficaces. Cualquiera que sea la técnica empleada, se debe tener precaución con el orden. Los sistemas como el de la ecuación (18.26) están notoriamente mal condicionados. Ya sean resueltos con un método de eliminación o con un algoritmo eficiente, los coeficientes resultantes pueden ser altamente inexactos, en particular para n grandes. Cuando se usan para una interpolación subsecuente a menudo se obtiene resultados erróneos.

En resumen, si usted se interesa en determinar un punto intermedio, emplee la interpolación de Newton o Lagrange. Si lo que desea es determinar una ecuación con la forma de la (18.24), limítese a polinomios de orden inferior y verifique sus resultados cuidadosamente.

1 8 . 4 I N T E R P O L A C I Ó N I N V E R S A

Como su nomenclatura lo implica, los valores de f(x) y x en la mayoría de los contextos de interpolación son las variables dependientes e independientes, en forma respectiva. En consecuencia, los valores de las x están típicamente espaciados en forma uniforme. Un ejemplo simple es una tabla de valores tabulados para la función f(x) = l/x,

X 1 2 3 4 5 6 7

1 0.5 0.3333 0.25 0.2 0.1667 0.1429

Ahora suponga que usted debe usar los mismos datos, pero que se le ha dado un valor para f(x) y debe determinar el valor correspondiente de x. Por ejemplo, para los datos anteriores, suponga que se le pide determinar el valor de x que corresponda a f(x) — 0.3. Para este caso, como la función está disponible y se puede manejar en forma fácil, la respuesta correcta se determina directamente como A; = 1/0.3 = 3.3333.

Page 186: Chapra12-20

puntos en una secuencia diferente. La figura 18.9 muestra los resultados para el caso de invertir el orden de los datos originales; esto es, x0 = 3.5, x{ = 2.5, x 3 = 1.5, y asi sucesivamente. Como los puntos iniciales para este caso se hallan cercanos y espaciados en cualquier lado de ln 2, el error disminuye mucho más rápido que para la situación original. En el segundo término, el error se redujo a menos de e, = 2%. Se podría emplear otras combinaciones para obtener diferentes velocidades de convergencia.

El ejemplo anterior ilustra la importancia de la selección de los puntos base. Como se podría intuir en forma obvia, los puntos deberían estar centrados alrededor y tan cerca como sea posible de las incógnitas. Esta observación es también soportada por un análisis directo de la ecuación para estimar el error [vea ecuación (18.17)]. Si suponemos que la diferencia dividida finita no varía mucho a lo largo del rango de datos, el error es proporcional al producto: (x — x0) (x — x¡).. .(x — xn). Por lógica, los puntos base más cercanos son a x, la magnitud más pequeña de este producto.

1 8 . 2 I N T E R P O L A C I Ó N DE P O L I N O M I O S P E L A G R A N G E

La interpolación de polinomios de Lagrange es simplemente una reformulación del polinomio de Newton que evita el cálculo por diferencias divididas. Se puede expresar de manera concisa como

/»(*) = 2 £,(*)ft*i> (18.20)

i=0 donde

iW=n^/ (18.2D y=o X Í - X J

donde II designa el "producto de". Por ejemplo, la versión lineal (n = 1) es

fi(x) = ?—^f(xo) + í—^-f(xx) (18.22) x 0 - xi x, - x 0

y la versión de segundo orden es

' ( i - x i ) ( x - x 2 ) - (x - x 0 ) ( x - X 2 ) f2(x) = - — r / ( x 0 ) + - — r / ( * i )

(x 0 - xO(xo - x 2 ) {x\ - x0)(xi - x2) , (x-xo)(x-Xl)mfiX2) ( 1 8 . 2 3 )

(x2 - x 0 ) ( x 2 - X i ) "

La ecuación (18.20) se puede derivar de manera directa a partir del polinomio de Newton (véase cuadro 18.1). Sin embargo, el racional resaltado de la formulación de Lagrange se puede captar de manera directa al darse cuenta que cada término L¡(x) será

Page 187: Chapra12-20

516 INTERPOLACIÓN

1 en x = x, y 0 en todos los otros puntos de la muestra (véase la figura 18.10). De esta manera, cada producto L¡(x)f(x¡) toma el valor de f(x¡) en el punto de muestra x¡. En consecuencia, la sumatoria de todos los productos designados para la ecuación (18.20) es el único polinomio de n-ésimo orden que pasa de manera exacta a través de todos los n + 1 puntos.

EJEMPLO 1 8 . 6 Interpolación de polinomios de Lagrange

Enunciado del problema. Use una interpolación del polinomio de Lagrange de primer y segundo orden para evaluar ln 2 con base en los datos dados en el ejemplo 18.2:

xo = 1 f(xo) = 0 x , = 4 / ( x 0 = 1.386294 x2=6 f(x2) = 1.791760

Solución. El polinomio de primer orden [véase ecuación (18.22)] se puede usar para obtener la estimación en x = 2,

i / , ( 2 ) = Y~^°+ y 1 -386294 = 0.4620981

De manera similar, el polinomio de segundo orden se desarrolla como [véase ecuación 1 (18.23)]

( 2 - 4 ) ( 2 - 6 ) ( 2 - l ) ( 2 - 6 ) / 2 ( 2 ) = - 0 + -1.386294

( l - 4 ) ( l - 6 ) ( 4 - l ) ( 4 - 6 ) ( 2 - l ) ( 2 - 4 )

+ - -1.791760 = 0.5658444 ( 6 - l ) ( 6 - 4 )

Como se esperaba, ambos resultados concuerdan con los que se obtuvieron antes al usar la interpolación para el polinomio de Newton.

Cuadro 18.1 Obtención de la forma de Lagrange a partir directamente de la interpolación del polinomio de Newton

El polinomio de interpolación de Lagrange se puede obtener de manera directa a partir de la formulación del polinomio de Newton. Haremos esto únicamente para el caso del polinomio de primer orden [véase ecuación (18.2)]. Para obtener la forma de Lagrange, reformulamos las diferencias divididas. Por ejemplo, la primera diferencia dividida, fl i /(xi) - /(x0) /[x,,xo] = (B18.1.1) xi - xo se puede reformular como

la cual es referida como forma simétrica. Al sustituir la ecuación (B18.1.2) en (18.2) se obtiene

/i(x) = /(x0) + — — f t x i ) + ——/(x0) x\ - x0 x0 - X i

Por último, al agrupar términos similares y simplificar se tiene la forma del polinomio de Lagrange,

X — Xl x — Xo fx(x) = -/(x0) + V(xi) xo - X l X\ - XQ

(B18.1.2)

Page 188: Chapra12-20

18.5 COMENTARIOS ADICIONALES 521

Tal problema se conoce como interpolación inversa. Para un caso más complicado, usted debe intentar cambiar los valores f(x) y x [es decir, sólo grafique x contra f(x)\ y use un procedimiento como la interpolación de Lagrange para determinar el resultado. Por desgracia, cuando usted invierte las variables no hay garantía de que los valores junto con la nueva abscisa [los/(x)] sean espaciados uniformemente. De hecho, en muchos casos, los valores serán "agrandados". Es decir, tendrán la apariencia de una escala logarítmica con algunos puntos adyacentes muy agrupados y otros muy dispersos. Por ejemplo, para f(x) = 1/x el resultado es

0 .1429 0 .1667 0.2 0.25 0 .3333 0.5 1

X 7 6 5 4 3 2 1

Tal espaciamiento no uniforme sobre la abscisa a menudo lleva a oscilaciones en el resultado de la interpolación de polinomios. Esto puede ocurrir aun para polinomios de orden inferior.

Una estrategia alterna es ajustar un polinomio de n-ésimo orden, fn{x), a los datos originales [es decir, con f(x) contra x]. En la mayoría de los casos, como las x están espaciadas de manera uniforme, este polinomio no estará mal condicionado. La respuesta a su problema entonces toma en cuenta la determinación del valor de x que haga que este polinomio sea igual al dado porf(x). Así, ¡el problema de interpolación se reduce a un problema de raíces!

Por ejemplo, para el problema antes descrito, un simple procedimiento podría ser ajustar los tres puntos a un polinomio cuadrático: (2, 0.5), (3, 0.3333) y (4, 0.25). El resultado sería

f2(x) = 1.08333 - 0.375.* + 0.041667* 2

La respuesta al problema de interpolación inversa para determinar lax correspondiente a f(x) = 0.3 sería equivalente a la determinación raices de

0.3 = 1.08333 - 0.375A- + 0.041667A:2

Para este caso simple, la fórmula cuadrática se puede usar para calcular

_ 0.375 ± v/C-0.375) 2 - 4(0.041667)0.78333 _ 5.704158 X ~ 2(0.041667) ~ 3.295842

Así, la segunda raíz, 3.296, es una buena aproximación del valor real de 3.333. Si se desea una exactitud adicional, se podría emplear un polinomio de tercer o cuarto orden junto con uno de los métodos para la localización de raíces de la parte dos.

18 .5 C O M E N T A R I O S A D I C I O N A L E S

Antes de proceder con la siguiente sección, se debe mencionar dos temas adicionales: interpolación con datos igualmente espaciados y extrapolación.

Como, ambos polinomios, el de Newton y Lagrange, son compatibles con datos espaciados en forma arbitraria, usted se preguntaría por qué hemos puesto el caso especial de datos igualmente espaciados (véase cuadro 18.2). Antes de la llegada de las computadoras digitales, esas técnicas tenían gran utilidad para interpolación a partir de

Page 189: Chapra12-20

5 2 2 INTERPOLACIÓN

C u a d r o 1 8 . 2 I N T E R P O L A C I Ó N C O N D A T O S I G U A L M E N T E E S P A C I A D O S

Si los datos están igualmente espaciados y en orden ascendente, entonces la variable independiente tiene los valores de

x\ = x0 + h

X2 = A'O + 2h

donde lo que resta es lo mismo que en la ecuación (18.16). Esta ecuación es conocida como fórmula de Newton o fórmula hacia adelante de Newton-Gregory. Se puede simplificar más al definir una nueva cantidad, a:

x„ = xo + nh

donde h es el intervalo, o tamaño de paso, entre los datos. Con esta base, las diferencias divididas finitas se pueden expresar en forma concisa. Por ejemplo, la segunda diferencia dividida hacia adelante es

/[A'O, A|, X2] =

f(Xl) - f(Xj) _ /(Al) ~ /(X 0 ) A 2 — Xl X| — XQ

X2 - X0 la cual se puede expresar como

/ ( x 2 ) - 2 / ( x , ) + / ( x 0 ) / [X 0 , Al, A2] 2h2

(B 18.2.1)

ya que xx — x0 = x2 — x{ = (x2 — x0)/2 = h. Ahora recuerde que la segunda diferencia hacia adelante es igual al numerador de la ecuación (4.24)

A 2 / ( x o ) = / ( A ' 2 ) - 2 / ( x l ) + / ( x 0 )

Por tanto, la ecuación (B 18.2.1) se puede representar como

A 2 / ( x 0 ) /[X 0 ,X|,X 2 ] =

o, en general

/ [Xo ,X|, . . . , x „ ]

2\h2

= A " / ( x 0 )

n\h" (B18.2.2)

Mediante la ecuación (Bl 8.2.2), podemos expresar el polinomio de interpolación de Newton [véase ecuación (18.15)] para el caso de datos igualmente espaciados como

Esta definición se puede usar para desarrollar las siguientes expresiones simplificadas páralos términos en la ecuación (B18.2.3):

x — AO = ah

x — AQ — h = ah • •h = h(a-\)

x — Ao — (n — l)h = ah — (n — \)h = h(a — n + 1)

las cuales se sustituyen en la ecuación (Bl 8.2.3) para dar

A 2 fíx0) fn(x) = / ( x 0 ) + A / ( x 0 ) a + i) "a(a - 1)

donde

2! , A " / ( x 0 )

H -i ¡—a (a - 1) • • (a - n + 1) + R„ (B 18.2.4)

Rn = , , , \ , V + W - D(« - 2) • • • (a - «) [n + 1)!

Esta notación concisa tendrá utilidad en nuestra derivación y en el análisis de error de las fórmulas de integración en el capítulo 21.

Además de la fórmula hacia adelante, están disponibles las fórmulas hacia atrás y central de Newton-Gregory. Para información adicional con respecto a interpolación para datos igualmente espaciados se puede consultar a Carnahan, Luther y Wilkes (1969).

r / x s, , A / ( X 0 ) / , ( X ) = / ( X Q ) + ; ( X - X 0 )

h

+ A 2 / ( A 0 )

2\h2 (x - x 0 ) (x - xo - h)

+ ---+^¡^(x-xQ)(x-x0-h) nlh"

•••\x-x0-(n-1)h) + R„ (B18.2.3)

Page 190: Chapra12-20

I i o. i uircRCNClA DIVIDIDA DE NEWTON "PARA LA INTERPOLACIÓN IM j Solución. Recuerde que en el ejemplo 18.2 la interpolación del polinomio de segundo j orden proporcionó una estimación de f2(2) = 0.5658444, que representa un error de \ 0.6931472 - 0.5658444 = 0.1273028. Si se hubiera conocido el valor real, como es " común que suceda, la ecuación (18.18), junto con el valor adicional en x3, pudo usarse

para estimar el error, como en

! Ri = / f e , x 2 , X\,XQ\(X - x0)(x - x\)(x - x2)

i o

! R2 = 0.007865529(JC - l)(x - 4)(x - 6) í donde el valor para la diferencia dividida finita de tercer orden es como la que se calculó

antes en el ejemplo 18.3. Esta relación puede evaluarse e n * = 2 para R2 = 0.007865529(2 - 1)(2 - 4)(2 - 6) = 0.0629242

la cual es del mismo orden de magnitud que el error real.

Del ejemplo anterior y de la ecuación (18.18), debe estar claro que el error estimado para el polinomio de n-ésimo orden es equivalente a la diferencia entre el (n + l)-ésimo orden y la predicción de n-ésimo orden. Es decir,

Rn = fn + l(x) ~ fn(x) (18.19)

En otras palabras, el incremento que se agrega al caso del n-ésimo orden para crear el caso de (n + l)-ésimo orden [es decir, la ecuación (18.18)] se interpreta como una estimación del n-ésimo orden de error. Esto puede verse con claridad al reordenar la ecuación (18.19) para dar

f„+l{x) = f„(x) + Rn

La validez de este procedimiento es afirmada por el hecho de que la serie es fuertemente convergente. Para tal situación, la predicción del (n + l)-ésimo orden debería ser mucho más cercana al valor real que la predicción del n-ésimo orden. En consecuencia, la ecuación (18.19) conforma nuestra definición estándar de error al representar la diferencia entre la verdadera y una aproximación. Sin embargo, observe que mientras todos los otros errores estimados para procedimientos iterativos introducidos hasta ahora se determinaron como una predicción actual menos una previa, la ecuación (18.19) representa una predicción futura menos una presente. Esto significa que para una serie en convergencia rápida, el error estimado de la ecuación (18.19) podría ser menor que el verdadero. Esto representaría una calidad muy poco atractiva si el error estimado fuera a emplearse como un criterio de paro. Sin embargo, como será expuesto en la siguiente sección, la interpolación de polinomios de alto orden son muy sensibles a errores en los datos (es decir, están mal condicionados). Cuando se emplean para interpolación, a menudo se obtienen predicciones que divergen en forma significativa del valor verdadero. Si se prevén tales errores, la ecuación (18.19) es más sensible para dicha divergencia. Como tal, es más valioso para la clase de análisis de datos exploratorios para lo cual el polinomio de Newton es el más adecuado.

Page 191: Chapra12-20

512 INTERPOLACIÓN

18 .1 .5 Algor i tmo de cómputo paro la interpolación del pol inomio de N e w t o n

Tres propiedades hacen que la interpolación del polinomio de Newton sea muy atractiva para las aplicaciones en la computadora:

1. Como en la ecuación (18.7), se puede desarrollar de manera secuencial versiones de orden mayor con la adición de un solo término a la siguiente ecuación de orden inferior. Esto facilita la evaluación de algunas de las versiones de diferente orden en el mismo programa. Tal capacidad es en especial valiosa cuando el orden del polinomio no es conocido a priori. Al agregar nuevos términos en forma secuencial, podemos determinar cuándo se alcanza un punto de disminución de regreso (es decir, cuando la adición de términos de orden superior ya no mejora de manera significativa la estimación, o en ciertas situaciones de hecho la aleja). Las ecuaciones para estimar el error que se analizan en el punto 3 son útiles para visualizar un criterio objetivo para identificar este punto de términos disminuidos.

2 . Las diferencias divididas finitas que constituyen los coeficientes del polinomio [ecuaciones (18.8) hasta (18.11)] se pueden calcular de manera eficaz. Es decir, como en la ecuación (18.14) y la figura 18.5, se usa diferencias del orden inferior para calcular las de alto orden. Por medio de la información determinada antes, los coeficientes se pueden calcular de manera eficiente. El algoritmo en la figura 18.7 contiene un esquema semejante.

3. El error estimado [véase la ecuación (18.18)] puede ser muy simple de incorporar en un algoritmo de cómputo debido a la manera secuencial en la cual se construye la predicción.

F IGURA 1 8 . 7 Un algoritmo para el polinomio de interpolación de Newton escrito en pseudocódigo.

5U3R0UTINE Newtlnt (x, y, n, xi, ymt, ea) LOCAL fdd„¡n

DOi = 0,n' f d du>=y¡

END DO DO j = 1,n

DO i = 0,n- j fdd¡¿ = (fddM¡ti - fdd^x^-xj

ENDDO END DO xterm = 1 yint0 = fdd0¡0

DO order = 1, n xterm = xterm * (x¡ - x o r e t e r_,) yintZ = yintolder.1 + fdd0iOrder * xterm

END order END Newtlnt

Page 192: Chapra12-20

18.1 DIFERENCIA DIVIDIDA DE NEWTON PARA LA INTERPOLACIÓN 913

Todas las características anteriores pueden aprovecharse y ser incorporadas en un algoritmo general para implementar el polinomio de Newton (véase la figura 18.7). Observe que el algoritmo consiste en dos partes: el primero determina los coeficientes o partir de la ecuación (18.7); el segundo establece las predicciones y su error asociado. La utilidad de este algoritmo se demuestra en el ejemplo siguiente.

EJEMPLO 18.5 Estimación del error para determinar el orden adecuado de interpolación

¡ Enunciadodel problema. Después de incorporar el error [véase la ecuación (18.18)], ; utilice el algoritmo de cómputo que se muestra en la figura 18.7 y la siguiente informa-j ción para evaluar/(x) = Inxenx = 2:

i x f (x) = ln x

0 1 4 1.3862944 ó 1.7917595 5 1.6094379 3 1.0986123 1.5 0.4054641 2.5 0.9162907 3.5 1.2527630

Solución. Los resultados al emplear el algoritmo de la figura 18.7 para obtener una solución se muestran en la figura 18.8. El error estimado, junto con el error real (con

| F IGURA 18 .8 Los resultados de un programa, con base en el algoritmo de la figura 18.7, para evaluar ln 2.

NUMBER OF P01NTS? 8 X( 0 ), y ( 0 ) - ? 1,0 X( 1 ) . y ( 1 ) - ? 4 , 1 .3862944 X( 2 ), y ( 2 ) - ? 6 , 1 .7917595 X( 3 ) . y ( 3 ) - ? 5 , 1 .6094379 X( 4 ), y ( 4 ) - ? 3 , 1 .0986123 X( 5 ) . y ( 5 ) - ? 1.5 , 0 . 4 0 5 4 6 4 1 1 X( 6 ), y ( 6 ) - ? 2 . 5 . 0 . 9 1 6 2 9 0 7 3 X( 7 ) , y ( 7 ) - ? 3 . 5 , 1 . 2 5 2 7 6 3 0

INTERPOLATION AT X - 2 ORDER F (X) ERROR 0 0 .000000 0 .462098 1 0 .462098 0 .103746 2 0 . 5 6 5 8 4 4 0 .062924 3 0 .628769 0 . 0 4 6 9 5 3 4 0 .675722 0 .021792 5 0 .697514 - 0 . 0 0 3 6 1 6 6 0 .693898 - 0 . 0 0 0 4 5 9 7 0 .693439

Page 193: Chapra12-20

514 INTERPOLACIÓN

base en el hecho de que ln 2 = 0.6931472), se ilustran en la figura 18.9. Observe que el error estimado y el real son similares y que su concordancia mejora en tanto se aumente el orden. A partir de estos resultados se puede concluir que la versión de quinto orden da una buena estimación y que los términos de orden superior no resaltan en forma significativa la predicción.

I Este ejercicio también ilustra la importancia de colocar el orden de los puntos. Por ¡ ejemplo, hasta la estimación del tercer orden, la razón de mejora es lenta debido a que \ los puntos que se agregaron (en x = 4, 6 y 5) están distantes y a un lado del punto de ! análisis en x = 2. La estimación de cuarto orden muestra algo de mejora ya que el nuevo \ punto en x — 3 está cercano a la incógnita. Sin embargo, la disminución más dramática \ en el error está asociada con la inclusión del término de quinto orden mediante los datos \ en x = 1.5. No sólo está este punto cercano a la incógnita, sino que también se halla en ¡ el lado opuesto de la mayoría de los otros puntos. En consecuencia, el error se reduce a i casi un orden de magnitud. j El significado de la posición y secuencia de los datos se puede también ilustrar al j usar los mismos datos para obtener una estimación para el ln 2, pero considerando los

i F I G U R A 1 8 . 9 j Porcentaje de errores relativos para la predicción de ln 2 como una función ! del orden de la interpolación polinomial.

Error i

Page 194: Chapra12-20

F IGURA 1 8 . 1 3 Ilustración de la divergencia posible de una predicción extrapolada. La extrapolación se basa en el ajuste de una parábola a través de los primeros tres puntos conocidos.

tablas con argumentos igualmente espaciados. De hecho, una estructura computacional conocida como tabla de diferencias divididas fue desarrollada para facilitar la imple-mentación de esas técnicas. (La figura 18.5 es un ejemplo de esa tabla.)

Sin embargo, como las fórmulas son subconjuntos de esquemas de Newton y Lagrange compatibles con computadora y debido a las muchas funciones tabulares disponibles, como subrutinas de librerías, la necesidad para las versiones igualmente espaciadas ha disminuido. A pesar de esto, por su relevancia las hemos incluido en este tema en las últimas partes de este libro. En particular, son necesarias para obtener fórmulas de integración numérica que emplean de manera típica datos igualmente espaciados (véase el capítulo 21). Como las fórmulas de integración numérica tienen relevancia en la solución de ecuaciones diferenciales ordinarias, el material del cuadro 18.2 tiene también significado en la parte siete.

Extrapolación es el proceso de estimar un valor de f(x) que se tiene fuera del rango de los puntos base conocidos, x0, JC,, . . ., xn (véase la figura 18.13). En una sección anterior, mencionamos que la interpolación más exacta es usualmente obtenida cuando las incógnitas están cerca del centro de los puntos base. Obviamente, esto no se cumple cuando las incógnitas se encuentran fuera del rango y, en consecuencia, el error en extrapolación puede ser muy grande. Como se ilustra en la figura 18.13, la naturaleza de extremos abiertos de la extrapolación representa un paso en la incógnita, ya que el proceso extiende la curva más allá de la región conocida. Como tal, la curva real podría con facilidad divergir de la predicción. Por tanto, se debe tener extremo cuidado al realizar ejercicios donde surja un caso que se deba extrapolar.

Page 195: Chapra12-20

INTERPOLACIÓN I N T E R P O L A C I Ó N S E G M E N T A R I A

-^n la sección anterior, se usó polinomios de w-ésimo orden para interpolar entre n + 1 ¿Jatos. Por ejemplo, para ocho puntos se puede derivar un perfecto polinomio de séptimo ¿>rden. Esta curva podría capturar todas las curvaturas (al menos hasta e incluso la séptica derivada) sugeridas por los puntos. Sin embargo, hay casos en los que estas funciones pueden llevar a resultados erróneos debido a errores de redondeo y puntos lejanos. Un

s fIGURA 18.14 (Jna representación visual de una situación donde las segmentarias son interpolaciones polinomialesde orden superior. La función que habrá de ajustarse pasa por un incremento jubito en x = 0. Los incisos a) a c) indican que el cambio abrupto induce oscilaciones al ¡nterpolar polinomiales. En contraste, como las curvas se limitan a tercer orden con transiciones suaves, la segmentaria cúbica d) proporciona una aproximación mucho más ¿iceptable.

a)

f(x),

X b)

f(x) i J J> 9 9 9 —, »-

J • 0 x d)

Page 196: Chapra12-20

18.6 INTERPOLACIÓN SEGMENTARIA 525

procedimiento alternativo es aplicar polinomios de orden inferior a subconjuntos de datos. Tales polinomios conectores son llamados funciones segmentarias.

Por ejemplo, curvas de tercer orden empleadas para conectar cada par de datos son llamadas segmentarias cúbicas. Esas funciones se pueden construir de tal forma que las conexiones entre las ecuaciones cúbicas adyacentes resultan visualmente suaves. Sobre la superficie, podría parecer que la aproximación de tercer orden de las segmentarias sería inferior a la expresión de séptimo orden. UstecJ se preguntaría por qué una segmentaria podría ser siempre preferible.

La figura 18.14 ilustra una situación donde una segmentaria se comporta mejor que una polinomial de orden superior. Este es el caso donde una función es por lo general suave pero conlleva un cambio abrupto en algún lugar a lo largo de la región de interés.

¡ í El incremento de paso expuesto en la figura 18.14 es un ejemplo extremo de tal cambio y sirve para ilustrar este punto.

De la figura 18.14a hasta la 18.14c se ilustra cómo un polinomio de orden superior tiende a formar una curva a través de oscilaciones bruscas en la vecindad con un cambio súbito. En contraste, la segmentaria también conecta los puntos, pero debido a sus cambios limitados de tercer orden, las oscilaciones se mantienen a un mínimo. Como tal, la segmentaria usualmente proporciona una aproximación superior del comportamiento de las funciones que tienen cambios locales y abruptos.

El concepto de la segmentaria se origina de la técnica de dibujo con una cinta delgada y flexible (llamada curvígrafo) para dibujar curvas suaves a través de un conjunto de puntos. El proceso se expone en la figura 18.15 para una serie de cinco pasadores (datos). En esta técnica, el dibujante coloca un papel sobre una mesa de madera y golpea los clavos o pasadores en el papel (y la mesa) en la ubicación de los datos. Una curva suave resulta al entrelazar la cinta entre los pasadores. De aquí que se haya adoptado el nombre de "segmentaria cúbica" para los polinomios de este tipo.

En esta sección, se usarán primero funciones lineales simples para introducir algunos conceptos básicos y problemas asociados con la interpolación segmentaria. Entonces obtendremos un algoritmo para el ajuste de datos con segmentarias cuadráticas. Por último, presentamos material sobre la segmentaria cúbica, la cual es la versión más común y útil en la práctica de la ingeniería.

F I G U R A 1 8 . 1 5 \i La técnica de dibujo.al usar

una segmentaria para dibujar curvas suaves a través de una serie de

. puntos. Observe cómo en los puntos extremo, la segmentaria trata de

', enderezarse. Esto es J conocido como uña 1 segmentaria "natural".

Page 197: Chapra12-20

5 2 6 INTERPOLACIÓN

18 .6 . 1 Segmentar ias l ineales

La conexión más simple entre dos puntos es por medio de una línea recta. Las segmentarias de primer orden para un grupo de datos ordenados pueden definirse como un conjunto de funciones lineales,

f(x) = f(xo) +m0(x - x 0 )

/ ( x ) = / ( x i ) +nn(x - x i )

xo < x '< xi

Xi £ x < Xi

f(x) = / ( x „ - j ) + m„-\(x - x„_ i ) x„_i < x < x„

donde m¡ es la pendiente de la línea recta que conecta los puntos:

/(*/ + !) - f(x¡)

x¡+i — x¡ (18.27)

Estas ecuaciones se pueden usar para evaluar la función en cualquier punto entre x 0

y xn para localizar primero el intervalo dentro del cual está el punto. Después se usa la ecuación adecuada para determinar el valor de la función dentro del intervalo. El método es obviamente idéntico al de la interpolación lineal.

EJEMPLO 18 .8 Segmentarias de primer orden

Enunciado del problema. Ajuste los datos de la tabla 18.1 con segmentarias de primer orden. Evalúe la función enx = 5.

Solución. Se puede usar los datos para determinar las pendientes entre puntos. Por ejemplo, para el intervalo x = 4.5 a x = 7 la pendiente se puede calcular mediante la ecuación (18.27):

2.5 - 1 7 - 4 . 5

= 0.60

Las pendientes para los otros intervalos se pueden calcular y las segmentarias resultantes de primer orden se grafican en la figura 18.16a. El valor enx = 5 es 1.3.

T A B L A 18 .1 Datos para ser ajustados con funciones segmentarias.

3.0 4.5 7.0 9.0

f(x)

2.5 1.0 2.5 0.5

Page 198: Chapra12-20

Una inspección visual a la figura 18.16a indica que la principal desventaja de las segmentarias de primer orden es que no son suaves. En esencia, en los puntos donde dos segmentarias se encuentran (llamado nodo), la pendiente cambia de forma abrupta. En términos formales, la primera derivada de la función es discontinua en esos puntos. Esta deficiencia se resuelve al usar segmentarias polinomiales de orden superior que aseguren suavidad en los nodos al igualar derivadas en esos puntos, como se analiza en la siguiente sección.

1 8 . 6 . 2 Segmentar ias cuadráticas

Para asegurar que las derivadas m-ésimas son continuas en los nodos, se debe usar una segmentaria de al menos m + 1 orden. A menudo se usan con más frecuencia en la práctica los polinomios de tercer orden o segmentarias cúbicas para asegurar derivadas

F I G U R A 1 8 . 1 6 Ajuste segmentario de un conjunto de cuatro puntos, a) Segmentaria lineal, b) segmentaria cuadrática y c] segmentaria cúbica, se gráfica también con una interpolación polinomial cúbica.

Segmentaria de primer orden

10 x

Segmentaria de segundo orden

0 I 1 1 | L J L

b)

' o

Segmentaría cúbica

\ Interpolación

cúbica

f

Page 199: Chapra12-20

5 2 8 INTERPOLACIÓN

continuas de primer y segundo orden. Aunque las derivadas de tercer orden y mayor© podrían ser discontinuas cuando se usa segmentarias cúbicas, usualmente no puede detectarse en forma visual y en consecuencia son ignoradas.

Debido a que la obtención de segmentarias cúbicas está algo involucrada, la hem* escogido en una sección subsecuente. Hemos decidido primero ilustrar el cor.cípto e j interpolación segmentaria mediante polinomios de segundo orden. Esas "segmentáis j cuadráticas" tienen primeras derivadas continuas en los nodos. Aunque las segmentaras cuadráticas no aseguran segundas derivadas iguales en los nodos, «'"•en muy b¡en pía | demostrar el procedimiento general en el desarrollo de segmentarias de o. jen ¡superior.

El objetivo de las segmentarias cuadráticas es derivar un polinomio de segundo orden para cada intervalo entre datos. El polinomio para cada intervalo se puede representar de manera general como

f,(x) = cnx2 + bix + ci (18.28)

La figura 18.17 ha sido incluida para ayudar a clarificar la notación. Para n + 1 datos (i = 0, 1, 2 n) existen n intervalos y, en consecuencia, 3n constantes desconocidas (las a,byc) por evaluar. Por tanto, se requieren 3« ecuaciones o condiciones para evaluar las incógnitas. Éstas son:

1 . Los valores de la función de polinomios adyacentes deben ser iguales a los nodos interiores. Esta condición se puede representar como

a¡-xx}_x + + c,-i = /(*,_!) (18-29)

a¡xf_l + b¡x¡-[ + c¡ = /(*,•_ i) (18.30)

para / = 2 a n. Como sólo se usa nodos interiores, las ecuaciones (18.29) y (18.30) proporcionan cada una n — 1 condiciones del total de 2n — 2.

F I G U R A 1 8 . 1 7 Notación usada para derivar segmentarias cuadráticas. Observe que hay n intervalos y n + 1 datos. El ejemplo mostrado es para n = 3.

a,)? + bfX+ c-

Intervalo 1 •« •

Intervalo 2 * • Intervalo 3

_j 1 , 1 1 * 0 * 1 * 2 * 3 *

; = 0 / = 1 1-2 / = 3

Page 200: Chapra12-20

18.6* I N T E R P O L A C I Ó N S E G M E N T A R I A 1 9 9

2. Las primera y última funciones deben pasar a través de los puntos extremo. Esto agrega dos ecuaciones adicionales:

a\xl + bix0 + c\ = f(x0) (18.31)

a„x2n + bnx„ +c„- f(xn) (18.32)

para un total de 2n — 2 + 2 = 2n condiciones. 3. Las primeras derivadas en los nodos interiores deben ser iguales. La primera deri

vada de la ecuación 18.28 es

f\x) = 2ax + b

Por tanto, la condición se puede representar de manera general como

2a¡-\x,-\ + b¡-[ = 2a¡Xi-\ + b¡ (18.33)

para i = 2 a n. Esto proporciona otras n — 1 condiciones para un total de 2n + n — 1 = 3« — 1. Como se tiene 3n incógnitas, se tiene una condición corta. A menos que tengamos alguna información adicional con respecto a las funciones o sus derivadas, debemos tomar una selección arbitraria para calcular de manera exitosa las constantes. Aunque hay un número de elecciones diferentes que se pueden tomar, seleccionamos la siguiente:

4 . Suponga que en el primer punto la segunda derivada es cero. Como la segunda derivada de la ecuación 18.28 es 2a¡, esta condición se puede expresar matemáticamente como

«i = 0 (18.34)

La interpretación visual de esta condición es que los dos primeros puntos se conectarán con una línea recta.

EJEMPLO 18 .9 Segmentarias cuadráticas

j Enunciado del problema. Ajustar por medio de segmentarias cuadráticas los mismos ! datos que se usaron en el ejemplo 18.8 (véase tabla 18.1). Use los resultados para calcu-\ lar el valor enx = 5.

| Solución. Para este problema, se tienen 4 datos con n — 3 intervalos. Por tanto, 3(3) = \ 9 incógnitas por ser determinadas. Las ecuaciones (18.29) y (18.30) dan 2(3) — 2 = 4 i condiciones:

1 2 0 . 2 5 a i + 4 . 5 & 1 + c i = 1.0

I 20.25(32 + 4.5Í72 + c 2 = 1.0

j 49a 2 + 7 /7 2 + c 2 = 2.5

J 49a 3 + 7fo3 + c 3 = 2.5

Evaluando a las funciones primera y última en los valores inicial y final se agregan 2 ecuaciones mes [véase ecuación (18.31)]:

Page 201: Chapra12-20

5 3 0 INTERPOLACIÓN

9a! +3b> + c i = 2.5

y [véase ecuación (18.32)]

81a 3 + 9 ¿ > 3 + c 3 = 0.5

La continuidad de las derivadas crea un adicional de 3 — 1 = 2 [véase ecuación (18.33)]:

9Ú[ + b\ = 9a2 4- b2

14a 2 + ¿>2 = 14a 3 + ¿>3

Por último, la ecuación (18.34) especifica que ax — 0. Como esta ecuación especifica a¡ de manera exacta, el problema se reduce a la resolución de ocho ecuaciones simultáneas. Estas condiciones se pueden expresar en forma matricial como

4.5 1 0 0 0 0 0 0 " 1 0 0 20.25 4.5 1 0 0 0 C\ 1 0 0 49 7 1 0 0 0 a 2 2.5 0 0 0 0 0 49 7 1 b2

2.5 3 1 0 0 0 0 0 0 C2 2.5 0 0 0 0 0 81 9 1 a 3 0.5 1 0 - 9 - 1 0 0 0 0 0 0 0 14 1 0 - 1 4 - 1 0 C'3 0

Esas ecuaciones se pueden resolver mediante las técnicas de la parte tres, con los resultados:

« i = 0 b\ = — 1 c\ = 5.5

a2 = 0.64 b2 = - 6 . 7 6 c2 = 18.46

a 3 = - 1 . 6 ¿ 3 = 2 4 . 6 £-3 = - 9 1 . 3

las cuales pueden sustituirse en las ecuaciones cuadráticas originales para desarrollar la siguiente relación para cada intervalo:

/,(.v) = —jr + 5.5 3 . 0 < x < 4 . 5

f2(x) = 0.64A- 2 - 6.76JT + 18.46 4.5 < x < 7.0

/ 3(.v) = - 1 . 6 x 2 + 24.6x - 91.3 7.0 < x < 9.0

Cuando se u s a ^ , la predicción para x = 5 es, por tanto,

/ 2 ( 5 ) = 0.64(5) 2 - 6.76(5) + 18.46 = 0.66

El ajuste total por segmentarias se ilustra en la figura 18.166. Observe que hay dos desventajas que se alejan del ajuste: 1) la línea recta que conecta los primeros dos puntos y 2) la segmentaria para el último intervalo parece oscilar demasiado. Las segmentarias cúbicas de la siguiente sección no exhiben estas desventajas y, en consecuencia, son

i«<*molación seamentaria.

Page 202: Chapra12-20

18 .6 .3 Segmentaria» cúbicas

El objetivo en las segmentarias cúbicas es obtener un polinomio de tercer orden partí cada intervalo entre los nodos, como en

f¡ (JC) = a/.v3 + b¡x2 + c¡x + d-, (18.35)

Así, para n + 1 datos (i — 0, 1, 2 , . . . , n), existen n intervalos y, por consiguiente, 4« incógnitas constantes para evaluar. Como con las segmentarias cuadráticas, se requieren 4 H condiciones para evaluar las incógnitas. Éstas son:

1 . Los valores de la función deben ser iguales en los nodos interiores (2« — 2 condiciones).

2. La primera y última funciones deben pasar a través de los puntos extremo (2 condiciones).

3. Las primeras derivadas en los nodos interiores deben ser iguales (« — 1 condiciones). 4. Las segundas derivadas en los nodos interiores deben ser iguales (« — 1 condiciones). 5. Las segundas derivadas en los nodos extremo son cero (2 condiciones).

La interpretación visual de la condición 5 es que la función se vuelve una línea recta en los nodos extremo. La especificación de tal condición extremo nos lleva a lo que se denomina como segmentaria "natural". Se le da este nombre debido a que el dibujo segmentario se comporta en esta forma (véase figura 18.15). Si el valor de la segunda derivada en los nodos extremo no es cero (es decir, existe alguna curvatura), esta información se puede usar de manera alterna para suministrar las dos condiciones finales.

Los cinco tipos de condiciones anteriores proporcionan un total de 4n ecuaciones requeridas para resolver los An coeficientes. Mientras sea ciertamente posible desarrollar segmentarias cúbicas en esta forma, presentamos una técnica alterna que requiere la solución de sólo n — 1 ecuaciones. Aunque la obtención de este método (véase cuadro 18.3) es algo menos directo que para las segmentarias cuadráticas, la ganancia en eficiencia bien vale el esfuerzo.

La derivación del cuadro 18.3 resulta en la siguiente ecuación cúbica para cada intervalo:

r / \ f¡"(Xi~l) , x 3 , fi (Xi) , N 3

fi(x) = 7 - 1 Ax¡ - xY + — -(x - Xi-xY

f(*i-Ó /"(*/-! )(*/ - X¡-Ó'

+

x¡ — Xi-\ 6

/(*/) f"(Xi)(Xj -Xj.Q

Xi — 6

(x¡ - x)

( A - X , - , ) (18.36)

Esta ecuación contiene sólo dos incógnitas (las segundas derivadas al final de cada intervalo). Esas incógnitas se pueden evaluar mediante la siguiente ecuación:

(x¡ - * ¡ _ I ) / V Í - Í ) + 2 ( x , + 1 - x , _ , ) / U ) + (JCi+i - x,)f"(x¡+l)

6 -/(*,•)]+ _6 \f(x¡-ú - f{x¡)] ( 1 8 . 3 7 )

X¡ + \ — X¡ X¡ — Xj-\

Page 203: Chapra12-20

532 INTERPOLACIÓN

C u a d r o 1 8 . 3 D E R I V A C I Ó N D E S E G M E N T A R I A S C Ú B I C A S

]a derivación (Cheney y Kincaid, 1985) se 1.1 primer paso er>^ j o n d e c o m o c a d a p a r d e n o d o s s e c o t l e c t a

biisii en la observa e g u n d a derivada dentro de cada intervalo es por una cúbica, la ¡> e c u a c i ó n ( 1 8 3 5 ) s e p u e d e diferenciar dos una linea recta. L*» e s t a o b s e r v a c i ó n . C o n e s t a b a s 6 ; ) a s e g unda voces para verifica p r e s e n t a r con una interpolación polinomial derivada se puede í Qrden [véase e c u a d ó n (,g 22)]. de Lagrange de prv

x — x¡ f¡\x) = f!Xx¡^>Xi-l ~Xi

+ fi(M)- X¡-1 Xi - x¡.

(B18.3.1)

jot de la segunda derivada en cualquier pun-úonde f¡"(x) es el V i n t e r valo . Así, esta ecuación es una línea lo x dentro de i-ésV g e g u n d a d erivada en el primer nodo/"(*,_i) recta que conecta 1 * ^ £ n e , s e g u n d o n o d o f , ( x ¡ ) _ con la segunda d e f í ^ c i ó n ( B 1 8 3 j) s e p u e d e integrar dos veces

Después, la e¿ e s ¡ o n p a r a ^ § i n e m D a r g 0 ; e s t a e x p r e . para obtener una n s t a n t e s desconocidas de integración. Esas Hión contendrá dos e v a l u a r a l l l a m a r a l a f u n c i ó n d e condicio-constantes se pued* ) d e b e s e r ¡ g u a l a f ( x ¡ t ) e n ^ y f ( x ) d e b e

nos de igualdad / A 1 r e a i ¡ z a r e s t a s evaluaciones, resulta la ser igual &f(xt) en % b i c a :

siguiente ecuación 6

f!Xx¡ fi(X) =

(x¡ - xY + f'M)

6(x¡ — Xi-

f'XxMxi-Xi-i)'

:(-v-.v,_]r

(x¡ - x)

(X - A V - l )

(B 18.3.2)

esta relación es una expresión mucho más j Ahora, es claro qu^ ^ ^ ^ ^ cúbica para el ¡-ésimo interva-

compheada para ufl u a c i o n ( 1 8 3 5 ) s i n e m b a r g 0 , observe que lo que, digamos, la 0

, , ,

contiene solo dos "coeficientes" desconocidos, las segundas derivadas al inicio y al final del intervalo —fXx¡_,) y/"(*,)—. De esta forma, si podemos determinar la segunda derivada adecuada en cada nodo, la ecuación (B 18.3.2) es un polinomial de tercer orden que se puede usar para interpolar dentro del intervalo.

Las segundas derivadas se evalúan al llamar las condiciones de que las primeras derivadas en los nodos deben ser continuas:

(B18.3.3)

La ecuación (B18.3.2) puede diferenciarse con el fin de dar una expresión para la primera derivada. Si esto se hace tanto para el (/' — l)-ésimo, como para /-ésimo intervalo y los dos resultados se igualan de acuerdo con la ecuación (B18.3.3), resulta la siguiente relación:

(x¡ - A - ; - I ) / " ( . Y ; - I ) + 2 ( J : / + I - x¡-i)f"(x¡) + (Xi + \ -Xi)f"(x¡ + \)

6 [f(xl+l) - f(X¡)] Xi + \ — x¡ + IftXi-l) - f(Xi)]

Xi X¡ — \ (B18.3.4)

Si la ecuación (B18.3.4) se escribe para todos los nodos interiores, n — 1 ecuaciones simultáneas resultan con n + 1 segundas derivadas desconocidas. Sin embargo, ya que ésta es una segmentaria cúbica natural, las segundas derivadas en los nodos extremo son cero y el problema se reduce a n — 1 ecuaciones con n — 1 incógnitas. Además, observe que el sistema de ecuaciones será tridiagonal. Así, no sólo redujimos el número de ecuaciones, sino que las forjamos en una forma que es en extremo fácil de resolver (recuerde la sección 11.1.1).

Si esta ecuación es descrita para todos los nodos interiores, resulta n — 1 ecuaciones simultáneas con n — 1 incógnitas. (Recuerde que las segundas derivadas en los nodos extremo son cero.) La aplicación de esas ecuaciones se ilustra en el siguiente ejemplo.

EJEMPl¿? 18 .10 Segmentarias cúbicas

Enunciado del problema. Ajuste por segmentarias cúbicas los mismos datos que se usaron en los ejemplos 18.8 y 18.9 (véase tabla 18.1). Utilice los resultados para estimar el valor en x = 5.

Page 204: Chapra12-20

Solución, lil primer paso es emplear la ecuación (18.37) para generar un conjunto de ecuaciones simultáneas que serán utilizadas para determinar las segundas deriviiduN en los nodos. Por ejemplo, para el primer nodo interior se usan los siguientes datos:

= 3 f(x0) = 2.5

X\ = 4.5 1

X2 = 7 f(X2) = 2.5

Estos valores pueden sustituirse en la ecuación (18.37) para dar

(4.5 - 3)/"(3) + 2(7 - 3)/"(4.5) + (7 - 4.5)/"(7) 6 6

: ( 2 . 5 - D + — - ( 2 . 5 - 1 ) 1 7 - 4 . 5 4 . 5 - 3

j | Debido a la condición de la segmentaria natural,/"(3) = 0, y la ecuación se reduce a

| 8/"(4.5) + 2.5/"(7) = 9.6 | En una forma similar, la ecuación (18.37) se aplica al segundo punto interior para ob-i tener

j 2.5/"(4.5) + 9/"(7) = - 9 . 6

í | Estas dos ecuaciones pueden resolverse simultáneamente para dar j /"(4.5) = 1.67909

| f " { l ) = - 1 . 5 3 3 0 8 | Estos valores se sustituyen entonces en la ecuación (18.36), junto con los valores de ¡ las x y las/(x), para obtener I 1.67909 , 2.5 | Mx) = (x - 3) 3 + (4.5 - x )

J 6 ( 4 . 5 - 3 ) 4.5 -3 ' 1 1.67909(4.5 - 3)

(x - 3) _ 4 . 5 - 3 6

o

/ i ( x ) = 0.186566 (x - 3 ) 3 + 1.666667(4.5 - x ) + 0.246894 (x - 3)

Esta ecuación es la segmentaria cúbica para el primer intervalo. Sustituciones similares se pueden hacer para desarrollar las ecuaciones para el segundo y tercer intervalo:

/ 2 ( x ) = 0.111939(7 -xf - 0 . 102205 (x - 4.5) 3 - 0.299621(7 - x ) + 1.638783(x - 4 . 5 )

y

/•,(*) = -0 .127757 (9 - x ) 3 + 1.761027(9 - x) +().25(x - 7)

Page 205: Chapra12-20

534 INTERPOLACIÓN

Se puede emplear las tres ecuaciones para calcular los valores dentro de cada intervalo. Por ejemplo, el valor enx = 5, el cual está dentro del segundo intervalo, se calcula como

/ 2 (5) = 0.111939(7 - 5 ) 3 -0 .102205(5 - 4.5) 3 - 0.299621(7 - 5)

+ 1.638783(5 - 4.5) = 1.102886

Se calculan otros valores y los resultados se grafican en la figura 18.16c.

Los resultados délos ejemplos 18.8 a 18.10 se resumen en la figura 18.16. Observe la mejora progresiva del ajuste conforme nos movemos de lineales a cuadráticas y a segmentarias cúbicas. También hemos sobrepuesto un polinomio de interpolación cúbica sobre la figura 18.16c. Aunque la segmentaria cúbica consiste en una serie de curvas de tercer orden, la resultante difiere de la obtenida al usar el polinomio de tercer orden. Esto se debe al hecho de que la segmentaria natural no requiere de segundas derivadas en los nodos extremo, mientras que el polinomio cúbico no tiene tal restricción.

1 8 . 6 . 4 Algor i tmo de cómputo para segmentar ias cúbicas

El método para calcular segmentarias cúbicas, descrito en la sección anterior, es ideal para la implementación en computadora. Recuerde que, con algunas manipulaciones inteligentes, el método se reduce a la resolución de n — 1 ecuaciones simultáneas. Un beneficio extra de la derivación implica, como lo especifica la ecuación (18.37), que el sistema de ecuaciones es tridiagonal. Como se describió en la sección 11.1, los algoritmos están disponibles para resolver tales sistemas en una manera en extremo eficiente. La figura 18.18 muestra una estructura computacional que incorpora esas características.

Observe que la rutina en la figura 18.18 regresa sólo un valor interpolado, yu, para un valor dado de la variable dependiente, xu. Ésta es sólo una forma con la cual se puede implementar la interpolación segmentaria. Por ejemplo, a usted le gustaría determinar ahora los coeficientes y después realizar muchas interpolaciones. Además, la rutina da tanto la primera derivada (dy) como la segunda (dy 2) en xu. Aunque no es necesario calcular esas cantidades, son útiles en muchas aplicaciones de la interpolación segmentaria.

P R O B L E M A S

18.1 Estime el logaritmo de 5 de base 10 (log 5) mediante Interpolación lineal. a) Interpole entre log 4 = 0.60206 y log 6 = 0.7781513. b) Interpole entre log4.5 = 0.6532125 y log 5.5 = 0.7403627.

Para cada una de las interpolaciones, calcule el porcentaje de error relativo con base en el error real. IH.2 Ajuste con'un polinomio de interpolación de Newton de segundo orden para estimar log 5 por medio de los datos del problema 18.1. Calcule el error relativo porcentual real. I N..1 Ajuste con un polinomio de interpolación de Newton de ter-oor orden para estimar log 5 usando los datos del problema 18.1.

18.4 Dados los datos

X 1 2 2.5 3 4 5

f|x) 1 5 7 8 2 1

a) Calcule/(3.4) mediante polinomios de interpolación de Newton de orden 1 a 3. Escoja la secuencia de puntos para su estimación con el fin de obtener la mejor exactitud posible.

b) Utilice la ecuación (18.18) para estimar el error para cada predicción.

I K.5 Dados los datos

Page 206: Chapra12-20

PROBLEMA5 0 9 9

SUtíKOUTINH bpllne (x,y.n,xu,yu,dy,d2y) LOCAL en¡ fn¡ qfíi rn¡ d2xn

CALL Tridiag(x,y,n,e,f,g,r) CALL Decomp(e,f,g,n-1) CALL 5ubst(e,f,g,r,n-1,d2x) CALL lnterpo\(x,y,n,d2x,xu,yu,dy,d2y) END Spline

SU&ROUTINE Tridiag (x, y, n, e, f, g, r) f1 = 2*(xz-x0)

01 = F X 2 - X I )

r, = 6 / (x2-x<¡) * (yz-y:) r, = r,+6/(x-x0) * (y 0 -y,; DO 1-2, n -2

e¡ = (x¡-xH) fi = 2*(xM-xH) 0¡ = (x¡+i-x¡)

n = 6 /(*i+i-xi)*(yM-y¡) END DO

fn-^2.*(x„-x^2) r„_, = 6/(x„ - xn_,) * (y n-y n_,) V , = r^+6l{xnA - x n_ 2j * (y„_2 -y n _,) END Tridiag

5UPR0UTINE Interpol (x,y,n.d?,x.xu,yu,dy.dZy) fíag = O 1 = 1 DO

IFxu>x¡_^ANDxu<xJHEN el = d2x-, _ /&/(x¡ - x¡ _,) c2 = d2x/6/(xi-x¡_1) c5 = (y _ /(x, - X; _,) - d2x¡ _, * (x, - x¡ _ ,)/6 c4 = (y/(x¡ - x¡ _,) - d2x¡ * (x¡ - x¡ _ ,)/6 t1 = d * (x,-xuf t 2 = c 2 * ( x u - X J _ , J 3

t 3 = c3 * (x¡ - xu) 1A = c4*(xu-x¡_i) yu=t1 + t2 + t3 + t4 t í = -3*c1 *(x¡-xuf t2 = 3*c2*(xu-x¡_1f 13 =-c3 t4 = c4 dy = t1 + t2 + t3 + t4 t í = 6* el* (x¡ - xu) t2 = 6*c2*(xu-xi_1) d2y = t í + t 2 fíag = í

EL5E i = i + 1

END IF IFi = n + WK flag = 1 EXIT

END DO IF flag = O THEN

PRINT "outside range" pause

END \F END Interpol

F I G U R A 1 8 . 1 8 Algoritmo para interpolación segmentaria cúbica.

Page 207: Chapra12-20

5 3 6 INTERPOLACIÓN

X 1 2 3 5 6

/|x) 4.75 4 5.25 19.75 36

Calcule f(A) usando polinomios de interpolación de Newton de orden 1 a 4. Escoja sus puntos base para obtener una buena exactitud. ¿Qué le indican los resultados con respecto al orden que se usó de los polinomios para generar los datos en la tabla? 18.6 Repita los problemas 18.1 hasta 18.3 mediante polinomios de Lagrange. 18.7 Repita el problema 18.5 usando el polinomio de Lagrange de orden 1 a 3. 18.8 Emplee interpolación inversa usando interpolación de polinomios cúbica y bisección para determinar el valor de x que corresponda a f(x) = 0.3 para los siguientes datos tabulados,

X 1 . 2 3 4 5 6 7

f(x) 1 0.5 0.3333 0.25 0.2 0.1667 0.1429

18.9 Emplee interpolación inversa para determinar el valor de x que corresponda a f(x) = 0.93 para los siguientes datos tabulados,

X 0 1 2 3 4 5

f(x) 0 0.5 0.8 0.9 0.94117 6 0.961538

Observe que los valores en la tabla fueron generados con la función/(x) = x2l(\ + x2). a) Determine en forma analítica el valor correcto. b) Use interpolación cuadrática y la fórmula cuadrática para

determinar numéricamente el valor. c) Use interpolación cúbica y bisección para determinar el valor

de manera numérica. 18.10 Desarrolle segmentarias cuadráticas para los primeros 5 datos en el problema 18.4 y prediga/(3.4) y f(2.2). 18.11 Desarrolle segmentarias cúbicas para los datos en el problema 18.5, y a) prediga f(4) y7(2.5) y b) verifique que7^(3) y / 3 (3 ) = 5.25. 18.12 Determine los coeficientes de la parábola que pasa a través de los tres últimos puntos del problema 18.4. 18.13 Determine los coeficientes de la ecuación cúbica que pasa a través de los primeros cuatro puntos del problema 18.5. 18.14 Desarrolle, depure y pruebe un programa de prueba en un lenguaje de alto nivel o un lenguaje macro de su elección para

implementar interpolación de polinomios de Newton con base en la figura 18.7. 18.15 Pruebe el programa que desarrolló en el problema 18.14 para los mismos cálculos del ejemplo 18.5. 18.16 Use el programa que desarrolló en el problema 18.14 para resolver los problemas 18.1 hasta 18.3. 18.17 Use el programa que desarrolló en el problema 18.14 para resolver los problemas 18.4 y 18.5. En el problema 18.4, utilice todos los datos para desarrollar polinomios de primer orden al quinto. Para ambos problemas, grafique el error estimado contra el orden. 18.18 Desarrolle, depure y pruebe un subprograma en lenguajes de alto nivel o en un lenguaje macro de su elección para implementar interpolación de Lagrange. Con base en el pseudocódigo de la figura 18.11. Pruébelo con los mismos datos del ejemplo 18.7. 18.19 Una aplicación útil de la interpolación de Lagrange es llamada tabla de consulta. Como su nombre lo implica, ésta involucra "consultar" un valor intermedio de la tabla. Para desarrollar un algoritmo como tal, la tabla de x y los valores de f(x) se guardan primero en un par de arreglos unidimensionales. Esos valores se pasan entonces a una función junto con el valor de x que usted quiera evaluar. La función entonces ejecuta dos tareas. Primero, va por la tabla hasta que encuentra el intervalo dentro del cual está la incógnita. Después se aplica una técnica como la interpolación de Lagrange para determinar el valor adecuado de f(x). Desarrolle tal función usando un polinomio de Lagrange cúbico para realizar la interpolación. Para valores intermedios es una excelente selección, ya que la incógnita estará ubicada en el intervalo medio de los cuatro puntos necesarios para generar la cúbica. Sea cuidadoso con los intervalos primero y último donde éste no es el caso. También tenga su código para detectar cuándo requiere el usuario un valor fuera del rango de las x. Para tales casos, la función debería mostrar un error de mensaje. Pruebe su programa para f(x) = ln x mediante datos desde x = 0, 1, 2 , . . . , 10.

18.20 Desarrolle, depure y pruebe un subprograma en un lenguaje de alto nivel o un lenguaje macro de su elección para implementar interpolación segmentaria cúbica con base en la figura 18.18. Pruebe el programa con los mismos datos del ejemplo 18.10. 18.21 Use el software que desarrolló en el problema 18.20 para ajustar segmentarias cúbicas a través de los datos en los problemas 18.4 y 18.5. Para ambos casos, prediga/(2.25).

Page 208: Chapra12-20

CAPÍTULO 19

Aproximación de Fourier

Hasta aquí, nuestra representación de interpolación ha enfatizado los polinomios estándar (es decir, combinaciones de los monomios 1, x, x2,..., x™ (véase figura 19.1a). Ahora veremos otra clase de funciones que son de mucha importancia en la ingeniería. Éstas son las funciones trigonométricas 1, cosx, eos 2x,..., eos nx, sen x, sen 2x,..., sen nx (figura 19.16).

Los ingenieros con frecuencia tratan con sistemas que oscilan o vibran. Como podría esperarse, las funciones trigonométricas juegan un papel importante en el modelado de tales problemas en contexto. La aproximación de Fourier representa un esquema sistemático al usar series trigonométricas para este propósito.

F I G U R A 1 9 . 1 Los primeros cinco a) monomios y b) funciones trigonométricas. Observe que para los intervalos mostrados, ambos tipos de función tienen un valor de rango entre - 1 y 1. Sin embargo, note que los valores pico para los monomios ocurren todos en los extremos, mientras que para las funciones trigonométricas los picos están más uniformemente distribuidos a través del intervalo.

eos 2/

Page 209: Chapra12-20

5 3 8 APROXIMACIÓN DE FOURIER

Una de las características de un análisis de Fourier es que trata con ambos dominios: el tiempo y la frecuencia. Como algunos ingenieros no se sienten muy cómodos con el último, se ha desarrollado una larga fracción del material subsecuente para una revisión general de la aproximación de Fourier. Un aspecto importante de esta revisión será familiarizarse con el dominio de la frecuencia. Esta orientación es después seguida por una introducción a los métodos numéricos para calcular transformadas de Fourier discretas.

1 9 . 1 A J U S T E P E C U R V A S C O N F U N C I O N E S S I N U S O I D A L E S

Una función periódica f(i) es una para la cual

/ ( r) = f(t + T) (19.1)

F I G U R A 1 9 . 2 Además de las funciones trigonométricas tales como senos y cosenos, las funciones periódicas incluyen formas de onda como lo son a] la onda cuadrada y b) la onda de dientes de sierra. Más allá de estas formas idealizadas, las señales periódicas en naturaleza pueden ser c) no ideales y d] contaminadas por ruido. Las funciones trigonométricas se pueden usar para representar y analizar todos estos casos.

a)

« T H

b)

*

* 7 " H •

c)

i

Page 210: Chapra12-20

19 .1 A J U S T E D E C U R V A S C O N F U N C I O N E S S I N U S O I D A L E S S t f

donde Tes una constante llamada periodo, que es el valor más pequeño para el cunl ON válida la ecuación (19.1). Ejemplos comunes incluyen formas en onda tales como cuadradas y dientes de sierra (véase figura 19.2). Las más fundamentales son las funciones sinusoidales.

En el presente análisis se usará el término sinusoide para representar cualquier forma de onda que se pueda describir como un seno o coseno. No existe una convención muy clara para escoger alguna función, y en cualquier caso, los resultados serán idénticos. Para este capítulo se usará el coseno, el cual se puede expresar de manera general como

Así, cuatro parámetros sirven para caracterizar el sinusoide (véase figura 19.3). El valor medio A0, ajusta la altura promedio por arriba de la abscisa. La amplitud Cj especifica la

F I G U R A 1 9 . 3 o) Una gráfica de la función sinusoidal y(f) = AQ + Cj eos [COQÍ + 6). Para este caso, AQ = 1.7, C, = 1, OQ = 2K/T= 2JI/|1 .5 s), y 0 = jt/3 radianes = 1.0472 (= 0.25 s). Otros parámetros usados para describir la curva son la frecuencia f = «13/(271), la cual para este caso es 1 ciclo/(l .5 s), y el periodo T= 1.5 s. b| Una expresión alterna para la misma curva es y[f¡ = AQ + A-¡ eos («r/) + 8] sen (ca f). Los tres componentes de esta función son ¡lustrados en b), donde A, = 0.5 y 8] = -0 .866 . La sumatoria de las tres curvas en b) da la curva simple en a).

f(t) = A0 + Ci eos (&>oí + 0) (19.2)

2TC

2 -

- 1

0

6, sen (ffibO

A, eos (cobí)

Page 211: Chapra12-20

840 APROXIMACIÓN DE FOURIER

F I G U R A 1 9 . 4 Ilustraciones gráficas de o) un ángulo de fase en retraso y b) un ángulo de fase adelantado. Observe que la curva en atraso en o) puede describirse de manera alterna como eos [COQÍ +

3TI/2|. En otras palabras, si una curva se atrasa por un ángulo de a, también se puede representar como adelanto por 2n - a.

altura de la oscilación. La frecuencia angular co0 caracteriza con qué frecuencia ocurren los ciclos. Finalmente, el ángulo de fase, o corrimiento de fase 9, parametriza la extensión a la cual el sinusoide es corrido horizontalmente. Puede ser medido como la distancia en radianes de t = 0 al punto en el cual la función coseno comienza un nuevo ciclo. Como se ilustra en la figura 19.4a, un valor negativo es referido como un ángulo de fase de atraso, ya que la curva eos ( o y — 9) comienza un nuevo ciclo en 9 radianes después de eos (Cüfjt). Así, eos (fifoí — 9) se dice que tiene un retraso eos (ot%r). En forma opuesta, como se muestra en la figura 19.46, un valor positivo es referido como un ángulo de fase adelantado.

Observe que la frecuencia angular (en radianes/tiempo) está relacionada con la frecuencia / (en ciclos/tiempo) por

cü0 = 2xf (19.3) y la frecuencia en turno está relacionada con el periodo T (en unidades de tiempo) por

(19.4)

Aunque la ecuación (19.2) es una caracterización matemática adecuada de un sinusoide, es difícil trabajar desde el punto de vista de la curva que habrá de ajustarse, ya

Page 212: Chapra12-20

i T i I A J U B I B PB tUKVAB CON rUNCIONM f 1NU80IDAJ8 que el adelanto de la fase está incluido en el argumento de la función coseno. Esta deficiencia se puede resolver al involucrar la identidad trigonométrica

Cj eos (cu0f + 9) = Cj [eos (CÜ¡,Í) eos (9) - sen (ciy) sen (9)] (19.5)

Sustituyendo la ecuación (19.5) en la (19.2) y mediante la agrupación de términos se obtiene (véase la figura 19.36)

f(t) = A0 + Ax eos (ct^í) + Bx sen ( a y ) (19.6)

donde

Ax = Cj eos (9) Bx = - C , sen (9) (19.7)

Dividiendo las dos partes de la ecuación (19.7) se obtiene

9 = a r c t a n ^ - - ^ (19.8)

donde, si Ax < 0, agregue 7ra 9. Si se eleva al cuadrado y se suma la ecuación (19.7) se tiene

C [ = JÁ\ + B2 (19.9) Así, la ecuación (19.6) representa una formulación alterna de la ecuación (19.2) que todavía requiere cuatro parámetros, pero que se encuentra en el formato de un modelo lineal general [recuerde la ecuación (17.23)]. Como se analizará en la^próxima sección, se puede simplemente aplicar como la base para un ajuste por mínimos cuadrados.

Sin embargo, antes de proceder con la próxima sección, se debería resaltar que se podría haber empleado un seno más que un coseno como nuestro modelo fundamental de la ecuación (19.2). Por ejemplo,

= A0 + C, sen (ü)0? + 5)

podría haberse usado. Se puede aplicar relaciones simples para convertir entre las dos formas

/ n

sen (co0f + 8) = eos I co^t + 8 ——

eos (co0í + 9) = sen \^co0t + 9 + -j-j (19.10)

En otras palabras, 9=8— n/2. La única consideración importante es que uno u otros formatos deberían usarse en forma consistente. Así, usaremos la versión coseno en todo nuestro análisis. 19 .1 .1 Ajuste por mínimos cuadrados de un s inusoide La ecuación (19.6) puede ser pensada como un modelo lineal de mínimos cuadrados

Page 213: Chapra12-20

542 APROXIMACIÓN DE FOURIER

y=A0 + Ax eos (co0t) 4- Bx sen (coQt) + e (19.11)

la cual es justamente otro ejemplo del modelo general [recuerde la ecuación (17.23)]

y — aQz0 + a , Z | + a2z2 H ra„,zm + e (17.23)

donde z 0 = 1, zl = eos (co0f), z 2 = sen ( G ) 0 Í ) y todas las otras z = 0. Así, nuestra meta es determinar los valores del coeficiente que minimicen

N Sr = 2 {yi -[Aq + Aí eos (co0í,.) + Bx sen (c<y,)]}2 Las ecuaciones normales para cumplir esta minimización se pueden expresar en forma

de matriz como [recuerde la ecuación (17.25)]

N X eos (co0f) X sen (ci^r) X eos (co0t) X eos 2 (a>0t) X eos ( É O 0 Í ) sen (<w0r) X sen ( G ^ Í ) X eos (o)0f) sen (cu0r) X sen 2 (co0t)

Ax

A )

X Y eos (a^t) X Y sen (c^r)

(19.12)

Estas ecuaciones se pueden emplear para resolver los coeficientes desconocidos. Sin embargo, en lugar de hacer esto, se examina el caso especial donde hay N observaciones espaciadas de manera uniforme en intervalos de Ai y con una longitud registrada total de T = (N — 1) Ai. Para esta situación, los siguientes valores promedio pueden determinarse (véase el problema 19.3):

X sen (tt^í) N X sen 2 (ofof) N

= 0

_ J _

~ 2

X E O S (CÚqÍ) N X E O S 2 ( F T F O F ) N

0

(19.13)

X eos (úfyí) sen (co^f) N 0

Así, para los puntos igualmente espaciados, las ecuaciones normales son

ly X Y eos (co^t) N 0 0 ¿0 0

N/2 0 •

0 0

N/2 A

La inversa de una matriz diagonal es sólo otra matriz diagonal, cuyos elementos son los dos recíprocos del original. Así, los coeficientes se pueden determinar como

\AQ) [l/NO O l í ly ] {A^** I 0 2/N 0 I ] S J / C O Í C F I V ) \

Page 214: Chapra12-20

19,1 A J U S T E D E C U R V A S C O N F U N C I O N E S S I N U S O I D A L E S 543

4> = -^7- (19.14) N

¿ , = — X y c o s ( f l W ) (19.15) N

Bx = — ly sen (co0t) (19.16) N

EJEMPLO 19.1 Ajuste por mínimos cuadrados de un sinusoide

[ Enunciado del problema. La curva en la figura 19.3 se describe por y — 1.7 + eos (4.189í + 1.0472). Genere 10 valores discretos para esta curva en intervalos de Ai = 0.15 para el rango de t = 0 a 1.35. Use esta información para evaluar los coeficientes de

j la ecuación (19.11) por ajuste de mínimos cuadrados.

1 Solución. Los datos requeridos para evaluar los coeficientes con (ü = 4.189 son

t y y eos (io0f) y sen (io0f)

0 2.200 2.200 0.000 0.15 1.595 1.291 0.938 0.30 1.031 0.319 0.980 0.45 0.722 -0.223 0.687 0.60 0.786 -0.636 0.462 0.75 1.200 -1.200 0.000 0.90 1.805 -1.460 -1.061 1.05 2.369 -0.732 -2.253 1.20 2.678 0.829 -2.547 1.35 2.614 2.114 -1.536

1= 17.000 2.502 -4.330

Estos resultados se pueden usar para determinar [véase ecuaciones (19.14) a (19.16)]

17.000 2 2 A0 = — ^ — = 1.7 A, = ^ 2 . 5 0 2 = 0.500 Bx = — ( - 4 . 3 3 0 ) = -0 .866

De esta manera, el ajuste por mínimos cuadrados es

y= 1.7 + 0.500 eos (co0t) - 0.866 sen (c%t)

El modelo se puede expresar también en el formato de la ecuación (19.2) al calcular [véase ecuación (19.8)]

/ - 0 . 8 6 6 \ 9 = arctan — — — - = 1.0472

V 0.500 / y [véase ecuación (19.9)]

Cj = s/(0.5)2 + ( -0 .866) 2 = 1.00

para dar

Page 215: Chapra12-20

544 APROXIMACIÓN DE FOURIER

y = 1.7 + eos (coot + 1.0472)

o alternativamente como un seno usando la [ecuación (19.10)]

y = 1.7 + sen (ü)0r + 2.618)

El análisis anterior se puede extender al modelo general

f(t) — A0 + Ax eos (fi)0f) + Bx sen (a>Qt) + A2 eos (2co0í) + B2 sen (2(O0f) H h A m eos (mcüQt) + Bm sen (mco0t)

donde, para datos igualmente espaciados, los coeficientes pueden ser evaluados por

ly A0 = N

A¡ = ly eos (Jo)0t) N 2

Bj = — ly sen (Jco0t)

j = 1,2, . . . , /n

Aunque estas relaciones se pueden usar para ajustar datos en el sentido de regresión (esto es, N > 2m + 1), una explicación alternativa es emplearlos para interpolación o colocación (es decir, usarlos para el caso donde el número de incógnitas, 2m + 1, sea igual al número de datos, N. Éste es el procedimiento usado en la serie de Fourier continua, como se describirá a continuación.

1 9 . 2 S E R I E D E F O U R I E R C O N T I N U A

En el curso del estudio de problemas de flujo de calor, Fourier demostró que una función periódica arbitraria, se puede representar por medio de una serie infinita de sinusoides de frecuencias relacionadas de manera armónica. Para una función con un periodo T, una serie de Fourier continua se puede escribir1

f(t) — a0 + ax eos (fty) + bx sen (to0í) + a2 eos ( 2ay ) + b2 sen (2tt^í) + ...

o de manera más concisa,

f(t)= a0 + 2 [ak eos (katf) + bk sen (ko^t)] (19.17)

donde COQ = 2r t / res llamada la frecuencia fundamental y sus múltiplos constantes 2(0$,

3cüb, etcétera, son llamados armónicos. De esta forma, la ecuación (19.17) expresaf(t) como una combinación lineal de las funciones base: 1, cos(a\,f), sen (u^í), c o s (2&V)' sen (2fi) 0 r), . . .

La existencia de las series de Fourier eslá releridn en Ins condiciono» de Dirichlol, Ins cunlos ospeci llcim que la función periódica licnc un número finito de máximos y mínimos y quo liuy un número finito do «nilón dlicontlnuoi. En general, lodií lai funeionei perlódloii derlvidw fliioamtntc utUtiotn ntii oondlolonei.

Page 216: Chapra12-20

19.2 SERIE DE FOURIER CONTINUA 0 4 1

Como se describe en el cuadro 19.1, los coeficientes de la ecuación (19.17) se pueden calcular por medio de

f f(t) eos (kco0t) dt (19.18) Jo

2_ <-T

T

y

bk = — í f(t) sen (kco0t) dt (19.19) T Jo

para k = 1, 2 , . . . y

a0 = — fTf(t)dt (19.20) T Jo

C u a d r o 1 9 . 1 Determinación de los coeficientes de la serie de Four ier continua

('orno se hizo para los datos discretos de la sección 19.1.1 , se la cual se puede resolver para puede establecer las siguientes relaciones: ,.j ,

JO f ^ d t

<3FJ = j

/ sen (kco0t) dt = £ eos (km0t) dt = 0 (B19.1.1) M U ^ e s s i m p l e m e n t e e l v a l o r p r o m e d i o de la función en ol

periodo. rr Para evaluar uno de los coeficientes coseno, por ejemplo

/ eos (ko)0t) sen (gco0t) dt = 0 (B19.1.2) a ^ \ a ecuación (19.17) se puede multiplicar por eos (mco0t) e integrar para obtener

f sen (kco0t) sen (g(O0t) dt = 0 (B19.1.3) CT, . X J fT

Jtt

v 0 ' ^ Q ' f(t) eos (mft)0í) dt = / a0 eos (mco0t) dt Jo Jo

J eos (*ay) eos (goy) A = 0 (B19.1.4) + / X Ú * C ° S ^ C ° S ( W Í Ü B 0 *

rr fT T * = 1

/ sen 2 (kü)0t) dt = / eos 2 (kcoüt) dt = (B19.I.5) •AI 2 + Y ^ ¿>t sen (k(o0t) eos ( m a y ) ¿ft (B19.1.6)

lo k= I l'ni'ii evaluar sus coeficientes, cada lado de la ecuación (19.17)

se puede integrar para dar D e l a s ecuaciones (B19.1.1), (B19.1.2) y (B19.1.4), se observa que cada término del lado derecho es cero, con excepción del

T ^ caso donde k = m. Este último caso se puede evaluar con la f /(/) di = f a0dt + f V [a t eos (/fcay) ecuación (B19.1.5) y, por tanto, la ecuación (B19.1.6) se puede

Jo Jo Jo ¿—i resolver para am, o de manera más general [véase ecuación

+ bk sen {kwfjt)) dt (19-18)]> k= I

2 r T

( orno cuela término en la sumatoria es de la forma de la ecua- a* = — / I'II'M (BI9.1.1), las ecuaciones son 0

/(?) eos (keüot) dt

para k = 1, 2, 3 , . . .

/

/ En forma similar, la ecuación (19.17) se puede multiplicar

/ (/) di «„ T por sen (rna^t), integrarla y reordenarla para obtener la ecuación (19.19).

Page 217: Chapra12-20

546 APROXIMACIÓN DE FOURIER

EJEMPLO 19.2 Aproximación de la serie de Fourier continua

! Enunciado del problema. Use la serie de Fourier continua para aproximar la función | de onda cuadrada o rectangular (véase la figura 19.5)

1 F - 1 -T/2<t<-T/4 ! / ( 0 = L 1 -T/4<t< T/4 | L - 1 T/4 < t < T /2

\ Solución. Como la altura promedio de la onda es cero, se puede obtener en forma directa un valor de a0 — 0. Los coeficientes restantes se pueden evaluar como [véase

| ecuación (19.18)]

I 2 C1'2

ak = — / ( O EOS ( fc íDní) dt

i J-T/2 2 [" r-T/4 rT/4 fT/2 = — — / EOS (k(OQt) dt + I EOS (kü)Qt) dt — I EOS (kw^t) dt T L J-T/2 J-T/A JT/4

Las integrales se evalúan para dar

4/(kK) para A: = 1, 5, 9,... -4/()br) para A: = 3 , 7, 11 , . . .

0 para k = pares enteros

De manera similar, se puede determinar que todas las b = 0. Por tanto, la aproximación de la serie de Fourier es

4 4 4 4

/ ( / ) = — EOS (A>O0 EOS (3a)0t) + — EOS ( 5 « O O — — EOS (la>0t) + • • • n ÍJÍ 5TX IJÍ

Los resultados de los primeros tres términos se muestran en la figura 19.6. F IGURA 1 9 . 5

Uno forma de onda cuadrada o rectangular con una altura de 2 y un periodo T = 271/(0^.

1 i I i fc

- R -772 0

-1

R/2 R

Page 218: Chapra12-20

19.2 SERIE DE FOURIER CONTINUA' •41

\ 1 — COS(íflbí) \ 1 n

x ^-COS(OJbf )

A k ^-COS(OJbf ) \0y V y ¿ Y b)

y1

nación n n Ü n / i \ / V / Y /

1 U U \ A A /

c)

F I G U R A 1 9 . 6 La aproximación de la serie de Fourier de la onda cuadrada a partir de la figura 19.5. La serie de trazos muestra la sumatoria hasta e incluyendo los términos a) primero, b) segundo y c¡ tercero. Se muestran también los términos individuales que se fueron agregando en cada etapa.

Debe mencionarse que a la onda cuadrada en la figura 19.5 se le llama función par, ya que f(t) = /(—r). Otro ejemplo de una función par es eos (í). Se puede demostra i (Van Valkenburg, 1974) que las b en la serie de Fourier siempre son igual a cero par» funciones pares. Observe también que las funciones impares son aquellas para las C U U I C H

f(t) = —f(—t). La función sen (í) es una función impar. Para este caso las a serán igual a cero.

I

Page 219: Chapra12-20

APROXIMACIÓN DE FOURIER

Además del formato trigonométrico de la ecuación (19.17), la serie de Fourier se puede expresar en términos de funciones exponenciales como (véase el cuadro 19.2 y el apéndice A)

oo

f(t) = ckeikml (19.21)

donde i = H—1 y

i rT'2

- 7 7 2

Esta formulación alterna tendrá utilidad a través del resto del capítulo.

1 rT/2

h = 7f / f(t)e-kuW dt (19.22) í J-T/2

1 9 . 3 F R E C U E N C I A Y D O M I N I O S D E T I E M P O

Hasta este punto, nuestro análisis de la aproximación de Fourier se ha limitado al dominio del tiempo. Esto se debe a que la mayoría de nosotros nos sentimos cómodos al conceptualizar el comportamiento de una función en esta dimensión. Aunque no sea tan conocido, el dominio de la frecuencia proporciona una perspectiva alterna para caracterizar el comportamiento de funciones oscilatorias.

Así, justo como la amplitud contra tiempo se puede graficar, de igual manera también se puede hacer contra la frecuencia. Ambos tipos de expresión se ilustran en la figura 19.7a, donde se ha dibujado una gráfica en tres dimensiones de una función sinusoidal,

f(t) = Cj eos (/ + | )

En esta gráfica, la magnitud de la amplitud de la curva,/(r), es la variable dependiente, y las variables independientes son el tiempo t y la frecuencia/ = WQIITÍ. Así, los ejes de la amplitud y el tiempo forman un plano tiempo, y los ejes amplitud y frecuencia forman un plano frecuencia. Por lo tanto, el sinusoide se puede concebir como si existiera a una distancia 1/7hacia afuera y a lo largo del eje de la frecuencia y corriendo paralelo a los ejes del tiempo. En consecuencia, cuando se habla acerca del comportamiento del sinusoide en el dominio del tiempo, queremos decir la proyección de la curva dentro del plano tiempo (véase la figura 19.1b). De manera similar, el comportamiento en el dominio de la frecuencia es meramente su proyección dentro del plano frecuencia.

Como se observa en la figura 19.7c, esta proyección es una medida de la amplitud positiva máxima del sinusoide Cj. La vuelta completa de pico a pico es innecesaria a causa de la simetría. Junto con la ubicación \IT a lo largo del eje frecuencia, la figura 19.7c define ahora la amplitud y frecuencia del sinusoide. Ésta es una información suficiente para reproducir la forma y tamaño de la curva en el dominio del tiempo. Sin embargo, un parámetro más, llamado ángulo de fase, es requerido para ubicar la curva relativa a t = 0. En consecuencia, se debe incluir un diagrama de fase, como el mostrado en la figura 19.7í/. El ángulo de fase se determina como la distancia (en radianes) de cero al punió en el cuul ocurre el pico positivo. Si el pico ocurre después de cero, se dice que

Page 220: Chapra12-20

19,3 F R E C U E N C I A Y D O M I N I O S D I T I E M P O

C u a d r o 1 9 . 2 Forma compleja de las series de Four ier

I ,a forma trigonométrica de la serie de Fourier continua es o

o o oo oo

f(t) = a0 + V [akcos(kco0t) + bksen(kú)0t)] (B19.2.1) /(O = J^cte'^ + ] T c - ^ " ' * " * ' *= 1

A a i a . J a a tj i i J Para simplificar aún más, en lugar de sumar la segunda serie de A partir de la identidad de Euler, el seno y coseno se pueden , , , \ o . , 1 a » , haga la suma de — 1 a — °°, expresar en torma exponencial como

senx = e " 6 " (B19.2.2) /(?) = ^ c ^ ' ' ^ 0 ' + ] T c-¡te''* 2' 4 = 0 k=-\

a , - a

c o s x = ^ (B19.2.3) 2

las cuales se pueden sustituir en la ecuación (B19.2.1) para dar

/(,) = £ ¿V*1*' ( B 1 9. 2. 6 )

= ao + ^ (e

ika>°>ak 4 . c-ika>n¡ak donde la sumatoria incluye un término para k = 0.

¡t=j V 2 2 / Para evaluar lascólas ecuaciones (19.18) y (19.19) son sus-(B 19.2.4) tituidasenla ecuación (B19.2.5) para obtener

1 fm 1 fm

y a que 1 li = - /'. Podemos definir un número de constantes \ = — / /(O eos (to 0 í) dt — i— I f(t) sen (¿oy) cíf / ^-772 T J-m

c0 — a o Mediante las ecuaciones (B 19.2.2) y (B 19.2.3) y simplificando • . se obtiene

ak-ibk

<-'k —

- aj-it-t a k + l b k ^ = ffZme~'ka°'dt (B19-2-?)

<'-•* = ^ = 2 (B19.2.5) 1

Por tanto, las ecuaciones (B19.2.6) y (B19.2.7) son las versiones complejas de las ecuaciones (19.17) a (19.20). Observe que el

donde, debido a las propiedades de pandad del coseno y del seno, a p é n d i c e A i n d u y e u n r e s u m e n d e l a g i n t e r r e l a c i o n e s e n t r e t 0 .

« A = a-t yh= -b-t La ecuación (B19.2.4) puede, por tanto, d o s ] o s f o r m a t o s d e l a s e r i e d e F o u r i e r q u e s e i n t rodujeron en reexpresarsecomo este capítulo.

.IV) = co + J2^eika"" + Yj~c-ke-ika°l

k=\

está retrasado (recuerde nuestro análisis de atrasos y adelantos en la sección 19.1), y por convención, el ángulo de fase tiene un signo negativo. En forma opuesta, un pico antes de cero se dice que está adelantado y el ángulo de fase es positivo. Así, de la figura 19.7, el pico está en cero y el ángulo de fase se traza como +7t/2. En la figura 19.8 se ilustra algunas otras posibilidades.

Se puede observar ahora que las figuras 19.7c y 19.7a* proporcionan una forma alterna de presentar o resumir las características pertinentes del sinusoide de la figura 19.7a. Se hace referencia a ellas como línea espectral. Se acepta que para una sola sinusoide estas líneas no son muy interesantes. Sin embargo, cuando se aplican a una situación más complicada, digamos, una serie de Fourier, se hace présenle su poder y

Page 221: Chapra12-20

5 5 0 APROXIMACIÓN DE FOURIER

F I G U R A 1 9 . 7 o) Una ilustración de cómo se puede dibujar un sinusoide en los dominios del tiempo y la frecuencia. Se reproduce la proyección del tiempo en b¡, mientras que la proyección de la amplitud-frecuencia se reproduce en c). La proyección fase-frecuencia se muestra en a1).

valor verdadero. Por ejemplo, la figura 19.9 muestra la línea de fase espectral y amplitud para una función de onda cuadrada como la del ejemplo 19.2.

Tal espectro proporciona información que no podría ser aparente desde el dominio del tiempo. Esto se puede ver al contrastar las figuras 19.6 y 19.9. La figura 19.6 representa dos perspectivas alternas tiempo-dominio. La primera, la onda cuadrada original, no nos indica nada acerca de las sinusoides comprendidas. La alternativa es mostrar esas sinusoides [es decir, (4/rc) eos (6%f), — (4/3n) eos (3íu0r), (4/57t) eos (5G)0r)], etcétera. Esta alternativa no proporciona una visualización adecuada de la estructura de esas armónicas. En contraste, las figuras 19.9a y 19.96 proporcionan una visualización gráfica de esta estructura. Como tal, la línea espectral representa "huellas dactilares" que nos pueden ayudar a caracterizar y entender la forma complicada de una ondú. Lillas son en particular valiosas para casos no idealizados donde algunas veoes nos permiten discernir

Page 222: Chapra12-20

19.3 FRECUENCIA Y DOMINIOS DE TIEMPO

F I G U R A 19 .8 Varias fases de un sinusoide mostrando la fase asociada a la línea espectral.

« r n i—

->;|

7C

t r~

F I G U R A 1 9 . 9 a) Amplitud y b) línea de fase espectral para la onda cuadrada de la figura 19.5.

4/it 2/J I

J_ 3<, 54 7f0

a)

n/2

-Jt/2

í, 3f0 5/0 7/0

6)

Page 223: Chapra12-20

552 APROXIMACIÓN DE FOURIER

la estructura en otra forma como señales oscuras. En la siguiente sección se describirá la transformada de Fourier que nos permitirá extender tal análisis para ondas de forma no periódica.

1 9 . 4 I N T E G R A L Y T R A N S F O R M A D A D E F O U R I E R

Aunque la serie de Fourier es una herramienta útil para investigar el espectro de una función periódica, existen muchas formas de onda que no se autorrepiten de manera regular. Por ejemplo, un relámpago ocurre sólo una vez (o al menos pasará mucho tiempo para que ocurra de nuevo), pero causará interferencia con los receptores en operación en un amplio rango de frecuencias (por ejemplo en televisores, radios, receptores de onda corta, etcétera). Tal evidencia sugiere que una señal no recurrente tal como la producida por el relámpago exhibe un espectro de frecuencia continuo. Ya que fenómenos como éstos son de gran interés para los ingenieros, una alternativa para la serie de Fourier sería valiosa al analizar dichas formas de onda no periódicas.

La integral de Fourier es la principal herramienta disponible para este propósito. Se puede obtener de la forma exponencial de la serie de Fourier

o o

f(t) = J2 C V T O 0 ' (19.23) ¿ = — 0 0

donde

1 f T / 2

Ck = ~ / f(t)e-kü>°< dt (19.24)

1 J-T/2

donde % = 2rc/Ty k = 0 , 1 , 2 , . . . La transición de una función de periódica a no periódica se puede efectuar al permi

tir que el periodo tienda al infinito. En otras palabras, como T se vuelve infinito, la función misma nunca se repite y de esta forma se vuelve no periódica. Si se permite que ocurra esto, se puede demostrar (por ejemplo, Van Valkenburg, 1974; Hayt y Kemmerly, 1986) que la serie de Fourier se reduce a

1 f°° / ( 0 = — / F(ia>o)e'ao< d(ü0 (19.25)

¿X J-oo

y los coeficientes se vuelven una función continua de la variable frecuencia co, como en

/

o o

f(t)e-iüJ°' dt (19.26)

- c o

La función F(ico^, definida por la ecuación (19.26), es llamada la integral de Fourier de f(i). Además las ecuaciones (19.25) y (19.26) son conocidas por lo general como transformada de Fourier. Entonces, sólo con ser llamada la integral de Fourier, F(ico0) es también llamada la transformada de Fourier de f(t). En el mismo sentido,/(/), como se definió con la ecuación (19.25), es referida como la inversa de la transformada de Fourier

Page 224: Chapra12-20

19,4 INTEGRAL Y TRANSFORMADA DE F O U R I E R '

F I G U R A 1 9 . 1 0 Ilustración de cómo la frecuencia discreta espectral de una serie de Fourier para un tren de pulsos o) se aproxima a un espectro de frecuencia continua de una integral de Fourier c) cómo se permite al período aproximarse al infinito.

de F(ico0). Así, el par nos permite transformar de una a otra entre los dominios del tiempo y la frecuencia para una señal no periódica.

La distinción entre serie y transformada de Fourier debería ser ahora muy clara. La principal diferencia es que cada una se aplica a un tipo diferente de funciones (las series a formas de onda periódicas y la transformada a las no periódicas). Además de esta principal diferencia, los dos procedimientos discrepan en cómo se mueven en el dominio del tiempo y de la frecuencia. La serie de Fourier convierte una función continua, de periódica en el dominio del tiempo a magnitudes en el dominio de la frecuencia con frecuencias discretas. En contraste, la transformada de Fourier convierte una función continua en el dominio del tiempo en una función continua en el dominio de la frecuencia. De esta manera, el espectro de frecuencia discreto generado por la serie de Fourier es análoga a un espectro de frecuencia continua generado por la transformada de Fourier.

El cambio de un espectro continuo en uno discreto se puede ilustrar gráficamente. En la figura 19.10a, se puede ver un tren de pulsos de ondas rectangulares con anchos de pulsos igual a la mitad del periodo de su espectro asociado discreto. Esta función es igual a la que se investigó antes en el ejemplo 19.2, sólo que en este caso está verticalmentc corrida.

Page 225: Chapra12-20

5 5 4 APROXIMACIÓN DE FOURIER

En la figura 19.106, una duplicación del periodo de pulso del tren tiene dos efectos sobre el espectro. Primero, dos líneas de frecuencia adicional se agregan sobre un lado de las componentes originales. Segunda, las amplitudes de las componentes se reducen.

En tanto se permita al periodo aproximarse al infinito, estos efectos continúan en forma de cada vez más líneas espectrales comprimidas hasta que el espacio entre las líneas tienda a cero. En el límite, las series convergen sobre la integral de Fourier continua, como se ilustra en la figura 19.10c.

Ahora que se ha introducido una forma para analizar una señal periódica, se hará el paso final en nuestro desarrollo. En la siguiente sección reconoceremos el hecho de que una señal es raramente caracterizada como una función continua de la clase necesaria para implementar la ecuación (19.26). En lugar de esto, los datos están invariablemente en una forma discreta. Así, ahora se mostrará cómo calcular la transformada de Fourier para tales mediciones discretas.

1 9 . 5 T R A N S F O R M A D A D I S C R E T A D E F O U R I E R ( TDF )

En ingeniería, las funciones a menudo son representadas por conjuntos de valores discretos finitos. En forma adicional, los datos con frecuencia se colectan o convierten en un formato discreto. Como se ilustra en la figura 19.11, se puede dividir un intervalo de 0 a t en N subintervalos igualmente espaciados con anchos de Ar = TIN. El subíndice n se emplea para designar los tiempos discretos para los cuales se toma las muestras. Así, fn designa un valor de la función continua f(t) tomada en tn.

Observe que los datos se especifican en n = 0, 1, 2, . . ., N — 1. Un valor no se incluye en n = N. (Véase Ramírez, 1985, para el racional de exclusión fN.)

F I G U R A 1 9 . 1 1 Los puntos de muestreo de la serie discreta de Fourier.

Page 226: Chapra12-20

] 9.5 TRANSFORMADA DISCRETA DE FOURIER (TDF) M I

Para el sistema en la figura 19.11, se puede escribir una transformada discreta de Fourier como

AT-I

Fk = 2 Para k = 0 a N - 1 (19.27)

y la transformada inversa de Fourier como

/ „ = — 2 I V R ' ° V para « = 0 a TV - 1 (19.28) N * = O

donde co0 = 2n/N Las ecuaciones (19.27) y (19.28) representan las análogas discretas de las ecuacio

nes (19.26) y (19.25), respectivamente. Como tales, se pueden emplear para calcular tanto la transformada directa de Fourier como la inversa para datos discretos. Aunque tales cálculos se pueden realizar a mano, es una tarea muy laboriosa. Como lo expresa la ecuación (19.27), el TDF requiere N2 operaciones complejas. Así, desarrollaremos un algoritmo de cómputo para implementar la TDF.

Algoritmo de cómputo para la TDF. Observe que el factor l/7Ven la ecuación (19.28) es sólo un factor de escala que se puede incluir, ya sea en la ecuación (19.27) o en la (19.28), pero no en ambas. Para nuestro algoritmo de cómputo, lo incluiremos en la ecuación (19.27) para que el primer coeficiente F0 (el cual es análogo del coeficiente continuo a0) sea igual a la media aritmética de las muestras. También, podemos usar la identidad de Euler para desarrollar un algoritmo que se pueda implementar en lenguajes que no contengan datos de variables complejas,

e±m = eos a ± i sen a

para expresar las ecuaciones (19.27) y (19.28) como

1 N

Fk = — 2 LT„ eos (küJ0n) - ifn sen (ko^t)] (19.29) N n=O

y N-l

f„ = 2 [Fk c o s (k(0on) + iFk s e n < M ) " )1 (19.30) I = 0

El pseudocódigo para implementar la ecuación (19.29) se enlista en la figura 19.12. Este algoritmo se puede desarrollar en un programa de cómputo para calcular la TDF. El listado de resultados de tal programa se muestra en la figura 19.13 para el análisis de una función coseno.

F I G U R A 1 9 . 1 2 DOk = 0,N-1

l'.'iuudocódigo para el DO n = O, N -1 t úlculo de la TDF. angle = ko)0n

realf, = rea\k + fn cos(angle)/N ¡maginaryk = ¡mag¡naryk - fn s¡r¡(angle)/N

END DO END DO

Page 227: Chapra12-20

5 5 6 APROXIMACIÓN DE FOURIER

INDEX f ( t ) REAL IMAGINARY 0 1 . 000 0 0000 0 0000 1 0 . 707 0 0000 0 0000 2 -0 000 0 0000 -0 0000 3 -0 707 0 0000 -0 0000 4 -1 000 0 5000 0 0000 5 -0 707 0 0000 -0 0000 6 -0 000 0 0000 0 0000 7 0 707 0 0000 0 0000 8 1 000 -0 0000 0 0000 9 0 707 0 0000 0 0000 10 -0 000 -0 0000 -0 0000 11 -0 707 0 0000 0 0000 12 -1 000 -0 0000 0 0000 13 -0 707 0 0000 -0 0000 14 0 000 0 0000 0 0000 15 0 707 0 0000 -0 0000 16 1 000 -0 0000 0 0000 17 0 707 0 0000 0 0000 18 - 0 000 -0 0000 0 0000 19 -0 707 -0 0000 -0 0000 20 -1 000 -0 0000 0 0000 21 -0 707 0 0000 0 0000 22 0 000 0 0000 0 0000 23 0 707 -0 0000 -0 0000 24 1 000 -0 0000 0 0000 25 0 707 -0 0000 0 0000 26 -0 .000 -0 0000 0 0000 27 -0 707 -0 0000 -0 0000 28 -1 000 0 5000 -0 0000 29 -0 .707 0 0000 -0 0000 30 0 .000 0 0000 0 0000 31 0 .707 0 .0000 0 0000

F I G U R A 1 9 . 1 3 Resultados de salida de un programa basado en el algoritmo de la figura 19.12 para la TDF de los datos generados por una función coseno f(f) = eos [2K(1 2.5)f] en 32 puntos con Al = 0.01 s.

1 9 . 6 T R A N S F O R M A D A R Á P I D A DE F O U R I E R

Aunque el algoritmo descrito en la sección anterior calcula de manera adecuada la TDF, es laborioso su trabajo de cómputo debido a que se requiere N2 operaciones. En consecuencia, para los datos de las muestras de un tamaño moderado, la determinación directa de la TDF puede ser en extremo consumidora de tiempo.

La transformada rápida de Fourier, o TRF, es un algoritmo que ha sido desarrollado para calcular la TDF en una forma extremadamente económica. Su velocidad surge por el hecho de utilizar los resultados de los cálculos previos para reducir el número de operaciones. En particular, explota la periodicidad y simetría de funciones trigonométricas

Page 228: Chapra12-20

19,6 TRANSFORMADA RÁPIDA DE POURIER i

2 000

Muestras

F I G U R A 1 9 . 1 4 Gráfica del número de operaciones contra tamaño de la muestra de TDF estándar y la TRF.

para calcular la transformada en aproximadamente 7Y log 2 N operaciones (véase figura 19.14). Así, para N = 50 muestras, la TRF es alrededor de 10 veces más rápida que la TDF estándar. Para N = 1 000, es alrededor de 100 veces más rápida.

El primer algoritmo TRF fue desarrollado por Gauss en los inicios del siglo XIX (Heideman y cois., 1984). Otras contribuciones principales fueron hechas por Runge, Danielson, Lanczos y otros en los comienzos del siglo XX. Sin embargo, como a menudo las transformadas discretas toman días o semanas para ser calculadas a mano, no atraían mucho el interés antes del desarrollo de la moderna computadora digital.

En 1965, J. W. Cooley y J. W. Tukey, publicaron un artículo clave, en el cual delineaban un algoritmo para el cálculo de la TRF. Este esquema, similar a aquel de Gauss y de otros investigadores anteriores, es llamado algoritmo de Cooley-Tukey. En la actualidad, existen otros procedimientos que son adaptaciones de este método.

La idea básica detrás de cada uno de estos algoritmos es que una TDF de longitud N se descompone, o "particiona" sucesivamente en TDF más pequeñas. Hay una variedad de formas diferentes de implementar este principio. Por ejemplo, el algoritmo de Cooley-Tukey es un elemento de las llamadas técnicas de decimación en el tiempo. En esta sección se describirá un procedimiento alterno llamado algoritmo Sande-Tukey. Este método es un elemento de otra clase de algoritmos llamado técnicas de decimación en la frecuencia. La distinción entre las dos clases se analizará después de haber elaborado el método.

Page 229: Chapra12-20

5 5 8 APROXIMACIÓN DE FOURIER

19 .6 .1 Algor i tmo Sande-Tukey

En el caso actual, se supondrá que N es una potencia entera de 2,

N=2M (19.31)

donde M es un entero. Esta restricción se introduce para simplificar el resultado del algoritmo. Ahora, recuerde que TDF se puede representar de manera general como

Ai- 1

Fk = 2 fne-* 2 m" k para * = 0 a N - 1 (19.32)

donde 2n/N = O)0. La ecuación (19.32) se puede también representar como N - l

donde Wes una función ponderada de valor complejo definida como

W = e-H2n/N) ( 1 9 3 3 )

Suponga ahora que se divide la muestra a la mitad y se expresa la ecuación (19.32) en términos del primer y último N/2 puntos:

( A / / 2 J - 1 N-l

Fk = ] T fi¡e-¡WN)kn + fne-iQ*/w> /,=() n = N / 2

donde k = 0 , 1 , 2 , . . . , N — 1. Una nueva variable, m = n — N/2, se puede crear para que el rango de la segunda sumatoria sea consistente con la primera,

( A 7 2 ) - ! (N/2)-\

Fk= £ fa-WN*,, + £ f^^-iWNMm+N,» n=0 m=0

( A Í / 2 J - 1

= E (fn+e'^fn+w)'-'2*1""" (19.34) « = 0

Ahora, observe que el factor e~'Kk = (—1)*. De esta forma, para puntos pares es igual a 1 y para los nones es igual a — 1. Por tanto, el próximo paso en el método es separar la ecuación (19.34) de acuerdo con valores pares e impares de k. Para los valores pares,

( W / 2 ) - l (¿V /2 )- l C \ ^ ( f A. f \ „-i2x(2k)n/N _ i f 4- f , ,„1 ,,~i2nkn/{N/2)

II .0 'I o

y para loi valores impares,

Page 230: Chapra12-20

(/V/2) I /, ' , _ V " t f r \ „ i'lnak \ \)n/N

n=0

(N/2)-¡

= £ ( f n - U N ^ e - ' ^ e - 2 " ^ ^ n=0

parak = O,1,2, ...,(N/2) - 1. Estas ecuaciones se pueden expresar en términos de la ecuación (19.33). Para los

valores pares,

(JV/2 ) - l

F2k= E \fn + fn+N/2)W2k" n=0

y para los valores impares,

(N/2)-\

F 2 k + l = E {fn- fn+N,2)WnW2kn

« = 0

Ahora, se puede hacer un conocimiento clave. Esas expresiones pares e impares se pueden interpretar como si fueran igual a las transformadas secuenciales de longitud (N/2)

gn = fn + fn+N/2 (19.35)

y

K = (fn -fn+NnW Para« = 0, 1, 2, . . . , (N/2) - 1 (19.36)

De esta manera, resulta en forma directa que

J2k =Gk) parafc = 0, 1, 2, (N/2) - 1 ^24+1 - H k J

En otras palabras, un cálculo de N puntos se ha reemplazado por dos cálculos de (N/2) puntos. Ya que cada uno de los últimos requiere aproximadamente (N/2)2 multiplicaciones y sumas complejas, el procedimiento produce un factor de 2 en ahorro (es decir N2 contra 2(7Y/2)2 = N2/2.

El esquema se ilustra en la figura 19.15 para /V = 8. La TDF se calcula primero al formar la secuencia g" y h" y después calculando las N/2 TDF para obtener las transformadas numeradas como pares e impares. Los pesos W° son algunas veces llamados factores de vuelta.

Ahora es claro que este procedimiento de "divide y vencerás" se puede repetir en la segunda etapa. Así, podemos calcular los (N/4) puntos TDF de las cuatro N/4 secuencias compuestas de las primeras y últimas N/4 puntos de las ecuaciones (19.35) y (19.36).

La estrategia es continuada a su inevitable conclusión cuando N/2 puntos dobles de las TDF se hayan calculado (véase figura 19.16). El número total de cálculos para toda la población es del orden de TV log 2 N. El contraste entre este nivel de esfuerzo y el de la TDF estándar (véase figura 19.14) ilustra por qué la TRF es tan importante.

Page 231: Chapra12-20

560 APROXIMACIÓN DE FOURIER

F IGURA 1 9 . 1 5 Diagrama de flujo de la primera etapa en una descomposición por decimación en la frecuencia de una TDF con Npuntos para las TDF con (N/2) puntos para N = 8.

F I G U R A 1 9 . 1 6 Diagrama de flujo de la descomposición completa por decimación en la frecuencia de una TDF con ocho puntos.

f(0) + • A A

+

i A A

+ F(0) '(1) \ / + ^ \

/ • A A F(4)

f(2) \\ / 1 +

\r X > A * r

T A A . + .A , A

F(2)

'(3) X A \y /+ F(6)

. X X+ w° \r y/ > A A

+

'i A A ,

+ .A^ A

m) / X F(5)

m// \ r A Ur T A A . + F(3)

f(7)Y \m¡ mf F(7)

i 1

Page 232: Chapra12-20

19.6 TRANSFORMADA RÁPIDA DE FOURIER

Algoritmo de cómputo. Es una proposición relativamente directa expresar la figura 19.16 como un algoritmo. Como fue el caso para el algoritmo de la TDF de la figura 19.12, se usará la identidad de Euler,

e ± m = eos a ± i sen a

para permitir implementar al algoritmo en lenguajes que no acomoden en forma explícita variables complejas.

Una inspección cercana a la figura 19.16 indica que su diagrama computacional molecular fundamental es la conocida en forma extensa como red mariposa, ilustrada en la figura 19.17a. El pseudocódigo para implementar una de esas moléculas se muestra en la figura 19.176.

El pseudocódigo para la TRF se enlista en la figura 19.18. La primera parte consiste, en esencia, en tres ciclos anidados para implementar el cuerpo computacional de la figura 19.16. Observe que los datos reales valuados se guardan originalmente en el arreglo x. También observe que el ciclo exterior pasa a través de las M etapas [recuerde la ecuación (19.31)] del diagrama de flujo.

Después de que esta primera parte se ejecuta, la TDF habrá sido calculada pero en desorden (véase el lado derecho de la figura 19.16). Esos coeficientes de Fourier pueden ser ordenados por un procedimiento llamado de fragmento inverso. Si los subíndices del 0 al 7 se expresan en forma binaria, se puede obtener el orden correcto al invertir esos fragmentos (véase figura 19.19). La segunda parte del algoritmo implementa este procedimiento.

19 .6 .2 Algor i tmo de Cooley-Tukey

La figura 19.20 muestra una red de flujo para implementar el algoritmo de Cooley-Tukey. Para este caso, la muestra se divide inicialmente en puntos impares y pares numerados, y los resultados finales están en el orden correcto.

Este procedimiento es llamado una ordenación en tiempo. Es la inversa del algoritmo de Sande-Tukey descrito en la sección anterior. Aunque las dos clases de métodos difieren en organización, ambos exhiben las AHog2 N operaciones que son la fortaleza del procedimiento de la TRF.

F IGURA 1 9 . 1 7 o| Una red mariposa que representa el cálculo fundamental de la figura 19.16. b) Pseudocódigo para implementar a).

# ftP) temporal = real (0) + real (1) real(1) - real (0)-real (1) real (0) = temporal temporal = imaginario (0) + imaginario (1) imaginario (1) = imaginarlo (0) - imaginario (1) Imaginario (0) - temporal

b)

Page 233: Chapra12-20

562 APROXIMACIÓN DE FOURIER

m = LOÚ(N) / L0G(2) N2 = N D0k = 1,m

N1 = N2 N2 = N2/2 angle = 0 arg = 2n IN1 DO} = 0,N2-1

c = coe(angle) e = sin(atigle) DO i =j,N- í, N1

kk = i+ N2 xt = x(¡) - x(kk) x(i) = x(¡) + x(kk) yt=yO)-y(kk)

x(kk) =xt *c-yt * s y(kk) =yt * c + xt * 5

END DO angle = Q +1) * arg

END DO END DO

J = 0 DO ¡ = 0, N-2

IF (i < j) THEN xt = Xj Xj = x,. X¡ = xt y t = y j

y j = y ,

y , = y t

END IF k = N/2 DO

IF(k>j + 1)EXIT j=j-k k = k/2

END DO J=J + k

END DO D0i = 0,N-1

x(¡) = x(¡) / N y(¡)=y(¡)/N

END DO

F I G U R A 1 9 . 1 8 Pseudocódigo para implementar una decimación en la frecuencia para la TRF. Observe que el pseudocódigo está compuesto por dos partes: a) la misma TRF y b) una rutina de fragmentos inversa para no desordenar los coeficientes resultantes de Fourier.

F I G U R A 1 9 . 1 9

Ilustración del proceso de fragmentos inversa. Orden de

f ragmentos Resu l tado Desorden Ordenado inver t ida f ina l (Decimal) (B inar io) (B inar io) (Decimal)

F|0| F[000| F(000) F|0) F(4) F(100) F(001) F|l) F(2) F(010) F|010) F|2) F(6| => F(UO) => F(011) => F(3) F(l) F(OOl) F( 100) F(4) F(5) F|101) F|101) F(5) F|3) F(011) F(110| F|6) F|7) F|ll l) F|ll l) F|7)

Page 234: Chapra12-20

19.7 E L E S P E C T R O D E P O T E N C I A MI

¡*i§i|ii)iiitaljii). f»>>Oiit)||ii|iij|||Mlii • ¡ H i),

F IGURA 1 9 . 2 0 Diagrama de flujo de una TRF con decimación en el tiempo para una TDF de 8 puntos.

1 9 . 7 E L E S P E C T R O D E P O T E N C I A

La TRF tiene muchas aplicaciones en ingeniería, que van desde análisis vibratorio do estructuras y mecanismos hasta el procesamiento de señales. Como se describió antes, la amplitud y el espectro de fase proporcionan un medio para discernir la estructura fundamental de señales aleatorias aparentes. De manera similar, un análisis útil llamado espectro de potencia se puede desarrollar a partir de la transformada de Fourier.

Como su nombre lo implica, el espectro de potencia se deriva del análisis de la potencia de salida de sistemas eléctricos. En términos matemáticos, la potencia de una señal periódica en el dominio del tiempo se puede definir como

1 fT /2

1 J-T/2 Ahora, otra forma de buscar en esta información es expresándola en el dominio de la frecuencia al calcular la potencia asociada con cada una de las componentes de la frecuencia. Esta información se puede entonces desplegar como un espectro de potencia, una gráfica de la potencia contra la frecuencia.

Si la serie de Fourier para f(t) es oo

f(t) = Fneikü>0' (19.38)

se cumple la siguiente relación (véase Gabel y Roberts 1987 para más detalles):

(19.39)

Page 235: Chapra12-20

564 APROXIMACIÓN DE FOURIER

De esta forma, la potencia en f(t) se puede determinar al sumar los cuadrados de los coeficientes de Fourier; es decir, las potencias asociadas con las componentes de frecuencia individual.

Ahora, recuerde que en esta representación, la armónica real simple consiste en ambos componentes de la frecuencia en ±ka>0. También sabemos que los coeficientes positivo y negativo son iguales. Por tanto, la potencia enf^t), la ¿-ésima armónica real de / ( O e s

pk=2\Fk\2 (19.40)

El espectro de potencia es la gráfica de pk como una función de la frecuencia ¿fi%. Dedicaremos la sección 20.3 a una aplicación de la ingeniería que involucra la TRF y el espectro de potencia generado por medio de paquetes de software.

Información adicional. Lo anterior ha sido una breve introducción a la aproximación de Fourier y a la TRF. Información adicional sobre la primera se puede encontrar en Van Valkenburg (1974), Chirlian (1969), y Hayt y Kemmerly (1986). Referencias sobre la TRF son incluidas en Davis y Rabinowitz (1975); Cooley, Lewis y Welch (1977), y Brigham (1974). Buenas introducciones a ambos asuntos se pueden encontrar en Ramírez (1985), Oppenheim y Schafer (1975), Gabel y Roberts (1987).

1 9 . 8 A J U S T E D E C U R V A S C O N L I B R E R Í A S Y P A Q U E T E S

Las librerías y paquetes de software tienen grandes capacidades para el ajuste de curvas. En esta sección daremos una muestra de las más usuales.

19 .8 .1 Excel

En el presente contexto, la aplicación más útil de Excel es para el análisis de regresión y, con menos extensión, para la interpolación polinomial. Además de algunas funciones predeterminadas (véase la tabla 19.1), existen dos formas principales en las cuales esta capacidad se puede implementar: el comando Trendline y el Paquete de Herramientas para el Análisis de Datos.

T A B L A 1 9 . 1 Funciones prefabricadas de Excel que relacionan los ajustes por regresión de los datos.

Función Descripción

FORECAST Regresa un valor ¡unto con una tendencia lineal GROVVTH Regresa valores ¡unto con una tendencia exponencial INTERCEPT Regresa el intercepto de la línea de regresión lineal UNEST Regresa los parámetros de una tendencia lineal LOGEST Regresa los parámetros de una tendencia exponencial SLOPE Regresa la pendiente de la línea de regresión lineal TREND Regresa un valor ¡unto con una tendencia lineal

Page 236: Chapra12-20

19.8 AJUSTE DE CURVAS CON LIBRERÍAS V P A Q U E T E S 565

El comando Trendline (menú insert). Este comando permite un número de diferentes modelos de tendencia que se pueden agregar a la gráfica. Esos modelos incluyen ajustes lineales, polinomiales, logarítmicos, exponenciales, de potencia y de promedio de movimiento. El siguiente ejemplo ilustra cómo se llama al comando Trendline.

Enunciado del problema. Usted habrá notado que varios ajustes disponibles en Trendline fueron analizados anteriormente en el capítulo 17 (por ejemplo, lineal, polinomial, exponencial y potencia). Una capacidad adicional es la del modelo logarítmico

y =a0 + ai logx

Ajuste los siguientes datos con este modelo usando el comando de Excel Trendline:

X 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5

y 0.53 0.69 1.5 1.5 2 2.06 2.28 2.23 2.73 2.42 2.79

Solución. Para ejecutar el comando Trendline, se debe crear una gráfica que relaciona una serie de variables dependientes e independientes. Para el caso actual, se usa la guía de gráficas de Excel Wizard (Asistente) para crear una gráfica XY con los datos.

Después, se selecciona la gráfica (haciendo doble clic en ésta) y la serie (al posicionar el cursor sobre uno de los valores y con un solo clic). Los comandos Insert y Trendline son entonces ejecutados con la ayuda del ratón o por la siguiente secuencia de teclas

/ Insert Trendline

En este punto, se abre un cuadro de diálogo con dos tabuladores: el Options (Opciones) y el Type (Tipo). El tabulador Options proporciona formas para configurar el ajuste. Lo más importante en este contexto es desplegar tanto la ecuación como el valor del coeficiente de determinación (r2) sobre la gráfica. La primera elección en el tabulador Type es para especificar el tipo de línea. Para el caso actual, se selecciona Logarithmic. El ajuste resultante junto con r2 se despliega en la figura 19.21.

F I G U R A 1 9 . 2 1 Ajuste de un modelo logarítmico con los datos del ejemplo 19.3.

EJEMPLO 1 9 . 3 Usando el comando Trendline de Excel

y 3 r

2

0 0 2 4

Page 237: Chapra12-20

566 APROXIMACIÓN DE FOURIER

I El comando Trendline proporciona una manera fácil para ajustar un número de I modelos para datos que se usan de manera común. Además, su inclusión en la opción I Polinomial significa que también se puede usar para interpolación polinomial. Sin em-I bargo, debido a su contenido estadístico, está limitado a r2, y esto significa que no per

mite dibujar inferencias estadísticas con respecto al modelo a ajustar. El paquete de herramientas para el análisis de datos que se describirá a continuación proporciona una excelente alternativa para los casos donde las inferencias son necesarias.

El paquete de herramientas para el análisis de datos. Este paquete de Excel, también incluido, contiene una amplia capacidad para el ajuste de curvas mediante lineal general por mínimos cuadrados. Como se describió antes, en la sección 17.4, tales modelos son de la forma general

y = a0z0 + a\Z\ + a2z2 H \-amzm + e (17.23)

donde z 0 , zx,..., zm son m + 1 funciones diferentes. El siguiente ejemplo ilustra cómo tales modelos se pueden ajustar con Excel.

EJEMPLO 19.4 Usando el paquete de herramientas para el análisis de datos de Excel

Enunciado del problema. Los siguientes datos se colectaron para la pendiente, radio hidráulico y velocidad del agua que fluye en un canal:

S, m/m

0 .0002 0 .0002 0 .0005 0 .0005 0 .001 0 .001

R, m

0.2 0.5 0.2 0.5 0.2 0.5

U, m/s

0.25 0.5 0.4 0.75 0.5 1

Se tiene razones teóricas (recuerde la sección 8.2) para creer que estos datos se pueden ajustar a un modelo de potencias de la forma

U =aSaRp

donde a,ayp son los coeficientes obtenidos de manera empírica. Existe razones teóricas (véase de nuevo la sección 8.2) para creer que o"y p deberían tener valores aproximados de 0.5 y 0.667, respectivamente. Ajuste estos datos con Excel y evalúe si su regresión estimada contradice los valores esperados de los coeficientes del modelo.

Solución. El logaritmo de este modelo de potencias se usa primero para convertirlo al formato lineal de la ecuación (17.23),

U = log a + a log S + p log R Se puede desarrollar una hoja de cálculo en Excel con los datos originales junto con sus respectivos logaritmos, como en la siguiente tabla:

Page 238: Chapra12-20

566 APROXIMACIÓN DE FOURIER

El comando Trendline proporciona una manera fácil para ajustar un número de modelos para datos que se usan de manera común. Además, su inclusión en la opción Polinomial significa que también se puede usar para interpolación polinomial. Sin em-

I bargo, debido a su contenido estadístico, está limitado a r 2 , y esto significa que no per-'• mite dibujar inferencias estadísticas con respecto al modelo a ajustar. El paquete de

herramientas para el análisis de datos que se describirá a continuación proporciona una excelente alternativa para los casos donde las inferencias son necesarias.

El paquete de herramientas para el análisis de datos. Este paquete de Excel, también incluido, contiene una amplia capacidad para el ajuste de curvas mediante lineal general por mínimos cuadrados. Como se describió antes, en la sección 17.4, tales modelos son de la forma general

y — ao^o + a\Z\ + a2z2 H \-amz,„+e ' (17.23)

donde z 0 , zx,..., zm son m + 1 funciones diferentes. El siguiente ejemplo ilustra cómo tales modelos se pueden ajustar con Excel.

EJEMPLO 19.4 Usando el paquete de herramientas para el análisis de datos de Excel

, Enunciado del problema. Los siguientes datos se colectaron para la pendiente, radio hidráulico y velocidad del agua que fluye en un canal:

S, m/m

0.0002 0.0002 0.0005 0.0005 0.001 0.001

R, m

0.2 0.5 0.2 0.5 0.2 0.5

U, m/s

0.25 0.5 0.4 0.75 0.5 1

Se tiene razones teóricas (recuerde la sección 8.2) para creer que estos datos se pueden ajustar a un modelo de potencias de la forma

U =aS"Rp

donde a,oyp son los coeficientes obtenidos de manera empírica. Existe razones teóricas (véase de nuevo la sección 8.2) para creer que o"y p deberían tener valores aproximados de 0.5 y 0.667, respectivamente. Ajuste estos datos con Excel y evalúe si su regresión estimada contradice los valores esperados de los coeficientes del modelo.

Solución. El logaritmo de este modelo de potencias se usa primero para convertirlo al formato lineal de la ecuación (17.23),

U = log a + tr log S + p log R

Se puede desarrollar una hoja de cálculo en Excel con los dalos originales junio con sus respectivos logaritmos, como en la siguiente tabla:

Page 239: Chapra12-20

r , a mjvoi c wc W K W O W T N UBKBRIAS T W 5 J U E T E 5 A B ' 1 B 1 P

S Rh U lofl(S| lofl(Rh) loq(U|

¿ 0.0002 0.2 0 .25 - 0 . 6 9 8 9 7 - 0 . 6 0 2 0 6 3 0.0002 0.5 0.5 - 3 . 6 9 & V 1 - 0 . 3 0 1 0 3 - 0 . 3 0 1 0 3 4 0.0005 0.2 0.4 - 3 . 3 0 1 0 § - 0 . 6 9 8 9 7 - 0 . 3 9 7 9 4 5 0.0005 0.5 0.75 - 3 . 3 0 1 0 3 ' , - 3 . 3 0 1 0 3 - 0 . 1 2 4 9 4 6 0.001 0.2 0.5 - 3 \ - 0 . 6 9 8 9 7 - 0 . 3 0 1 0 3 7 0.001 0.5 1 - 3 ^ . 3 0 1 0 3 0

= log(A2)

Como se muestra, una forma eficiente para generar los logaritmos es tecleando la fórmula para calcular el primer log(S). Después se puede copiar esta fórmula a la derecha y hacia abajo para generar los otros logaritmos.

Debido a su estado como una "incluida", en la versión de Excel disponible en el tiempo de la edición en inglés de este libro, el paquete de herramientas para el análisis de datos debe algunas veces cargarse en Excel. Para hacer esto, simplemente use el ratón o la secuencia de teclas

/Tools Add-Ins

Después seleccione Analysis Toolpack y OK. Si el add-in ha sido satisfactorio, la selección Data Analysis se incluirá en el menú Tools.

Después de seleccionar Data Analysis en el menú Tools, un menú de Data Analysis aparecerá en pantalla conteniendo un gran número de rutinas orientadas estadísticamente. Seleccione Regression y aparecerá un cuadro de diálogo que esperará se le proporcione información sobre la regresión. Después de estar seguros que se ha seleccionado la instrucción por default New Worksheet Ply, llene en F2:F7 para el rango y y D2:E7 para el rango x y seleccione OK. Así se creará la siguiente hoja de cálculo:

A B C D E F G 1 RESUMEN DE RESULT ADOS 2 3 Estadística de regresión 4 Múltiple R 0.998353 5 R cuadrada 0.996708 6 A¡. de R cuadrada 0.994513

7 Error estándar 0.015559 & Observaciones 6 0 10 ANOVA 11 dt ss MS F Siqniticanáa F 13 Regresión 2 0.219867 0.109933 454.1106 0.0001889

• t ) Residual 3 0.000726 0.000242 • L I Total 5 0.220593 R H

10 Coehs. Error estdr. Sfadf Valor P Inf. al 95% Sup. al 95% ! l IflIdU'Bplo 0.075932 20.0501 0.0002712 1.2808009 1.7641028 i l X Variable 1 0.433137 0.022189 19.5203 0.0002937 0.3625211 0.5037521

Ó.83456W

Page 240: Chapra12-20

APROXIMACIÓN DE FOURIER

De esta manera, el ajuste resultante es

log U = 1.522 + 0.433 log S + 0.733 log R

o al tomar el antilog,

U = 333S0A33R0133

Observe que se han generado intervalos de confianza al 95% para los coeficientes. Así, hay un 95% de probabilidad de que la pendiente real del exponente esté entre 0.363 y 0.504, y el coeficiente real del radio hidráulico esté entre 0.631 y 0.835. De esta forma, el ajuste no contradice los exponentes teóricos.

Finalmente, se debe observar que se puede usar la herramienta Solver de Excel para ejecutar una regresión no lineal al minimizar de manera directa la suma de los cuadrados de los residuos entre la predicción modelo no lineal y los datos. Dedicaremos un ejemplo en la sección 20.1 para ver cómo se puede hacer esto.

1 9 . 8 . 2 Mathcad

Mathcad puede ejecutar una amplia variedad de tareas estadísticas, ajuste de curvas y corrección de datos. Dichas tareas incluyen trabajos relativamente simples, como trazo de histogramas y cálculo de resúmenes estadísticos de población tales como la media, mediana, varianza, desviaciones estándar y coeficientes de correlación. Además, Mathcad puede predecir valores intermedios al conectar los puntos de datos conocidos ya sea con líneas rectas (interpolación lineal) mediante I in terp o con secciones de polinomiales cúbicos (interpolación segmentaria cúbica) por medio de cspline, pspline, o lspl ine. Estas funciones segmentarias le permiten intentar diferentes maneras que tienen que ver con interpolación en los puntos extremos de los datos. La función lspl ine genera una curva segmentada que es una línea recta al final de los puntos. La función pspl ine genera una curva segmentada que es una parábola en los puntos extremos. La función cspline genera una curva segmentada que es cúbica en los puntos extremo. La función in terp usa el resultado del ajuste de curvas y regresa un valor y interpolado, dado un x valor. Además, usted puede ejecutar interpolación segmentaria cúbica en dos dimensiones al pasar una superficie a través de una malla de puntos.

Mathcad contiene un número de funciones para ejecutar regresiones. Las funciones slope e in tercept regresan la pendiente e intercepto del ajuste lineal por regresión de mínimos cuadrados. La función regress se usa para una regresión polinomial de n-ésimo orden de un conjunto completo de datos. La función loess ejecuta una regresión polinomial localizada de «-ésimo orden sobre un espacio de datos que usted puede especificar. La función i n te rp también se puede usar para regresar valores intermedios de y a partir de un ajuste por regresión para un punto dado x. Las funciones regress y loess pueden también ejecutar regresión polinomial multivariable. Mathcad también proporciona la función l i n f i t que se usa para modelar datos con una combinación de funciones arbitrarias. Finalmente, la función genf i t está disponible para casos donde los coeficientes del modelo aparecen en forma arbitraria. En este caso, las ecuaciones no lineales más difíciles se deben resolver por iteración.

Page 241: Chapra12-20

19.8 A J U S T E D E C U R V A S C O N L I B R E R Í A S V R O Q U E T E S

Pongamos un ejemplo que muestre cómo se puede usar Muthcnd para ejecutar unu interpolación segmentaria en dos dimensiones (véase la figura 19.22). Los datos a ajus-tar son

x z 0 1 2 3 4 5

0 0.17500 0.14100 -0.13900 -0.51400 -0.29000 0.32700 1 0.93500 0.16700 -0.76400 -0.98600 -0.30800 0.82600

y 2 0.64900 -0.00302 -0.33400 -0.65900 -0.00678 0.23900 3 -0.55300 -O.22500 0.46700 0.73600 0.10600 -0.09200 4 -0.97900 0.17500 0.36800 0.81400 0.39000 -0.78200 5 -0.70700 0.12600 0.76100 0.30200 0.30300 -0.16400

Observe que los números a lo largo de la parte superior y en el lado izquierdo son las coordenadas x y y de los valores z que se encuentran en el interior de la matriz.

El primer paso es pasar los datos a Mathcad. Para hacer esto se pueden crear dos archivos de datos llamados MATSPLIN.PRN y MATXY.PRN. Los primeros dos activan las líneas en la figura 19.22 mediante el comando R E A D - P R N para leer los datos de esos archivos. El archivo MATSPLIN.PRN es un archivo simple de texto que contiene los valores de la función (z) a ser interpolada en varios puntos x y y sobre una rejilla rectangular. LAS dimensiones de la rejilla están definidas por los datos en el archivo de texto MATXY.PRN. Los elementos de este archivo son pares de valores x y y que caracterizan los elementos de la diagonal de la región. El símbolo definición se usa para asignar los datos de los archivos de datos a las variables Mz y Mxy. Después, el símbolo definición y la función ESPLIN se usan para definir la matriz S. Ésta es una matriz que contiene valores de la segunda derivada y otros resultados numéricos en varias localizaciones de la rejilla. Esta

F IGURA 1 9 . 2 2 Segmentaria 2D con Mathcad.

File Edlt Vlew Insert Format SJath Symbolics yjlndow S«IP 2 D S P L T N E

Enter the roatrix specifying a surface: Mz :=READPRN("matsplin.prn") Mxy :=READPRN("matxy.pm")

Compute spline coefficients: S :=* cspüne(Mxy,Mz)

fit(x,y) := inteipjs,Mxy,Mz,jx|j Sample interpolated valúes: fltí2.5,3.9) = 0,046

Page 242: Chapra12-20

370 APROXIMACIÓN DE FOURIER

matriz, junto con Mz y Mxy, son usadas por la función interp para regresar los valores de z como la variable de ajuste (x, y) con base en la interpolación segmentaria cúbica con los valores de entrada de x y y. Mathcad designa esta secuencia de operaciones, de tal manera que la interpolación de polinomiales no tengan que ser recalculados cada vez que se requiera la interpolación con diferentes valores de x y y. Considerando estas operaciones, usted puede interpolar en cualquier ubicación mediante el ajuste (x, y), como el mostrado con x = 2.5 y y = 3.9. Usted puede también construir una gráfica de la superficie interpolada como la mostrada en la figura 19.22.

Como otro ejemplo para demostrar algunas capacidades para el ajuste de curvas mediante Mathcad, usamos la función fft para el análisis de Fourier como el mostrado en la figura 19.23. La primera línea usa el símbolo definición para crear i como un rango variable. Después x¡ es formulado mediante la función Mathcad rnd para impartir una componente aleatoria a la señal sinusoidal. La gráfica de la señal se puede colocar sobre la hoja de cálculo al hacer clic en la ubicación deseada. Esto coloca una línea roja cruzada en esa ubicación. Después use del menú la secuencia Insert/Graph/X-Y Plot para reservar una gráfica en blanco sobre la hoja de cálculo con lugares para las expresiones a graficarse y para los rangos de los ejes x y y. Simplemente teclee x¡ en el lugar reservado sobre el eje y y 0 y 80 para el rango en el eje x. Mathcad realiza todo el resto para producir la gráfica mostrada en la figura 19.23. Una vez que se ha creado la gráfica, usted puede usar del menú la secuencia Format/Graph/X-Y Plot para variar el tipo de gráfica, cambiar el color, tipo, ancho de línea del trazo de la función y agregar títulos, leyendas y otras características. Después c es definida como fft(x). Esta función regresa la transformada de Fourier de x. El resultado es un vector, c, de coeficientes complejos que representan los valores en el dominio de la frecuencia. Se construye una gráfica de la magnitud de c¡ como antes.

F I G U R A 1 9 . 2 3 TRF con Mathcad.

Mathcad file Edil ylew ¡nsert Formal Malh gymbollcs Wlndow tjelp

F A S T F O U R I E R T R A N S F O R M

Define a real signal in time: Signal

Page 243: Chapra12-20

19.8 A J U S T E DE C U R V A S CON L I B R E R Í A S Y R O Q U E T E S

19 .8 .3 MATLAB

Como se resume en la tabla 19.2, MATLAB tiene una variedad de funciones preconstruidus que abarcan las capacidades totales descritas en esta parte del libro. El siguiente ejemplo ilustra cómo usar algunas de ellas.

TABLA 19 .2 Algunas funciones de MATLAB para implementar interpolación, regresión, segmentarias y TRF.

Función Descripción

polyfit Ajuste polinomial a datos interp 1 Interpolación 1-D (tabla 1-D) interp 2 Interpolación 2-D (tabla 2-D| spline Interpolación segmentaria cúbica de datos fft Transformada de Fourier discreta

EJEMPLO 19.5 Uso de MATLAB para el ajuste de curvas

¡ Enunciado del problema. Explore cómo se puede emplear MATLAB para ajustar | curvas con los datos. Para hacer esto, use la función seno para generar valores igualmen

te espaciados f(x) de 0 a 10. Emplee un tamaño de paso de 1 de tal forma que la caracte-¡ rización resultante de la onda seno sea dispersa (véase la figura 19.24). Después, ajústela ! con a) interpolación lineal, b) polinomial de quinto orden y c) una segmentaria cúbica.

Solución.

a) Los valores de las variables independientes y dependientes se pueden introducir en los vectores por

>> x = 0 : 1 0 ; >> y = s i n ( x ) ;

F IGURA 1 9 . 2 4 Once puntos muestreados de una sinusoidal.

Page 244: Chapra12-20

5 7 2 APROXIMACIÓN DE FOURIER

Un nuevo vector más finamente espaciado con valores de la variable independiente se puede generar y guardar en el vector xi,

> > x i = 0 : . 2 5 : 1 0 ;

La función MATLAB in te rp l puede entonces ser usada para generar valores de la variable dependiente yi para todos los valores xi mediante interpolación lineal. Tanto los valores originales (x, y) como los valores interpolados linealmente se pueden graficar juntos, como se muestra en la gráfica siguiente:

> > y i = i n t e r p 1 ( x , y , x i ) ; > > p l o t C x , y , ' o 1 , x i , y i )

0 2 4 6 8 10

b) Ahora, la función polyfit de MATLAB se puede usar para generar los coeficientes de un ajuste polinomial de quinto orden de los datos originales dispersos,

> > p = p o L y f i t ( x , y , 5 ) P =

0 . 0 0 0 8 - 0 . 0 2 9 0 0 . 3 5 4 2 - 1 . 6 8 5 4 2 . 5 8 6 0 - 0 . 0 9 1 5

donde el vector p cumple con los coeficientes polinomiales. Estos se pueden a su vez usar para generar un nuevo conjunto de valores yi, los cuales pueden de nuevo ser graneados junto con las muestras originales dispersas,

> > y i = p o t y v a L ( p , x i ) ; > > p l o t ( x , y , 1 o ' , x i , y i )

Page 245: Chapra12-20

r ,9 fm\jo i c ve tON LIBRERÍAS Y RAQUITIS Asi, el polinomial eiiplura la tendencia general de los dalos, pero deja lucia la mayoría de los puntos.

c) Finalmente, la función spline de MATLAB puede ser usada para «justar umi segmentaria cúbica de los datos dispersos originales en la forma de un nuevo conjunto de valores yi, los cuales se pueden nuevamente graficar junto con la muestra original dispersa,

>> yi=spline(x,y,xi); >> pLot(x,y, ' o 1 ,xi,yi)

0 2 4 6 8 10

Debería observarse que MATLAB también tiene excelentes capacidades para realizar el análisis de Fourier. Se dedica la sección 20.3 a un ejemplo de cómo se puede hacer esto.

1 9 . 8 . 4 IMSL

IMSL tiene numerosas rutinas para el ajuste de curvas que abarca todas las capacidades a cubrir en este libro, y, por tanto, se mostrará algunas. Una muestra se presenta en la tabla 19.3. En el actual análisis, nos concentraremos en la rutina RCURV Esta rutina ajusta los datos a un polinomial por mínimos cuadrados.

RCURV se implementa con la siguiente declaración C ALL:

CALL RCURV (NOBS, XDATA, YDATA, NDEG, B, SSPOLY, STAT) donde

NOBS = Número de observaciones. (Input) XDATA = Vector de longitud NOBS que contiene los valores x. (Entrada) YDATA = Vector de longitud NOBS que contiene los valores y. (Entrada) NDEG = Grado del polinomial. (Entrada) B = Vector de longitud NDEG + 1 que contiene los coeficientes. SSPOLY = Vector de longitud NDEG + 1 que contiene las sumas secuenciales

de los cuadrados. (Salida) SSPOLY (1) contiene la suma de los cuadrados debidos a la media. Para i = 1,2,... , NDEG, SSPOLY(i + 1) contiene la suma de los cuadrados debido a las x' ajustadas a la media, x, x 2 y x' '.

Page 246: Chapra12-20

5 7 4 APROXIMACIÓN DE FOURIER

T A B L A 1 9 . 3 Rutinas IMSL para ajuste de curvas.

Categoría Ru t inas Descripción

• Interpolación segmentaria cúbica CSIEZ CSINT CSDEC

Fácil de usar rutina segmentaria cúbica No-un-nudo Deriva condiciones finales

• Evaluación segmentaria cúbica e integración

CSVAL CSDER CS1GD CSITG

Evaluación Evaluación de la derivada Evaluación sobre una rejilla Integración

• Interpolación segmentaria B

• Polinomio en fragmentos

• Rutinas de interpolación cuadrática polinominal para datos cuadriculados

• Interpolación de datos dispersados

• Aproximación de mínimos cuadrados RUÑE RCURV FNLSQ

Polinomio lineal Polinomio general Funciones generales

« Segmentaria cúbica suavizada

• Aproximación racional ponderada de Chebyshev Ponderada racional

Chebyshev aproximación

• TRF real trigonométrica FFTRF FFTRB FFTRI

Transformar hacia adelante Transformar hacia atrás o inversa Inicialización de la rutina para FFTR

• TRF exponencial compleja FFTCF FFTCB FFTCI

Transformar hacia adelante Transformar hacia atrás o inversa Inicialización de la rutina para FFTC

• Seno real y coseno para las TRF

• Cuarto real del seno y coseno paro las TRF.

• TRF en dos y tres dimensiones complejas

• Convoluciones y correlaciones

Transformada de Laplace

Page 247: Chapra12-20

• T . Q A J U S T E DE C U R V A S C O N L I B R E R Í A S Y P A Q U E T E S m STAT = Vector de longitud 10 que contiene la estadística descrita en la tabla 19.4.

(Salida) donde 1 = Media de x

2 = Media de y 3 — Varianza muestra de x 4 = Varianza muestra de y 5 = R-cuadrada (en porcentaje) 6 = Grados de libertad para la regresión 7 = Suma de cuadrados de la regresión 8 = Grados de libertad para el error 9 = Suma de cuadrados del error

10 = Número de datos (x, y) conteniendo NaN (no un número) como un valor x o y.

EJEMPLO 19.ó Uso de IMSL para regresión polinomial

I Enunciado del problema. Use RCURV para determinar la polinomial cúbica que proporciona un ajuste por mínimos cuadrados de los siguientes datos

X 0.05 0.12 0.15 0 .30 0.45 0 .70 0 .84 1.05

y 0 .957 0.851 0.832 0 .720 0.583 0 .378 0 .295 0 .156

Solución. Un ejemplo de un programa principal en Fortran 90 y de la función RCURV para resolver este problema se puede escribir como

P R O G R A M F i tpo ly use msimsl I M P L I C I T N O N E

I N T E G E R : : n d e g . n o b s , i , j P A R A M E T E R (ndeg-3, nobs -8 ) R E A L : : b ( n d e g + l ) , s s p o l y ( n d e g + l ) , s t a t ( 1 0 ) , x ( n o b s ) , y ( n o b s ) , ycalc(nobs) D A T A x / 0 . 0 5 . 0 . 1 2 , 0 . 1 5 . 0 . 3 0 . 0 . 4 5 , 0 . 7 0 , 0 . 8 4 , 1 . 0 5 /

D A T A y / 0 . 9 5 7 , 0 . 8 5 1 , 0 . 8 3 2 , 0 . 7 2 0 , 0 . 5 8 3 , 0 . 3 7 8 . 0 . 2 9 5 , 0 . 1 5 6 /

C A L L RCURV (nobs ,x ,y .ndeg ,B , s spo1y , s ta t ) P R I N T * , ' F i t t e d polynomlal i s ' D O i - l .ndeg+1

P R I N T ' ( 1 X . " X A " . I I , " T E R M : " . F S ^ ) ' . 1 - 1 , b(1) E N D D O

P R I N T *

P R I N T ' ( I X , " R A 2 : " , F 5 . 2 , " % " ) ' , s t a t ( 5 )

P R I N T *

P R I N T * , ' N O . X Y Y C A L C '

D O i = l.nobs yca lc= 0 . D O j = l,ndeg+l

y c a l c ( i ) - y c a l c ( 1 ) + b ( j ) * x ( i ) * * ( j - l ) E N D D O

P R I N T ' ( 1 X , I 8 , 3 ( 5 X , F 8 . 4 ) ) \ i , x ( 1 ) . y ( 1 ) , ycalcd) E N D D O

E N D

Page 248: Chapra12-20

576 APROXIMACIÓN DE FOURIER

| Un ejemplo de correr es

i \ F i t t ed polynomial i s ] X A 0 TERM: .9909 ' X A 1 TERM: - 1 . 0 3 1 2 ? X A 2 TERM: .2785

X A 3 TERM: - . 0 5 1 3 R A 2 : 9 9 . 8 1 % NO. X Y YCALC

1 .0500 .9570 . 9 4 0 1 2 .1200 .8510 . 8711 3 .1500 .8320 .8423 4 .3000 .7200 .7053 5 .4500 .5830 .5786 6 .7000 .3780 .3880 7 .8400 .2950 .2908 8 1 .0500 .1560 .1558

P R O B L E M A S

19.1 El pH en un reactor varía en forma sinusoidal durante el transcurso de un día. Use la regresión por mínimos cuadrados para ajustar con la ecuación (19.11) los siguientes datos. Use su ajuste para determinar la media, amplitud y tiempo del pH máximo.

Tiempo, hr

PH

0 2 4 5 7 8.5 12 15 20 22 24

7.3 7 7.1 6.4 7.4 7.2 8.9 8.8 8.9 7.9 7

19.2 La radiación solar en Georgetown, Carolina del Sur, ha sido tabulada como

Tiempo, mo J F M A M J J A S O N D

Radiación, W / m 2 122 — 188 230 267 270 252 — 196 160 138 120

Suponiendo que cada mes es de 30 días, ajuste a un sinusoide estos datos. Use la ecuación resultante para predecir la radiación que habrá durante la mitad de agosto. F IGURA P l 9 .4 19.3 Los valores promedio de una función se pueden determinar Una onda diente de sierra. por

_ ¡¿mdx fix) =

Use esta relación para verificar los resultados de la ecuación (19.13). 19.4 Use una serie de Fourier continua para aproximar la onda de dentado de sierra mostrada en la figura P19.4. Grafique los primeros tres términos junto con la sumatoria.

Page 249: Chapra12-20

Sff 1

\ 1

- 1 1 f

F I G U R A P 1 9 . 5 I JTIO onda triangular.

I <).S Use la serie de Fourier continua para aproximar la forma de la onda en la figura P19.5. Grafique los primeros tres términos liinto con la sumatoria. I ' ).6 Construya la amplitud y línea de fase espectral del problema 19.4. 19.7 Construya la amplitud y línea de fase espectral del problema 19.5. 19.8 Un rectificador de media onda se puede caracterizar por

y(t) = C ,

1 1 2 „ 2 1 sen / eos 2t

K 2 3n 15TT

-eos 6 í - •

eos 4í

3 5 7 T

donde Q es la amplitud de la onda. Grafique los primeros cuatro (orminos junto con la sumatoria. I <>.9 Construya la amplitud y línea de fase espectral del problema 19.8. I « ) . 1 0 Desarrolle un subprograma de uso amigable para la TDF con base en el algoritmo de la figura 19.12. Pruébelo mediante la duplicación de la figura 19.13. I <>. 1 1 Use el programa del problema 19.10 para calcular una TDF pura la onda triangular del problema 19.8. Muestre la onda de t - 0 a 47. Use 32, 64 y 128 puntos de muestreo. Tome tiempo a

cada corrida y grafique la ejecución contra N para verificar la ligura 19.14. 19.12 Desarrolle un subprograma de uso amigable para la TRF con base en el algoritmo de la figura 19.18. Pruébelo duplicando la figura 19.13. I').13 Repita el problema 19.11 mediante el software que usted desarrolló en el problema 19.12.

1 9 . 1 4 U S E E L C O M A N D O T R E N D L I N E D E E X C E L P A R A « J U S T A R U N U E C U U -

C I Ó N E X P O N E N C I A L A

2 . 5 3 . 5 6 7 . 5 1 0 1 2 . 5 1 5 1 7 . 5 2 0

7 5 . 5 3 . 9 3 . 6 3 . 1 2 . 8 2 . 6 2 . 4 2 . 3 2 . 3

Grafique y contra x junto con la ecuación exponencial y r2. 19.15 Use el paquete de herramientas para el análisis de datos de Excel para desarrollar una regresión polinomial de cuarto orden, con los siguientes datos que contienen la concentración de oxigeno disuelto en agua fresca contra temperatura a nivel del mar.

0 1 6 2 4 3 2 4 0

O , M G / L 1 4 . 6 2 1 1 1 . 8 4 3 9 . 8 7 0 8 . 4 1 8 7 . 3 0 5 6 . 4 1 3

19.16 Use el paquete de herramientas para el análisis de datos de Excel para ajustar una línea recta con los siguientes datos. Determine el 90% de intervalo de confianza para el intercepto. Si pasa por cero, repita la regresión, pero ahora con el intercepto forzado a cero (ésta es una opción del cuadro de diálogo Regression)

X 2 4 Ó 8 1 0 1 2 1 4

Y 5 . 7 6 . 4 1 2 . 3 1 7 . 7 1 8 . 9 2 5 . 7 2 6 . 8

19.17 Use Mathcad para ajustar una segmentaria cúbica (con una línea recta en los puntos extremos) los siguientes datos:

X 0 2 4 7 1 0 1 2

Y 2 0 2 0 1 2 7 Ó 5 . 6

Determine el valor de y en x = 3. 19.18 Use Mathcad para generar 64 puntos a partir de la función

/( í) = eos (3t) + sen (1 Oí)

desde t = 0 a 2rc. Como se vio en la sección 19.8.2, agregue una componente aleatoria a la señal. Tome una TRF de esos valores y grafique los resultados. 19.19 En una forma similar a la sección 19.8.3, use MATLAB para ajustar los datos del problema 19.17 mediante a) interpolación lineal, b) un polinomial de quinto orden y c) una segmentaria. 19.20 Repita el problema 19.18, pero ahora use MATLAB para realizar el análisis. 19.21 Repita el problema 19.15, pero ahora use la rutina RCURV de IMSL.

Page 250: Chapra12-20

CAPÍTULO 2 0

Aplicaciones en ingeniería: ajuste de curvas

El propósito de este capítulo es usar los métodos numéricos para el ajuste de curvas en la solución de algunos problemas de ingeniería. La primera aplicación, la cual es tomada de la ingeniería química, muestra cómo se puede linealizar y ajustar los datos en un modelo no lineal mediante regresión lineal. La segunda aplicación emplea segmentarias para estudiar un problema que tiene relevancia en el área ambiental de la ingeniería civil: transporte de calor y masa en un lago estratificado.

La tercera aplicación ilustra cómo se puede emplear una transformada rápida de Fourier (TRF) en la ingeniería eléctrica para analizar una señal determinando sus principales armónicas. La aplicación final muestra la forma en que se usa la regresión lineal múltiple para analizar datos experimentales en un problema de fluidos tomado de la ingeniería mecánica y aeroespacial.

2 0 . 1 R E G R E S I Ó N L I N E A L Y M O D E L O S D E P O B L A C I Ó N ( I N G E N I E R Í A Q U Í M I C A / P E T R O L E R A )

Antecedentes. Modelos de crecimiento poblacional son importantes en muchos campos de la ingeniería. En muchos de los modelos, es fundamental la hipótesis de que la razón de cambio de la población (dp/df) es proporcional a la población real (p) en cualquier tiempo (t), o en forma de ecuación,

%=kP (20.1)

donde k — factor de proporcionalidad conocido como el crecimiento específico y tiene las unidades de tiempo" 1. Si k es una constante, entonces la solución de la ecuación (20.1) se puede obtener de la teoría de las ecuaciones diferenciales:

p(t) = p0ekl (20.2)

dondep 0 = población cuando t = 0. En la ecuación (20.2) se observa quep(t) se aproxima al infinito en tanto t sea grande. Este comportamiento es claramente imposible para sistemas reales. Por tanto, el modelo debe ser modificado para hacerlo más realista.

Solución. Primero, se debe reconocer que la razón de crecimiento específico k no puede ser una constante en tanto la población se vuelva grande. Este es el caso, y debido a quep se aproxima al infinito, el organismo a modelar oslará limitado por luctorcs tales como carencia de comida y producción de deiechoi tóxicos, Una forma de expresar esto

Page 251: Chapra12-20

20.1 REGRESIÓN LINEAL Y MODELOS DE POBLACIÓN Í79 en forma matemática es mediante el uso de un modelo de razón de crecimiento saturudo tal que

k=kmix~J— (20.3) +J donde kmÍK = la razón de crecimiento obtenible máxima para grandes valores de comidu (j) y K = la constante de saturación media. En la figura 20.1 se tiene la gráfica de la ecuación (20.3) y muestra que cuando f = K,k = kmkJ2. Por tanto, K es la cantidad de comida disponible que respalda a una razón de crecimiento poblacional igual a la mitad de la razón máxima.

Las constantes K y kmix son valores empíricos basados en mediciones experimentales de k para varios valores d e / Como un ejemplo, suponga que la poblaciónp representa la levadura empleada en la producción comercial de cerveza, y / e s la concentración de la fuente carbono que será fermentada. Las mediciones de k contra/para la levadura se muestran en la tabla 20.1. Se requiere calcular & m á x y Ka partir de estos datos empíricos. Esto se lleva a cabo al invertir la ecuación (20.3) de manera similar a la ecuación (17.17) para obtener

J-=*±/=_!LJ_ + _L. (2o.4)

k k f k f k "rnáxJ a máx J "máx

Por este reordenamiento, se ha transformado la ecuación (20.3) en una forma lineal; esto es, l/k es una función lineal de \lf, con pendiente K/kmix e intercepto l/k^. Estos valores se grafican en la figura 20.2. F IGURA 2 0 . 1 Gráfica de la razón de crecimiento específico contra comida disponible para el modelo de razón de crecimiento saturado que se utiliza para caracterizar la cinética microblal. El valor de K se conoce como constante de saturación media, ya que conforma la concentración donde la razón de crecimiento específico es la mitad de su valor máximo.

Page 252: Chapra12-20

5 8 0 APLICACIONES EN INGENIERÍA: AJUSTE DE CURVAS

T A B L A 2 0 . 1 Datos usados para evaluar las constantes de un modelo de razón de crecimiento saturado para caracterizar la cinética microbial.

f, m g / L k, d í a " 1 \/f, L /mg día

7 0 .29 0 .14286 3.448 9 0 .37 0 .11111 2.703

15 0.48 0 .06666 2.083 25 0.65 0 .04000 1.538 4 0 0 .80 0 . 0 2 5 0 0 1.250 75 0 .97 0 .01333 1.031

100 0 .99 0 . 0 1 0 0 0 1.010 150 1.07 0 .00666 0 .935

Debido a esta transformación, se puede usar los procedimientos por mínimos cuadrados lineales descritos en el capítulo 17 para determinar kmilí = 1.23 días" 1 y K = 22.18 mg/L. Estos resultados combinados con la ecuación (20.3) se comparan con los datos transformados en la figura 20.3, y después se sustituyen en el modelo de la ecuación (20.1), dando

dp f

— = 1.23 p (705) dt 22 .18+ r V '

Observe que el ajuste da una suma de cuadrados de los residuos (como los calculados para los datos no transformados) de 0.001305.

La ecuación (20.5) se puede resolver usando la teoría de las ecuaciones diferenciales o los métodos numéricos analizados en el capítulo 25 cuando f(t) se conoce. S i / s e aproxima a cero en tanto p sea grande, entonces dpldt se aproxima a cero y la población se estabiliza.

F I G U R A 2 0 . 2 Versión linearizada del modelo de la razón de crecimiento saturado. La línea es un ajuste por mínimos cuadrados que se usa para evaluar los coeficientes del modelo femáx= 1.23 d ías" 1 y K = 22.1 8 mg/L para una levadura que se usa para producir cerveza.

1/í L/mg

Page 253: Chapra12-20

20.1 MORESIÓN LINEAL Y MODELOS DE POBLACIÓN I I I

máx

f, mg/L

F I G U R A 2 0 . 3 Ajuste del modelo de razón de crecimiento saturado para una levadura empleada en la producción comercial de cerveza.

La linearización de la ecuación (20.3) es una forma para evaluar las constantes y K. Un procedimiento alternativo, que es capaz de relacionarse en esta forma original, es la regresión no lineal descrita en la sección 17.5. La figura 20.4 muestra cómo se puede usar la herramienta Solver de Excel para estimar los parámetros supuestos con regresión no lineal. Como puede verse, una columna de valores predichos es desarrollada, basada en el modelo y los parámetros iniciales. Éstos se usan para generar una columna de residuos al cuadrado que se suman, y el resultado se coloca en la celda DI4.

F I G U R A 2 0 . 4 Regresión no lineal para ajustar el modelo de la razón de crecimiento saturado de una levadura empleada en la producción comercial de cerveza.

A B D 1 kmáx 1.2301 2 K 22.1386 3 4 f k k-predicción ^ ResA2 5 7 0.29 0 . 2 9 5 5 0 8 0 . 0 0 0 0 3 0 6 9 0.37 0.355536 0.000209 7 15 0.48 0.496828 0.000283 8 25 0.65 0.652384 0.000006 9 40 0.80 0.791842 0.000067 1 0 75 0.97 0.949751 0.000410 11 100 0.99 1.007134 0.000294

J * 150 1.07 1.071897 0.000004

1 SSR 0,00130J]

$ B $ 1 * A 5 / ( $ B $ 2 + A 5 )

= (B5 - C 5 ) A 2

> S U M ( D 5 . . D 1 2 )

Page 254: Chapra12-20

5 8 2 APLICACIONES EN INGENIERÍA: AJUSTE DE CURVAS

Después se utiliza el Solver de Excel para minimizar la celda D14 al ajustar las celdas B1:B2. El resultado, como el mostrado en la figura 20.4, da un estimado de km^x = 1.23 y K = 22.14, con una Sr = 0.001302. De esta forma, aunque, como se esperaba, la regresión no lineal da un ajuste ligeramente mejor, los resultados son casi idénticos. En otras aplicaciones, esto puede no ser cierto (o la función puede no ser compatible con linearización) y la regresión no lineal podría representar la única opción factible para obtener un ajuste por mínimos cuadrados.

2 0 . 2 U S O D E S E G M E N T A R I A S P A R A E S T I M A R L A T R A N S F E R E N C I A D E C A L O R ( I N G E N I E R Í A C I V I L / A M B I E N T A L )

Antecedentes. Los lagos en la zona templada pueden dividirse en estratos térmicos durante el verano. Como se ilustra en la figura 20.5, cerca de la superficie, el agua es tibia y liviana, y en el fondo es más fría y densa. Tal estratificación divide efectivamente el lago de manera vertical en dos capas: el epilimnion y el hipolimnion separados por un plano conocido como el thermocline.

La estratificación térmica tiene gran importancia para los ingenieros ambientales que estudian la contaminación de tales sistemas. En particular, la thermocline disminuye en gran medida el mezclado entre las dos capas. Como resultado, la descomposición de materia orgánica puede acarrear reducción de oxígeno en el fondo aislado de las aguas.

La ubicación de la thermocline se puede definir como el punto de inflexión de la curva temperatura-profundidad; es decir, el punto en el cual (PT/dx2 = 0. Es también el punto en el cual el valor absoluto de la primera derivada o gradiente es un máximo. Use segmentarias cúbicas para determinar la profundidad de la thermocline para el lago Piarte (véase la tabla 20.2). También use las segmentarias para determinar el valor del gradiente en la thermocline.

Temperatura contra profundidad durante el verano para el Lago Platte en Michigan. F I G U R A 2 0 . 5

0 o 7TC)

10 20 30 I I I I I I I I I I i I I I

Epilimnion

10 Thermocline

S N

20 Hypolimnion

30

Page 255: Chapra12-20

20.3 ANÁLISIS DE FOURIER 9 8 3

TABLA 2 0 . 2 Temperatura contra profundidad durante el verano para el Lago Piarte en Michigan.

T,°C 22.8 22.8 22.8 20.6 13.9 11.7 11.1 11.1

z, m

0 2.3 4.9 9.1 13.7 18.3 22 .9 27.2

Solución. Los datos se analizan con un programa que fue desarrollado con base en el pseudocódigo de la figura 18.8. Los resultados se despliegan en la tabla 20.3 y se enlistan las predicciones de la segmentaria junto con la primera y segunda derivada en intervalos de 1 m hacia abajo a través de la columna de agua.

Los resultados se grafican en la figura 20.6. Observe cómo la thermocline está claramente localizada a la profundidad donde el gradiente es el más grande (es decir, el valor absoluto de la derivada es la más grande) y la segunda derivada es cero. La profundidad es 11.35 m y el gradiente en este punto es — 1.61°C/m.

2 0 . 3 A N Á L I S I S D E F O U R I E R ( I N G E N I E R Í A ELÉCTR ICA)

Antecedentes. El análisis de Fourier se usa en muchas áreas de la ingeniería. Sin embargo, se emplea de manera extensa en aplicaciones de la ingeniería eléctrica tales como en el procesamiento de señales.

En 1848, Rudolph Wolf diseñó un método para cuantificar la actividad solar al contar el número de puntos individuales y grupos de puntos sobre la superficie del Sol. Calculó una cantidad que ahora se conoce como el número de puntos solares de Wolf, al sumar 10 veces el número de grupos más el conteo total de puntos individuales. En la figura 20.7 se tiene registros de este número desde 1770. Con base en los primeros datos históricos, Wolf determinó que la longitud del ciclo es de 11.1 años.

TABLA 2 0 . 3 Resultados del programa segmentario basado en el pseudocódigo de la figura 1 8.1 8.

dldad (m) T(C) dT/dz d2T/dz2 profundidad (m) T(C) dT/dz d2T/dz2 0. 22.8000 - 0115 .0000 15. 12 7652 -.6518 .3004 1 . 22.7907 - 0050 .0130 16. 12 2483 -.3973 .2086 2. 22.7944 0146 .0261 17. 11 9400 -.2346 .1167 3. 22.8203 0305 -.0085 18. 11 7484 -.1638 .0248 4. 22.8374 - 0055 -.0635 19. 11 5876 -.1599 .0045 5. 22.7909 - 0966 -.1199 20. 11 4316 -.1502 .0148 6. 22.6229 - 2508 -.1884 2 1 . 11 2905 -.1303 .0251 7. 22.2665 - 4735 -.2569 22. 11 1745 -.1001 .0354 8. 21.6531 - 7646 -.3254 23. 11 0938 -.0596 .0436 9. 20.7144 -1 1242 -.3939 24. 11 0543 -.0212 .0332

10. 19.4118 -1 4524 -.2402 25. 11 0480 .0069 .0229 11 . 17.8691 -1 6034 -.0618 26. 11 0646 .0245 .0125 12. 16.2646 1 5759 .1166 27. 11 0936 .0318 .0021 13. 14.7766 1 3702 .2950 28. 11 1000 .0000 .0000 14. 13.5825 - 9981 .3923

Page 256: Chapra12-20

5 8 4 APLICACIONES EN INGENIERÍA: AJUSTE DE CURVAS

F I G U R A 2 0 . 6 Gráficas de a) temperatura, b) gradiente y c) segunda derivada contra profundidad (m) generadas con el programa segmentarlo cúbico. La thermocllne se localiza en el punto de inflexión de la curva temperatura-profundidad.

0

T, °C dT/dz d*T/dz*

0 10 20_ -2 .0 -1 .0 0.0 -0 .5 0.0 0.5

4

8

12

16 -

20

24

28

I I I I I I I I I I Y I U I I I I I M I I M I I I I I 1 I I I I I

a)

Thermocline

b) c)

Use un análisis de Fourier para confirmar este resultado mediante la aplicación de una TRF a los datos de la figura 20.3. Determine con toda precisión el periodo al desarrollar una gráfica de potencia contra periodo.

Solución. Los datos para los años y el número de puntos solares se bajaron de la web 1

y se guardaron en un archivo de tabulador delimitado: sunspotdat. El archivo se puede cargar en MATLAB y a la información del año y número se le asignaron vectores con el mismo nombre,

» load sunspot .da t » yea r - sunspo t ( : , 1 ) ;number - sunspo t ( : , 2 ) ;

F I G U R A 2 0 . 7 Gráfica del número de puntos solares de Wolf contra año.

1700 1800 1900 2000

1 En el TIEMPO en que se IMPRIMÓ la EDICIÓN en INGLII DE EITE LIBRO EL HTLM ERA HNP',//WWW,NGDC,NOU,GOV/ /ITP/SOLAR/SSN/NN,HTML. . . . . . . .....-

Page 257: Chapra12-20

20.4 ANÁLISIS DE DATOS EXPERIMENTALES

Después, se aplica una TRF a los números de puntos solares

» y- f f t (number) :

Después de obtener la primera armónica, se determina la longitud de la TRF («) y luego se calcula la potencia y frecuencia,

» y ( l ) - [ ] ; » n=length(y); » power=abs(y( l :n/2)) . A 2; >> nyquis t= l /2 ; » f req=( l :n/2)/ (n/2)*nyqu i s t :

En este punto, el espectro de potencia es una gráfica de potencia contra frecuencia. Sin embargo, ya que el periodo es más significativo en el contexto actual, se puede determinar el periodo y una gráfica potencia-periodo,

>> per iod=l ./ f req >> plot(period,power):

El resultado, como el mostrado en la figura 20.8, indica un pico a los casi 11 años. El valor exacto se puede calcular con

>> index=-f ind(power==max(power)); >> period(index)

ansI O . 9259

2 0 . 4 A N Á L I S I S D E D A T O S E X P E R I M E N T A L E S ( I N G E N I E R Í A M E C Á N I C A / A E R O E S P A C I A L )

Antecedentes. Las variables de diseño en la ingeniería son a menudo dependientes de varias variables independientes. Con frecuencia esta dependencia funcional es mejor

F IGURA 2 0 . 8 I .'.poctro de potencia para li I.'I números de puntos i i ih ies de Wolf.

O C <D T Í

a.

-

h^i 1 1 U ^ L 1 1

10 20 Periodo (años)

30

Page 258: Chapra12-20

586 APLICACIONES EN INGENIERÍA: AJUSTE DE CURVAS

caracterizada por ecuaciones de potencia multivariable. Como se analizó en la sección 17.3, una regresión lineal múltiple de datos transformados a logarítmicos proporciona un medio para evaluar tales ecuaciones.

Por ejemplo, un estudio en ingeniería mecánica indica que el flujo de un fluido a través de una tubería esta relacionado con el diámetro de la tubería y la pendiente (véase la tabla 20.4). Use regresión lineal múltiple para analizar estos datos. Después use el modelo resultante para predecir el flujo en una tubería con un diámetro de 2.5 pies y una pendiente de 0.025 pies/pies.

Solución. La ecuación de potencias a evaluarse es

Q = a0Dat Sai (20.6)

donde Q = flujo (pies 3 /s), S = pendiente (pies/pies), D = diámetro tubería (pies), y a0, a \ Y a 2 — coeficientes. Tomando el logaritmo a esta ecuación resulta

log Q = log a 0 + ai log D + a2 log S

En esta forma, la ecuación es adecuada para una regresión lineal múltiple, ya que log Q es una función lineal de log S y log D. Usando el logaritmo (base 10) de los datos en la tabla 20.4, se puede generar las siguientes ecuaciones expresadas en forma matricial [recuerde la ecuación (17.22)]:

9 2.334 -18 .903 2.334 0.954 -4 .903

-18 .903 -4 .903 44.079

Este sistema se puede resolver usando la eliminación de Gauss para

log a0 = 1.7475

a\ = 2.62

a2 = 0.54

Si log a0 = 1.7475, a0 = 10 1 7 4 7 5 = 55.9, la ecuación (20.6) es ahora

Q = 55.9D262S0M

(20.7)

T A B L A 2 0 . 4 Datos experimentales para diámetro, pendiente y flujo en tubos circulares de concreto.

Exper imento D iámet ro , pies Pendiente, p ies/pies F lu jo , p i e s 3 / s

1 1 0 .001 1.4 2 2 0 .001 8.3 3 3 0 .001 24.2 4 1 0.01 4.7 5 2 0.01 28.9 ó 3 0.01 84.0 7 1 0.05 1 1.1 8 2 0.05 <W.() 9 3 0.05 200.0

log a0 11.691

ai 3.945 ai -22 .207

Page 259: Chapra12-20

PROBLEMAS 587

La ecuación (20.7) se puede usar para predecir el flujo para el caso de D — 2.5 pies y S = 0.025 pies/pies, como en

Q = 55.9(2.5) Z 6 2(0.025) S 0 ' 5 4 = 84.1 pie 3/s

Debe observarse que la ecuación (20.7) se puede usar para otros propósitos además del cálculo de flujo. Por ejemplo, la pendiente se relaciona con la pérdida de carga h, y longitud de tubería L por S = hJL. Si esta relación se sustituye en la ecuación (20.7) y la fórmula resultante se resuelve para hL, se obtiene la siguiente ecuación:

k. - L .Q 1 . 8 5 £ ) 4 . 8 5 1721

Esta relación es conocida como ecuación de Hazen-Williams.

P R O B L E M A S

Ingeniería química/petrolera U\. I Realice el mismo cálculo de la sección 20.1, pero ahora use regresión lineal y transformaciones para ajustar los datos con muí ecuación por potencias. Ignore el primer punto cuando ajus-111 l;i ecuación. 20.2 Usted realiza experimentos y determina los siguientes valores ile capacidad calorífica c para varias temperaturas Tde un gas:

- 4 0 - 2 0 10 70 100 120

1 2 5 0 1 2 8 0 1 350 1 4 8 0 1 5 8 0 1 700

I Isc regresión y determine un modelo para predecir c como una nineión áeT. 10 J La concentración saturada de oxígeno disuelto en agua como una función de la temperatura y de la concentración de cloro se enlista en la tabla P20.3. Use interpolación para estimar el nivel tic oxígeno disuelto para T = 18°C con cloro = 10 000 mg/L. ¿0.4 En el caso de los datos de la tabla P20.3 use la interpolación polinomial para obtener-una ecuación predictiva de segundo orden que exprese la concentración de oxígeno disuelto como una

función de la temperatura para el caso en que la concentración de cloro es igual a 20 000 mg/L. Use la ecuación para estimar la concentración de oxígeno disuelto para T — 8°C. 20.5 Use regresión lineal múltiple para obtener una ecuación predictiva para la concentración de oxígeno disuelto como una función de la temperatura y del cloro con base en los datos de la tabla P20.3. Use la ecuación para estimar la concentración de oxígeno disuelto para una concentración de cloro de 15 000 mg/ L e n f = 12°C. 20.6 Al comparar los modelos de los problemas 20.4 y 20.5, un modelo algo más sofisticado que toma en cuenta el efecto tanto de la temperatura y del cloro en el oxígeno disuelto saturado puede ser propuesto de la forma

os = HT) + f\(c) Esto es, se supone, un polinomial de tercer orden para la temperatura y una relación lineal para el cloro, con el fin de obtener resultados superiores. Use el procedimiento general lineal por mínimos cuadrados para ajustar este modelo con los datos de la

TABLA P 2 0 . 3 Dependencia de la concentración de oxígeno disuelto sobre la temperatura y concentración de cloro.

O x í g e n o disuel to (mg/L) para la concentración establecida de cloro y temperatu ra

T e m p e r a t u r a , °C Cloro = O m g / L Cloro = 10 0 0 0 m g / L Cloro = 2 0 0 0 0 m g / L

5 12.8 11.6 10.5 10 11.3 10.3 9.2 16 10.0 9.1 8.2 20 9.0 8.2 7.4 25 8.2 7.4 6,7 30 7.4 6.8 6,1

Page 260: Chapra12-20

5 8 8 APLICACIONES EN INGENIERÍA: AJUSTE DE CURVAS

tabla P20.3. Use la ecuación resultante para estimar la concentración de oxígeno disuelto para una concentración de cloro de 20 000 mg/L en T= 30°C. 20.7 Se sabe que la resistencia a la tensión de un plástico aumenta como una función del tiempo cuando se calienta. Se dispone de los siguientes datos:

Tiempo 10 15 20 25 40 5 0 55 6 0 75

Resis. a la tensión 4 20 18 5 0 33 48 80 6 0 78

Ajuste a una línea recta estos datos y use la ecuación para determinar la resistencia a la tensión en un tiempo de 30 min.

20.8 Se reunieron los siguientes datos para determinar la relación entre presión y temperatura de un volumen fijo de 1 kg de nitrógeno. El volumen es de 10 m 3.

T, °C - 2 0 0 20 4 0 50 70 100 120

P. N / m 3 7 500 8 104 8 7 0 0 9 300 9 6 2 0 10 200 11 200 11 7 0 0

Emplee la ley de los gases ideales pV = nRT para determinar R con base en estos datos. Observe que para la ley Tse debe expresar en Kelvin.

20.9 El volumen específico de un vapor sobrecalentado es enlistado en tablas de vapor para diferentes temperaturas. Por ejemplo, a una presión de 2 950 lb/pulg2 absolutas:

T, °F 7 0 0 7 2 0 7 4 0 7 6 0 7 8 0

v 0 .1058 0 .1280 0 .1462 0 .1603 0 .1703

Determine vpara T = 750 °F. 20.10 Un reactor está térmicamente estratificado con los valores de la siguiente tabla:

Profundidad, m 0 0.5 1.0 1.5 2.0 2.5 3.0

Temperatura, °C 7 0 68 55 22 13 11 10

Como se ilustra en la figura P20.10, se puede idealizar al tanque como dos zonas separadas por un fuerte gradiente de temperatura o thermocline. La profundidad de este gradiente se puede definir como el punto de inflexión de la curva temperatura-profundidad; es decir, el punto para el cual d2T/dz2 = 0. A esta profundidad, el flujo de calor de la superficie al fondo de la capa se puede calcular con la ley de Fourier,

,dT C ¿ 7

Ingeniería civil/ambiental 20.11 El esfuerzo cortante, en kips por pie cuadrado (kpc) de nueve muestras tomadas a distintas profundidades en un estrato de arcilla son

Profundidad, m 1.9 3.1 4.2 5.1 5.8 6.9 8.1 9.3 10.0

Esfuerzo, kpc 0.3 0 .6 0.4 0 .9 0 .7 1.1 1.5 1.3 1.6

Eütime el E S F U E R Z O CORTANTE A U N A P R O F U N D I D A D D E 4.5 TN .

20.12 Se realizó un estudio de ingeniería del transporte para determinar el diseño adecuado para carriles de bicicletas. Los datos se colectaron para anchos de carriles de bicicletas y distancias promedio entre bicicletas y carros en circulación. Los datos de 11 calles son:

Distancia x, pies 3 8 5 8 6 6 10 10 4 5 7

A. del carri y, pies 5 10 7 7.5 7 6 8 9 5 5.5 8

F I G U R A P 2 0 . 1 0 Use una segmentaria cúbica para el ajuste de estos datos con el fin de determinar la profundidad de la thermocline. Si k = 0.01 cal/(s • cm • °C) calcule el flujo a través de esta ¡nterface.

Temperatura T, °C

20 40 60

Thermocline

táÍÉM

Page 261: Chapra12-20

«) un i f i que Ion dutos. />) Ajusto u una linca recta los datos mediante regresión lineal.

Agrcguo estu l inca a la gráfica.

c) Si lu distanciu promedio mínima segura entro las bicicloüu y los carros circulando se considera de 7 pies, determine el ancho de carril mínimo correspondiente.

20.13 En la ingeniería de abastecimiento de aguas, el tamaño del reservorio depende de la estimación exacta del flujo de agua en el río del cual se toma. Para algunos ríos es difícil obtener registros históricos de muchos años atrás de tales datos de flujo. Por el contrario, datos meteorológicos sobre precipitación de muchos años atrás están a menudo disponibles. Por tanto, con frecuencia es útil determinar una relación entre flujo y precipitación. Esta relación se puede entonces usar para estimar flujos por años pero sólo cuando se hicieron dichas mediciones de precipitación. Para un río que se va a encauzar a un dique, se tienen los siguientes datos

Precipitación, cm 88.9 101.6 104.1 139.7 132.1 94 .0 116.8 121.9 99.1

Flujo, m 3 /s 114.7 172.0 152.9 269 .0 206.4 161.4 175.8 239 .0 130.0

a) Grafique los datos. b) Ajuste a una línea recta los datos mediante regresión lineal.

Sobreponga la línea de su gráfica. c) Use la mejor línea de ajuste para predecir el flujo de agua

anual si la precipitación es de 120 cm.

2(1.14 La concentración de fósforo total (p en mg/m3) y clorofila ¡i (c en mg/m3) para cada uno de los Grandes Lagos es

li i<|0 Superior te LIJO Michigan 111; J O Hurón I < i; jo Erie:

C luenca oeste Cuenca central ("uenca este

lurjo Ontario

4.5 8.0 5.5

39.0 19.5 17.5 21.0

0.8 2.0 1.2

11.6 4.4 3.8 5.5

o, = 2mn 1 m2 + n2 + 1

m2 + n2 + 1 + m2n2

m2 + n2 + 2 m2 + n2 + 1

+ sen 2mn Km2 + n2 + 1

m2 + n2 + 1 + m2n2

Ya que es inconveniente resolver esta ecuación de forma manual, se ha reformulado como

oz = qf:(m,n)

F IGURA P 2 0 . 1 5

I ,u clorofila a es un parámetro que indica cuánta vida de plantas CH\Í\ suspendida en el agua. Como tal, indica qué tan turbia y o|)iicu parece el agua. Use los datos anteriores para determinar una relación c. como una función de p. Use esta ecuación para predecir el nivel de clorofila que puede esperarse si el tratamiento ilo desechos os usado para disminuir la concentración de fósforo en la cuenca oeste del Lago Erie a 15 mg/m3. 20.15 El esfuerzo vertical o2 debajo de la esquina de un área rectiingulur sujoln u una carga uniforme de intensidad q está dada por In solución do la ecuación do Doussinesq:

Page 262: Chapra12-20

5 9 0 APLICACIONES EN INGENIERÍA: AJUSTE DE CURVAS

donde fz{m, n) se conoce como el valor influencia y m y n son relaciones adimensionales, con m = alz, n = blz y a y b como se definen en la figura P20.36. El valor influencia es entonces enlistado en una tabla, una porción de la cual se da aquí:

m n = 1.2 n = 1.4 n = 1.6 0.1 0 .02926 0 .03007 0 .03058 0.2 0 .05733 0 .05894 0 .05994 0.3 0 .08323 0 .08561 0 .08709 0.4 0 .10631 0 .10941 0.1 1 135 0.5 0 .12626 0 .13003 0 .13241 0.6 0 .14309 0 . 1 4 7 4 9 0 .15027 0.7 0 .15703 0 . 1 6 1 9 9 0 .16515 0.8 0 .16843 0 .17389 0 .17739

a) Si a = 4.8 y b — 16, use una interpolación polinomial de tercer orden para calcular oz a una profundidad de 10 m

Ingeniería eléctrica 20.18 Realice los mismos cálculos que en la sección 20.3, pero ahora analice los datos generados con f(t) = 5 eos (7í) — 2 sen (40 + 6. 20.19 Usted mide la caída de voltaje Va través de una resistencia para un número de diferentes valores de corriente i. Los resultados son

/ 0.25 0.75 1.25 1.5 2.0

V - 0 . 4 5 - 0 . 6 0 .70 1.88 6.0

Use interpolación polinomial para estimar la caída de voltaje para i — 1.1. Interprete sus resultados. 20.20 Realice nuevamente el cálculo del problema 20.19, pero ahora use regresión polinomial para obtener una ecuación cúbica para ajustar los datos. Grafique y evalúe los resultados. 20.21 La corriente en un alambre se mide con gran precisión como función del tiempo:

debajo de la esquina de un estribo rectangular que está sujeto a una carga total de 2001 (toneladas métricas). Exprese su respuesta en toneladas por metro cuadrado. Observe que q es igual a la carga por área.

b) Resuelva el inciso d) pero ahora use la función espline de Mathcad que se describió en la sección 19.8.2.

20.16 Tres organismos portadores de enfermedades decaen de manera exponencial en las aguas de un lago de acuerdo con el siguiente modelo.

p(t) = Ae~L5' +Be~03' +Ce'0XK'

Calcule la población inicial de cada organismo (A, B y Q dadas las siguientes mediciones:

i, hr 0.5 1 2 3 4 .. 5 6 7 8 9

Pin 7 5.2 3.8 3.2 2.5 2.1 1.8 1.5 1.2 1.1

0 .0013 0 .0085 0 .0005

3 5 8 6 6 896 1 2 4 1

t 0 0 .1250 0 .2500 0 .3750 0 .5000

i 0 6.2402 7 .7880 4 .8599 0 .0000

Determine i en t = 0.22. 20.22 Los siguientes datos se tomaron de un experimento que mide la corriente en un alambre para diferentes voltajes suministrados:

2 3 4 5 7 10

i, A 5.2 7.8 10.7 13 19.3 27.5

Con base en una regresión lineal de estos datos, determine la corriente para un voltaje de 6 V Grafique la línea y los datos y evalúe el ajuste. Determine si es una buena suposición quo el intercepto sea cero. Si es así, comience la regresión y fuerce ol intercepto a cero.

20.17 El mástil de un velero tiene un área de sección transversal de 10.65 cm2 y se construye de una aleación experimental de aluminio. Se efectuaron pruebas para definir la relación entre esfuerzo y deformación unitaria. Los resultados de las pruebas

Deformación unitaria, cm/cm 0.002 0 .0045 0 .0060

Esfuerzo, N/cm 2 4 9 6 5 5 172 5 5 1 7

El esfuerzo causado por el viento se puede calcular como F/Ac: donde F = fuerza en el mástil y Ac = área de sección transversal del mástil. Este valor se puede sustituir en la ley de Hooke para determinar la deflexión del mástil: AL = deformación X L; donde L = longitud del mástil. Si la fuerza del viento es de 25 069 N, use los datos para estimar la deflexión de un mástil de 9.14 m.

Page 263: Chapra12-20

PROBLEMAS 0*1

20.23 Se sabe que la caída de voltaje a través de un inductor cumple la ley de Faraday

donde VL es la caída de voltaje (en volts), L es la inductancia (en henrys; 1 H = IV- s/A) e i es la corriente (en amperes). Emplee los siguientes datos para estimar L:

di/dt, A/s 1 2 4 6 8 10

vh v 5 12 18 31 39 50

¿Cuál es el significado, si lo hay, del intercepto de la ecuación obtenida por regresión a partir de estos datos? 20.24 La ley de Ohm establece que la caída de voltaje Va. través de un resistor ideal es linealmente proporcional a la corriente i que fluye a través del resistor como en V = iR, donde R es la resistencia. Sin embargo, resistencias reales podrían no siempre cumplir la ley de Ohm. Suponga que usted realiza varios experimentos muy precisos para medir la caída de voltaje y la corriente correspondiente para cada resistencia. Los resultados, como se enlistan en la tabla P20.24, sugieren una relación curvilínea

T A B L A P 2 0 . 2 4 Datos experimentales para la caída de voltaje a través de un resistor sujeto a varios niveles de corriente

- 1 . 0 0 - . 5 0 - 0 . 2 5 0.25 0 .50 1.00

V - 1 9 3 - 4 1 - 1 3 . 5 6 2 5 13.5625 41 193

más que una línea recta representada por la ley de Ohm. Para cuantificar esta relación, se debe ajustar una curva a los datos. Debido al error de medición, el método preferido para el ajuste de la curva podría ser el de regresión para el análisis de tales datos experimentales. Sin embargo, la suavidad de esta relación, asi como la precisión de los métodos experimentales, sugieren que la interpolación podría ser la apropiada. Use una interpolación polinomial de quinto orden para ajustar los datos y calcule V para i = 0.10. 20.25 Repita el problema 20.24, pero ahora determine los coeficientes de la ecuación de quinto orden (véase la sección 18.4) que ajusten los datos de la tabla P20.24.

20.26 Se realiza un experimento para determinar el porcentaje de alargamiento de un material conductor eléctrico como una función de la temperatura. Los datos resultantes son

Temperatura, °C 200 250 300 375 425 4 7 5 525 6 0 0

Porcentaje de alargamiento 11 13 13 15 17 19 20 23

Prediga el porcentaje de alargamiento para una temperatura de 400°F.

20.27 Las funciones Bessel surgen con frecuencia en análisis avanzados de ingeniería, como en el estudio de los campos eléctricos por ejemplo. Esas funciones son usualmente no sujetas a una evaluación directa y, por tanto, a menudo se compilan en tablas matemáticas estándar. Por ejemplo,

1.8 2.0 2.2 2.4 2.6

0 .3400 0 . 2 2 3 9 0 .1104 0 .0025 0 .0968

listime J0(2.\), d) = mediante una interpolación polinomial y b) usando segmentarias cúbicas. Observe que el valor real es 0.1666. 20.28 La población (p) de una pequeña comunidad en los suburbios de unu ciudad crece con rapidez en un periodo de 20 unos:

f 0 5 10 15 20

p 100 212 448 9 4 9 2 0 0 9

Como ingeniero que trabaja en una compañía de servicio usted debe pronosticar la población que habrá dentro de 5 años, para poder anticipar la demanda de energía. Emplee un modelo exponencial y regresión lineal para hacer esta predicción.

Ingeniería mecánica/aeroespacial 20.29 Con base en la tabla 20.4, use interpolación lineal y cuadrática para calcular Q para D = 1.23 pies y S = 0.01 pies/ pies. Compare sus resultados con los mismos valores calculados con la fórmula obtenida en la sección 20.4. 20.30 Reproduzca la sección 20.4, pero ahora desarrolle una ecuación para predecir el diámetro como una función do lu pendiente

Page 264: Chapra12-20

5 9 2 APLICACIONES EN INGENIERÍA: AJUSTE DE CURVAS

y flujo. Compare sus resultados con la fórmula de la sección 20.4 y analice sus resultados. 20.31 La viscosidad cinemática del agua, v, está relacionada con la temperatura en la siguiente forma:

T,°C 0 4 8 12 16 20 24

v, 10 " 2 cm 2/s 1.7923 1.5676 1.3874 1.2396 1.1168 1.0105 0 .9186

Grafique estos datos a) Use interpolación para predecir va T = 7.5°C. b) Use regresión polinomial para ajustar una parábola a los

datos para realizar la misma predicción. 20.32 La ley de Hooke, la cual se cumple cuando un resorte no se deforma demasiado, significa que el alargamiento del resorte y la fuerza aplicada están linealmente relacionados. La proporcionalidad es parametrizada por la constante del resorte k. Se puede establecer un valor para este parámetro de manera experimental al colocar pesos conocidos sobre el resorte y midiendo la compresión resultante. Tales datos están contenidos en la tabla P20.32 y graficados en la figura P20.32. Observe que para un peso por arriba de 40 X 104 N, la relación entre la fuerza y el desplazamiento ya no se cumple. Esta clase de comportamiento es típica de lo que se denomina un "resorte endurecido". Emplee regresión lineal para determinar un valor de k para la porción lineal de este sistema. Además, ajuste a una relación no lineal la porción no lineal. 20.33 Repita el problema 20.32 pero ahora ajuste a una curva de potencias todos los datos en la tabla P20.32. Comente sus resultados. 20.34 La distancia requerida para detener un automóvil es una función de su velocidad. Los siguientes datos experimentales fueron colectados para cuantificar esta relación:

Velocidad, mi/h 15 20 25 30 40 50 60

Distancia de frenado, pies 16 20 34 40 60 90 120

Estime la distancia de frenado para un carro que circula a 45 mi/h.

F IGURA P 2 0 . 3 2 Gráfica de fuerza (en 10 4 newtons) contra desplazamiento (en metros) para el resorte de un sistema de suspensión de un automóvil.

Desplazamiento, m

T A B L A P 2 0 . 3 2 Valores experimentales para alargamiento x y fuerza F para el resorte en un sistema de suspensión de un automóvil.

Desplazamiento, m 0.10 0.17 0.27 0.35 0 .39 0.42 0.43 0.44

Fuerza, 10" N 10 20 30 40 60 60 70 80

Page 265: Chapra12-20

PROBLEMAS 593

Í0.35 So reulizu un experimento para definir la relación entre el c) Use la ecuación de mejor ajuste para predecir el tiempo do PNtúcrzo aplicado y el tiempo para fracturar un acero inoxida- fractura para un esfuerzo aplicado de 17 kg/mm 2. ble. Se aplican ocho diferentes valores de esfuerzo, y los datos 20.36 La aceleración debida a la gravedad a una altitud y por l'ONultantes son arriba de la superficie de la tierra está dada por

i l (iplic, x, kg/mm2 5 10 15 20 25 30 35 4 0 y, m 0 20 0 0 0 4 0 0 0 0 6 0 0 0 0 80 000

llwnpo de fractura, y, h 4 0 30 25 4 0 18 20 22 15 g, m/s 2 9 .8100 9 .7487 9 .6879 9 .6278 9 .5682

u) Grafique los datos Calcule g para y = 55 000 m. />) Ajuste a una línea recta los datos usando regresión lineal.

Sobreponga esta línea en su gráfica.

Page 266: Chapra12-20

E P Í L O G O : P A R T E C I N C O

P T 5 . 4 E L E M E N T O S D E J U I C I O

La tabla PT5.4 proporciona un resumen de los elementos de juicio involucrados en el ajuste de curvas. Las técnicas se dividieron en dos grandes categorías, según sea la incer-tidumbre de los datos. Para mediciones imprecisas se usa regresión para desarrollar una "mejor" curva que ajuste la tendencia global de los datos sin que necesariamente pase a través de cualquier punto individual. Para mediciones precisas se usa interpolación para desarrollar una curva que pasa justo a través de cada uno de los puntos.

Todos los métodos de regresión se designan para ajustar funciones que minimicen la suma de los cuadrados de los residuos entre los datos y la función. Tales métodos son denominados regresión por mínimos cuadrados. La regresión lineal por mínimos cuadrados se usa para casos en los que una variable dependiente y otra independiente se relacionan una con la otra en forma lineal. Para situaciones donde una variable dependiente y una independiente exhiben una relación curvilínea, hay varias opciones disponibles. En algunos casos, se usan transformaciones para linearizar la relación. En estos ejemplos, puede aplicarse la regresión lineal a las variables transformadas con el fin de determinar la mejor línea recta. De manera alterna, la regresión polinomial puede emplearse para ajustar una curva directamente con los datos.

La regresión lineal múltiple se utiliza cuando una variable dependiente es una función lineal de dos o más variables independientes. Se puede aplicar también transformaciones logarítmicas a este tipo de regresión para algunos casos en los que la dependencia múltiple es curvilínea.

T A B L A P T 5 . 4 Comparación de las características de métodos alternos para el ajuste de curvas.

M é t o d o

E r r a r asociado con da los

A jus te con los datos indiv iduales

N ú m . de puntos que a jus tan en f o r m a exacta

E s fue r zo de programación Comentar ios

Regresión Regresión lineal Grande Regresión polinomial Grande

Regresión lineal múltiple Grande Regresión no lineal Grande

Interpolación Polinomios por Pequeña diferencia dividida de Newlon

Polinomios de Lagrange

Segmentarlas cúblcat

Pequeña

Pequeña

Aproximada Aproximada

Aproximada Aproximada

Exacta

Exacta

Exacta

0 0

n + 1

n + 1

Fácil Moderado

Moderado Difícil

Fácil

Fácil

Ajuste por secciones Moderado

El error de redondeo se vuelve pronunciado para versiones de orden superior

Usualmente elegido para análisis exploratorios

Usualmente preferido cuando se conoce ol orden Primera y segunda derivada laual en nodoi

Page 267: Chapra12-20

PT5.5 RELACIONES IMPORTANTES Y FÓRMULAS

La regresión polinomial y lineal múltiple (observe que la regresión lineal simple es un elemento de ambas) pertenece a una clase más general de modelos de mínimos cuadrados lineales. Son clasificadas así porque son lineales con respecto a sus coeficientes. Estos modelos son típicamente implementados mediante sistemas algebraicos lineales que algunas veces están mal condicionados. Sin embargo, en muchas aplicaciones de ingeniería (esto es, para ajustes de orden inferior), esto no es así. Para casos donde sea un problema se cuenta con procedimientos alternos. Por ejemplo, se dispone de una técnica llamada polinomiales ortogonales para realizar regresión de polinomios (véase la sección PT5.6).

Las ecuaciones que no son lineales con respecto a sus coeficientes son llamadas no lineales. Se dispone de técnicas de regresión especiales para ajustar tales ecuaciones. Estos son métodos aproximados que empiezan con un parámetro inicial estimado y después iterativamente regresan al punto inicial con valores que minimizan la suma de los cuadrados.

La interpolación polinomial está diseñada para ajustar al único polinomio de n-ésimo orden que pasa justo a través de n + 1 puntos precisos. Este polinomio se presenta en dos formatos alternos. La interpolación polinomial por diferencias divididas de Newton es ideal para aquellos casos donde el orden adecuado del polinomio se desconoce. El polinomio de Newton es apropiado para tales situaciones, ya que se programa en forma fácil en un formato que sirve para comparar resultados de diferentes órdenes. Además, un error estimado se puede simplemente incorporar en la técnica. Así, usted puede comparar y escoger de los resultados al usar varios polinomios de diferente orden.

La interpolación de polinomios de Lagrange es una formulación alternativa que es conveniente cuando el orden se conoce de antemano. Para esas situaciones, la versión de Lagrange es algo más simple de programar y no requiere el cálculo y almacenamiento de diferencias divididas finitas.

Otro procedimiento para ajustar curvas es la interpolación segmentaria. Esta técnica ajusta un polinomio de bajo orden para cada intervalo entre los datos. El ajuste se hace de manera suave al igualar las derivadas de los polinomios adyacentes con el mismo valor en sus puntos de conexión. La segmentaria cúbica es la versión más común. Las segmentarias son de gran utilidad cuando se ajustan datos que por lo general son suaves, pero que exhiben áreas locales de cambio abrupto. Tales datos tienden a inducir oscilaciones desordenadas cuando se interpolan polinomios de orden superior. Las segmentarias cúbicas son menos propensas a esas oscilaciones debido a que están limitadas a variaciones de tercer orden.

El último método que se estudia en esta parte del libro es la aproximación de Fourier. Esta área trata del uso de funciones trigonométricas para aproximar formas de onda. En contraste con las otras técnicas, el mayor énfasis de este procedimiento es no ajustar los datos a una curva. En lugar de esto, el ajuste de la curva se emplea para analizar la frecuencia característica de la señal. En particular, se dispone de una transformada rápida de Fourier para modificar en forma eficiente una función a partir del dominio del tiempo y de la frecuencia para poner en claro su estructura armónica en cuestión.

P T 5 . 5 R E L A C I O N E S I M P O R T A N T E S Y F Ó R M U L A S

La tabla PT5.5 resume información importante que se presentó en la parte cinco. Esta tabla se puede consultar para tener un rápido acceso a relaciones y fórmulas.

Page 268: Chapra12-20

5 9 6 EPÍLOGO: PARTE CINCO

T A B L A P T 5 . 5 Resumen de información importante presentada en la parte cuatro.

Método Formulación Interpretación gráf ica E r r o r e s

Regresión lineal

Regresión polinomial

Regresión lineal múltiple

y = a 0 + a,x

i, n S xy, - £ x, X y, donde a, = l a -

n £ x 2 - p x ( ] 2

°o = Y - ° i x y = o 0 + o ] x + . + a m x m

(Evaluación de las a equivalentes para la solución de m + 1 ecuaciones algebraicas lineales)

y = a 0 + a,x, +•••+ a„xm

Evaluación de las a equivalentes para la solución de m + 1 ecuaciones algebraicas lineales

y *

i • ••

s. V» - V n - 2

~ S, - 5, S,

S, r /' V n - (m +

s, - sr s, s,

x 2

n - [m + s, - sf

s, Interpolación polinomial por diferencias divididas de Newton

Interpolación polinomial de Lagrange

Segmentarias cúbicas

f2\x) = b0 + b, (x - x 0 ) + b2(x - *o)(* _ x i ) donde b0 = f(xg)

b2 = f[x 2, x,, x 0 ]

f2(x) = f(x0) x - x, \/ x - X-x0 x2.

*0

+ f(x2)| <i - x0Axi x — XQ \ / x — x <2 X0/\X2

Una cúbica: oye3 + bjX2

+ c¡x + d, se ajusta a cada intervalo entre nodos. Primera y segunda derivadas son ¡guales en cada nodo

y t a v 3 +

bix2 + c 1x+cr 1

• nodo

R2 = \x - x0](x - x,|(x - x2) 6

/?2 = (x - x0)(x - x,|(x - x2)f[x3, x2, X,, x0]

R2 = (x - x0)(x - x,)(x - x2) -6

2 = I* - x0)(x - x,)(x - x2)f[x3, x2, X,, x0]

a 2 x3 + ¿ 2 X

2 + Cjx + c¡2 * Nota: 'Por simplicidad, se muestran las versiones de segundo orden.

Page 269: Chapra12-20

PT5.6 M É T O D O S A V A N Z A D O S Y R E F E R E N C I A S A D I C I O N A L E S 597

P T 5 . 6 M É T O D O S A V A N Z A D O S Y R E F E R E N C I A S A D I C I O N A L E S

Aunque la regresión polinomial con ecuaciones normales es adecuada para muchas aplicaciones de la ingeniería, hay problemas en contexto donde su sensibilidad a los errores de redondeo pueden representar una seria limitación. Un procedimiento alternativo basado en polinomios ortogonales puede disminuir esos efectos. Debería observarse que de este procedimiento no se obtiene una ecuación de mejor ajuste; en vez de ello, da predicciones individuales para ciertos valores de la variable independiente. Se puede consultar a Shampine y Alien (1973) y Guest (1961) sobre información acerca de polinomios ortogonales.

Mientras que la técnica de polinomios ortogonales es útil para desarrollar una regresión polinomial, no representa una solución al problema de inestabilidad para el modelo de regresión lineal general [véase ecuación (17.23)]. Un procedimiento alternativo con base en la descomposición de un solo valor, llamado método SVD, está disponible para dicho propósito. También se puede encontrar información sobre este procedimiento en Forsythe y cois. (1977), Lawson y Hanson (1974), y Press y cois. (1992).

Además del algoritmo de Gauss-Newton, existe una variedad de métodos de optimización que se pueden usar de manera directa con el fin de desarrollar un ajuste por mínimos cuadrados para una ecuación no lineal. Esas técnicas de regresión no lineal incluyen los métodos de paso descendente y de Marquardt (recuerde la parte cuatro). Se puede encontrar información general sobre regresión en Draper y Smith (1981).

Todos los métodos de la parte cinco se expresaron en términos de ajuste de curvas con los datos. Además, usted quizá desee ajustar una curva con otra. El objetivo principal de tal aproximación funcional es la representación de una función complicada por una versión simple que sea más fácil de manejar. Una manera de hacer esto es usar la función complicada para generar una tabla de valores. Después, las técnicas analizadas en esta parte del libro pueden usarse para ajustar polinomios a estos valores discretos.

Un procedimiento alternativo se basa en el principio minimax (véase la figura 17.2c). Este principio especifica que los coeficientes de la aproximación polinomial deben ser elegidos de tal forma que la máxima discrepancia sea lo más pequeña posible. Así, aunque la aproximación pueda no ser tan buena como la dada por la serie de Taylor en el punto base, es por lo general mejor a través de todo el rango del ajuste. La economización Chebyshev es un ejemplo de un procedimiento para una aproximación funcional con base en tal estrategia (Ralston y Rabinowitz, 1978; Gerald y Wheatley, 1984; y Carnahan, Luther y Wilkes, 1969).

Un área importante en el ajuste de curvas es la combinación de regresiones segmentarias con mínimos cuadrados. Así, una segmentaria cúbica se genera de tal forma que no intercepte cada punto, sino que minimice la suma de los cuadrados de los residuos entre los datos y las curvas segmentarias. El procedimiento involucra el uso de las tan conocidas segmentarias B como funciones base; son nombradas así debido a su uso como función base, y también por su característica forma de campana. Tales curvas son consistentes con un procedimiento segmentario en que su valor y su primera y segunda derivadas podrían tener continuidad en sus extremos. De esta forma se asegura la continuidad de f(x) y sus derivadas inferiores en los nodos. Wold (1974), Prenter (1974), y Cheney y Kincaid (1994) presentan un análisis de este procedimiento.

Page 270: Chapra12-20

5 9 8 EPÍLOGO: PARTE CINCO

En resumen, con lo anterior se intenta proporcionarle caminos para la exploración más profunda sobre el tema, todas la referencias anteriores proporcionan descripciones de las técnicas básicas tratadas en la parte cinco. Le recomendamos consultar esas fuentes alternas para ampliar su comprensión de los métodos numéricos para el ajuste de curvas.

ii

Page 271: Chapra12-20

D I F E R E N C I A C I Ó N N U M É R I C A E I N T E G R A C I Ó N

P T 6 . 1 M O T I V A C I Ó N

El cálculo es la matemática del cambio. Como los ingenieros deben tratar en forma continua con sistemas y procesos que cambian, el cálculo es una herramienta esencial en nuestra profesión. El corazón del cálculo está relacionado con los conceptos matemáticos de diferenciación e integración.

De acuerdo con la definición del diccionario, diferenciar significa "marcar por diferencias; distinguir; [ . . . ] percibir la diferencia en o entre". En el contexto de las matemáticas, la derivada, que sirve como vehículo fundamental para la diferenciación, representa la razón de cambio de una variable dependiente con respecto a una independiente. Como se ilustra en la figura PT6.1, la definición matemática de la derivada empieza con una aproximación por diferencias:

A> = f{x, + Ax) - /(*,-) Ax Ax

(PT6.1)

donde y y f(x) son representaciones alternativas de la variable dependiente y x es la variable independiente. Si se permite que Ax se aproxime a cero, como ocurre al moverse de la figura PTó.lo a la PTó.lc, la diferencia es ahora una derivada

F I G U R A P T 6 . 1 La definición gráfica de una derivada: debido a que Axse aproxima a cero en ir de a) a c), la aproximación por diferencias se convierte en una derivada.

Page 272: Chapra12-20

6 0 2 DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN

dy_ = H M / ( * , - + Ax) - f(x¡) dx A . V - » O Ax

donde dyldx [que se puede designar también como y'of\x¡)] es la primera derivada de y con respecto a x evaluada en x¡. Como se observa en la ilustración visual de la figura PTó.lc, la derivada es la pendiente de la tangente a la curva enx,.

En cálculo, el proceso inverso de la diferenciación es la integración. De acuerdo con la definición del diccionario, integrar significa "llevar junto, como partes, en un todo; unir; indicar la cantidad to ta l . . . " . Matemáticamente, la integración se representa por

(PT6.2)

que se tiene para la integral de la funciónf(x) con respecto a la variable independiente x, evaluada entre los límites x = a a x = b. La función f(x) en la ecuación (PT6.2) es llamada integrando.

Como lo sugiere la definición del diccionario, el "significado" de la ecuación (PT6.2) es el valor total, o sumatoria de f(x)dx sobre el rango x = a a b. De hecho, el símbolo / es ahora una letra S estilizada que intenta representar la conexión cercana entre integración y sumatoria.

La figura PT6.2 representa una manifestación gráfica del concepto. Para funciones que están por arriba del eje x, la integral se expresa por la ecuación (PT6.2) que corresponde al área bajo la curva de f(x) entre x — a y b.1

1 Debería observarse que el proceso representado por la ecuación (PT6 .2 ) y la figura P T 6 . 2 es llamado integración definida. Hay otro tipo que se denomina integración indefinida en la cual los límites a y b no están especificados. Como se analizará en la parte siete, la integración indefinida trata con la determinación de una función de la cual se da su derivada.

F I G U R A P T 6 . 2 Representación gráfica de la integral de í(x] entre los límites x = o a b. La integral es equivalente al área bajo la curva.

' W 4

Page 273: Chapra12-20

Pro.l MOTIVACIÓN éos

Como se dijo antes, la "selección o discriminación" de la diferenciación y el "llevar junto" de la integración se vinculan en forma estrecha con procesos que, de hecho, están inversamente relacionados (véase la figura PT6.3). Por ejemplo, si se tiene una función dada y (í) que especifica la posición de un obj eto como función del tiempo, la diferenciación proporciona un medio para determinar su velocidad, como en (véase figura PT6.3a).

d v(t) = —y(t) at

De manera inversa, si se tiene la velocidad como función del tiempo, la integración se usará para determinar su posición (véase figura PT6.36),

y(t) = f v(t) dt Jo

De esta manera, podemos generalizar que la evaluación de la integral

" / Ja

es equivalente a resolver la ecuación diferencial — = /(*) dx

cb 1 = I f(x) dx

para una y (b) dada la condición inicial y (a) = 0.

Page 274: Chapra12-20

604 DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN

Debido a esta relación cercana, optamos por dedicar esta parte del libro a ambos procesos. Entre otras cosas, esto proporcionará la oportunidad de resaltar sus similitudes y diferencias desde una perspectiva numérica. Además, nuestro análisis tendrá relevancia en las siguientes partes del libro, donde se tratarán ecuaciones diferenciales.

\ / Í . P T 6 . 1 . 1 Métodos s in computadora para diferenciación e integración

La función que será diferenciada o integrada estará usualmente en una de las siguientes tres formas:

1. Una función simple continua tal como una polinomio, una exponencial o una función trigonométrica.

2. Una función continua complicada que es difícil o imposible de diferenciar o integrar de manera directa.

3. Una función tabulada donde los valores de x y f(x) están dados en un número de puntos discretos, como es frecuente el caso en datos experimentales o de campo.

En el primer caso, la derivada o integral de una simple función se puede evaluar en forma analítica mediante cálculo. Para el segundo caso, las soluciones analíticas son a menudo imprácticas y algunas veces imposibles de obtener. En estos ejemplos, así como en el tercer caso de datos discretos, se debe emplear métodos aproximados.

Un método sin computadora para determinar las derivadas a partir de datos es conocido como diferenciación gráfica por áreas iguales. En este método los datos (x, y) se tabulan y, para cada intervalo, se emplea una diferencia dividida simple Ay/Ax para estimar la pendiente. Después, esos valores se grafican como una curva de pasos contra x (véase figura PT6.4). Luego se dibuja una curva suave que intenta aproximar el área bajo

F I G U R A PT6 .4 Diferenciación por áreas iguales, o) Se usan las diferencias divididas centradas para estimar la derivada para cada intervalo entre los datos, b) Las estimaciones de la derivada se representan en forma de gráfica de barras. Se superpone una curva suave sobre esta gráfica para aproximar el área bajo la gráfica de barras. Esto se lleva a cabo al dibujar la curva de tal forma que áreas ¡guales positivas y negativas estén equilibradas, c) Se pue-(lo entonces leer los valores de dy/dx. de la curva suave,

X y Ay/Ax

0 0 66.7

3 200 50

6 350 40

9 470 30

15 650 23.3

18 720

0 3 6 9 12 15 18 x

dy/dx 76.50

57.50

45.00

36.25

15 25.00

18 21.50

C)

Page 275: Chapra12-20

PT8.1 M U I I T A U U I N

la curva de pasos. Es decir, se dibuja así para equilibrar las áreas negativas y positivas. Las razones para valores dados de x pueden entonces leerse en la curva.

En el mismo contexto, se emplearon procedimientos visualmente orientados para integrar los datos tabulados y las funciones complicadas antes de la llegada de la computadora. Un procedimiento simple intuitivo es graficar la función sobre una cuadrícula (véase figura PT6.5) y contar el número de cuadros que aproximen el área. Este número multiplicado por el área de cada cuadro proporciona una burda estimación del área total bajo la curva. Dicha estimación se puede refinar, a expensas de un esfuerzo adicional, al usar una cuadrícula más fina.

Otro procedimiento de sentido común es dividir el área en segmentos verticales, o barras, con una altura igual al valor de la función en el punto medio de cada barra (véase figura PT6.6). El área de los rectángulos puede entonces calcularse al sumar el área total estimada. En este procedimiento se supone que el valor en el punto medio proporcionu una aproximación válida de la altura promedio de la función para cada barra. Como para el método de cuadrícula, es posible hacer estimaciones más refinadas al usar más (y más delgadas) barras para aproximar la integral.

Aunque un procedimiento así de simple tiene utilidad para estimaciones rápidas, so dispone de técnicas numéricas alternativas para el mismo propósito. No es de sorprender que el más simple de estos métodos sea similar, en esencia, a las técnicas sin computadora.

Para diferenciación, las técnicas numéricas fundamentales usan diferencias divididas finitas para estimar derivadas. Para datos con error, un procedimiento alterno es ajustar los datos a una curva suave con una técnica como la de regresión por mínimos cuadrados y después diferenciar esta curva para obtener estimaciones de la derivada.

En el mismo sentido, se dispone de integración numérica o métodos de cuadratura para obtener integrales. Esos métodos, que de hecho son más fáciles de implementar que

Page 276: Chapra12-20

6 0 6 DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN

con el procedimiento de cuadrícula, son similares en esencia al método por barras. Es decir, las alturas de la función se multiplican por el ancho de las barras y se suman para estimar la integral. Sin embargo, con elecciones inteligentes de factores ponderados, la estimación resultante se puede hacer más exacta que para el "método de barras" simple.

Como en el método de barras simple, las técnicas numéricas de integración y diferenciación utilizan datos en puntos discretos. Como la información ya está tabulada en tal forma, es naturalmente compatible con muchos de los procedimientos numéricos. Aunque las funciones continuas no están originalmente en forma discreta, es a menudo una proposición simple usar las ecuaciones dadas para generar una tabla de valores. Como se ilustra en la figura PT6.7, esta tabla se puede entonces evaluar con un método numérico.

P T 6 . 1 . 2 Diferenciación numérica e integración en ingeniería

La diferenciación e integración de una función tiene tantas aplicaciones en la ingeniería que usted requeriría estudiar cálculo diferencial e integral en su primer año en la universidad. Muchos ejemplos específicos de tales aplicaciones se podrían dar en todos los campos de la ingeniería.

La diferenciación es algo común en ingeniería debido a que mucho de nuestro trabajo involucra caracterizar los cambios de las variables tanto en tiempo como en espacio. De hecho, muchas de las leyes y otras generalizaciones que figuran de manera prominente en nuestro trabajo se basan en predecibles en las cuales el cambio mismo se manifiesta en el mundo físico. El ejemplo principal es la segunda ley de Newton, que no está dirigida en términos de la posición de un objeto, sino en su cambio de posición con respecto al tiempo.

Además de tales ejemplos temporales, numerosas leyes que gobiernan el comportamiento espacial de las variables se expresan en términos de derivadas. Entro las más comunes figuran las leyes que involucran potenciales o gradientes. Por ejemplo, la ley de

Page 277: Chapra12-20

PT6.1 MOTIVACIÓN 607

/ * 2 2 + cos(1 +> / V1 + 0.5 ser

•'O

X M 0.25 2.599 0.75 2.414 1.25 1.945 1.75 1.993

F I G U R A P T 6 . 7 Aplicación de un método de integración numérico: a| Una función continua complicada, b) Tabla de valores discretos de f[x) generados a partir de la función, c) Uso de un método numérico (el método do barras) para estimar la Integral con base en los puntos discretos. Para una función tabulada, los datos están ya en forma tabular b); por tanto, el paso a) es

innecesario.

Fourier para la conducción de calor cuantifica la observación de que el calor fluye de regiones de alta a baja temperatura. Para el caso de una dimensión, ésta se puede expresar matemáticamente como

dT Flujo de calor = —k'

dx

Así, la derivada proporciona una medida de la intensidad del cambio de la temperatura, o gradiente, que promueve la transferencia de calor. Leyes similares proporcionan modelos de trabajo en muchas áreas de la ingeniería, entre ellos el modelado de dinámica de fluidos, transferencia de masa, cinética de reacción química y flujo electromagnético. La habilidad para estimar de manera exacta las derivadas es una faceta importante de nuestra capacidad para trabajar de manera efectiva en estas áreas.

Así como las estimaciones exactas de las derivadas son importantes en ingeniería, también el cálculo do integrales es valioso. Varios ejemplos se relacionan direclnmonle

Page 278: Chapra12-20

6 0 8 DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN

F I G U R A P T 6 . 8 Ejemplos de cómo se usa la integración para evaluar aplicaciones en áreas de la ingeniería, a) Un topógrafo podría necesitar saber el área de un campo limitado por una corriente en forma de curvas y dos caminos, b) Un ingeniero abastecedor de aguas quizá requiera saber el área de sección transversal de un río. c) Un ingeniero en estructuras tal vez necesite determinar la fuerza neta ejercida por un viento no uniforme soplando contra un lado de un rascacielos.

con la idea de la integral como el área bajo la curva. La figura PT6.8 ilustra algunos casos donde la integración se usa para este propósito.

Otras aplicaciones comunes relacionan la analogía entre integración y sumatoria. Por ejemplo, una aplicación común es determinar la media de funciones continuas. En la parte cinco se abordaron los conceptos de la media de n datos discretos [recuerde la ecuación PT6.1]:

£ y¡

Media = — — (PT6.3) n

donde y¡ son las mediciones individuales. La determinación de la media de puntos discretos se ilustra en la figura PT6.9a.

En contraste, suponga que y es una función continua de una variable independiente x, como se ilustra en la figura PT6.9a. Para este caso existe un número infinito de valores entre ay b. Así como con la ecuación (PT6.3) que se aplica para determinar la media, usted podría interesarse en calcular la media o promedio de la función continua y = f(x) para el intervalo de a a b. La integración se usa para este propósito, como lo especifica la fórmula

í f(x) dx Media = ^ - (PT6.4)

b - a

Page 279: Chapra12-20

PTÓ.1 M O T I V A C I Ó N 609

2 3 4 a)

Media

HOURA P T 6 . 9 IJnn llimlHu Ion de la media miu iluh 11 ii) dlscretosy |t) ( - M I I I I I U I I ) *

Esta fórmula tiene cientos de aplicaciones en ingeniería. Por ejemplo, se usa para calcular el centro de gravedad de objetos irregulares en la ingeniería mecánica y civil y para determinar la raíz media cuadrática en ingeniería eléctrica.

Las integrales son empleadas también por ingenieros para evaluar la suma o cantidad total de una variable física dada. La integral se evalúa sobre una línea, un área o un volumen. Por ejemplo, la masa total química contenida en un reactor está dada como el producto de la concentración de químicos en el volumen del reactor, o

Masa = concentración X volumen

donde la concentración tiene unidades de masa por unidad de volumen. Sin embargo, suponga que la concentración varía de un lugar a otro dentro del reactor. En este caso, es necesario sumar los productos de concentraciones locales ci y los volúmenes del elemento correspondiente AV¡:

n

Masa = c¡ AV¡

;=i donde n es el número de volúmenes discretos. Para el caso continuo, donde c(x, y, z) es una función conocida yx,yyz son las variables independientes que designan la posición en las coordenadas cartesianas, la integración se usará para el mismo propósito:

Masa == / / / c(x, y , z) dx dy dz

Page 280: Chapra12-20

6 1 0 DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN

-/// Masa = c(V)dV

la cual es conocida como una integral de volumen. Observe la fuerte analogía entre sumatoria e integración.

Ejemplos similares podrán darse en otros campos de la ingeniería. Por ejemplo, la razón total de transferencia de energía a través de un plano donde el flujo (en calorías por centímetro cuadrado por segundo) es una función de la posición, está dada por

Transferencia de calor = / / flujo dA

la cual es referida como una integral de área, donde A = área. De manera similar, para el caso en una dimensión, la masa total de una barra con

densidad variable y que tiene un área de sección transversal constante, está dada por

m = A I p(x) dx Jo

donde m = masa total (kg), L = longitud de la barra (m), p(x) = densidad conocida (kg/ m 3 ) como una función de la longitud x (m) y A = área de sección transversal de la barra (m 2).

Por último, las integrales se usan para evaluar diferenciales o razón de ecuaciones. Suponga que la velocidad de una partícula es una función continua conocida del tiempo v(t),

— = v(t) dx

La distancia total y recorrida por esta partícula en un tiempo t está dada por (véase figura PT6.36)

y = í v(t)dt (PT6.5) Jo

Éstas son sólo algunas aplicaciones de diferenciación e integración que usted podría enfrentar en forma regular en el desarrollo de su profesión. Cuando las funciones sujetas a análisis son simples, usted normalmente escogerá evaluarlas desde un contexto analítico. Por ejemplo, en el problema del paracaidista en caída, determinamos la solución para la velocidad como una función del tiempo [véase ecuación (1.10)]. Esta relación podría sustituirse en la ecuación (PT6.5), la cual se integraría con facilidad para determinar la distancia a la que caerá el paracaidista en un tiempo t. Para este caso, la integral es simple de evaluar. Sin embargo, es difícil, o imposible, cuando la función es complicada, como típicamente sucede en el caso de ejemplos más realistas. Además, la función en turno es a menudo desconocida y definida sólo por mediciones en puntos discretos. Para ambos cesoí, usted debe tener la habilidad pera obtener valores aproximados para las

Page 281: Chapra12-20

PT8.Z ArNTBCBODNTíBTVWMTnvwnwa W I I

derivadas e integrales mediante técnicas numéricas. Algunas de estas técnicas se analizarán en esta parte del libro.

P T 6 . 2 A N T E C E D E N T E S M A T E M Á T I C O S

En el nivel medio superior o durante su primer año en el nivel superior, se le dará una introducción de cálculo diferencial e integral. Ahí usted aprenderá las técnicas para obtener derivadas exactas o analíticas e integrales.

Cuando diferenciamos una función en forma analítica, generamos una segunda función que se usa para calcular la derivada para diferentes valores de la variable independiente. Se dispone de reglas generales para este propósito. Por ejemplo, en el caso del monomio

y = x"

se aplica la siguiente regla simple (n 0)

dy dx

que es la expresión de la regla más general para

= nxn~l

y = u

donde u = una función de x. Para esta ecuación, la derivada se calcula realizando

dy du — = nu — dx dx

Otras dos fórmulas se aplican a los productos o cocientes de funciones. Por ejemplo, si el producto de dos funciones de x(u y v) se representa comoy = uv, entonces la derivada puede calcularse como

dy dv du dx dx dx

Para la división, y = w/u, la derivada se calcularía como

du dv dy dx dx dx v2

Otras fórmulas útiles se resumen en la tabla PT6.1. Se dispone de fórmulas similares para integración definida, en las cuales se busca

determinar una integral entre límites específicos, como en

/ = f f(x) dx (PT6.6) Ja De acuerdo con el teorema fundamental del cálculo integral, la ecuación (PT6.6) se evalúa como

Page 282: Chapra12-20

6 1 2 DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN

T A B L A P T 6 . 1 Algunas derivadas de uso común.

d d 2

— sen x = eos x — cot x = -esc x dx dx

d d — eos x = -sen x — sec x = sec x tan x dx dx

D , 2 d tan x = sec x — esc x = -esc x cot x

dx dx

d . 1 d , 1 — In x = — — log 0 x = dx x dx x In a

e* = é — a* = a* In a dx dx

í " f(x) dx = F(x)\"a

donde F(x) = integral de f(x); es decir, cualquier función tal que F'(x) = f(x). La nomenclatura del lado derecho es para

F(x)\b

a = F(b)-F(a) (PT6.7)

Un ejemplo de una integral definida es

/•0.8 / = / (0.2 + 25* - 200x 2 + 675x 3 - 900x 4 + 400x 5 ) dx (PT6.8)

Jo

Para este caso, la función es un polinomio simple que se puede integrar de manera analítica al evaluar cada término de acuerdo con la regla

í b xn+\

x" dx n + 1

(PT6.9)

donde n no puede ser igual a — 1. Si se aplica esta regla a cada término en la ecuación (PT6.8) se obtiene

, 200 , , , 400 / = 0.2x + 12.5x 2 x 3 + 168.75x 4 - 180x 5 + — x

0.8 (PT6.10)

la cual se evalúa de acuerdo con la ecuación (PT6.7) como / = 1.6405333. Este valor es igual al área bajo el polinomio original [véase ecuación (PT6.8)] entre x = 0 y 0.8.

La integración anterior depende del conocimiento de la regla expresada con la ecuación (PT6.9). Otras funciones siguen diferentes reglas. Estas "reglas" son sólo ejemplos de antidiferenciación; es decir, encontrar F(x) de tal forma que F'(x) = f(x). En consecuencia, la integración analítica depende del conocimiento anterior a la respuesta. Tal conocimiento se adquiere con entrenamiento y experiencia. Muchas de las reglas se resumen en manuales y tablas de integrales. Enlistamos algunas de las más comunes en la tabla PT6.2. Sin embargo, muchas funciones de importancia práctica ion demasiado

Page 283: Chapra12-20

PT6.3 ORIENTACIÓN 6 1 3

T A B L A P T 6 . 2 Algunas integrales simples que se usan en la parte seis. En esta tabla las letras a y b son constantes y deberían no confundirse con los limites de integración analizados en el texto.

Ju dv = uv- jv du

\u"du = ——+C n * - l

fafax dx = —— + C a > 0, a * 1 1 b i n o

/ — = I n i x l + C x * 0

í sen [ax + b) dx = - - eos [ax + 6) + C 1 a

í eos [ax + b) dx = - sen (ax + b) + C J a

j Inixl ax = x Inixl - x + C

complicadas para ser contenidas en tales tablas. Una razón por la que las técnicas en esta parte del libro son tan valiosas, es porque proporcionan un medio para evaluar relaciones como la ecuación (PT6.8) sin conocimiento de las reglas.

j P T 6 . 3 O R I E N T A C I Ó N

Antes de proceder con los métodos numéricos para integración, podría ser de utilidad alguna orientación adicional. Lo siguiente pretende ser una revisión del material analizado en la parte seis. Además, formulamos algunos objetivos que ayudarán a enfocar su esfuerzo cuando estudie el material.

P T 6 . 3 . 1 Alcance y antecedentes

La figura PT6.10 proporciona una revisión de la parte seis. El capítulo 21 se dedica al más común de los procedimientos para integración numérica (las fórmulas de Newton-Cotes). Esas relaciones se basan en el reemplazo de una función complicada o datos tabulados con un simple polinomio que es fácil de integrar. Tres de las fórmulas de Newlon-C'otcH con un U N O más extendido se analizan con detalle: lu regla trapezoidal, la

Page 284: Chapra12-20

614 DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN

F I G U R A P T 6 . 1 0 Organización esquemática del material en la parte seis: Diferenciación numérica e integración.

regla 1/3 de Simpson, y la regla 3/8 de Simpson. Todas ellas están diseñadas para casos en los que los datos a integrarse están espaciados de manera uniforme. Además, incluimos un análisis de integración numérica de datos espaciados de manera no uniforme. Este tema es muy importante, ya que las aplicaciones en el mundo real tienen que ver con datos espaciados de esta forma.

Page 285: Chapra12-20

FT6.3 ORIENTACIÓN 611

Todo el material anterior se relaciona con la integración cerrada; es decir, cuando los valores de la función en los extremos de los límites de integración son conocidos. Al final del capítulo 21 presentamos fórmulas de integración abierta; es decir, donde los límites de integración se extienden más allá del rango de los datos conocidos. Aunque dichas fórmulas no se usan de manera común para la integración definida, las fórmulas de integración abierta, se presentan aquí debido a que se utilizan mucho en la parte siete para la solución de ecuaciones diferenciales ordinarias.

Las formulaciones vistas en el capítulo 21 pueden emplearse para analizar tanto los datos tabulados como las ecuaciones. El capítulo 22 trata con dos técnicas que están expresamente diseñadas para integrar ecuaciones y funciones: integración de Romberg y cuadratura de Gauss. Se proporciona algoritmos de cómputo para ambos métodos. Además, se analizan los métodos para evaluar integrales impropias.

En el capítulo 23 se presenta información adicional sobre diferenciación numérica como suplemento del material introductorio del capítulo 4. Los temas incluyen fórmulas por diferencias finitas de alta exactitud, extrapolación de Richardson y la diferenciación de datos espaciados de manera no uniforme. Se analiza el efecto de los errores de redondeo para la diferenciación numérica así como para integración. Por último, se concluye el capítulo con una descripción de la aplicación de diferentes paquetes de software y librerías para integración y diferenciación.

El capítulo 24 demuestra cómo se puede aplicar los métodos para la resolución de problemas. Como en las otras partes del libro, las aplicaciones se toman de todos los campos de la ingeniería.

Una sección de repaso, o epílogo, se incluye al final de la parte seis. Esta revisión incluye un análisis de los elementos de juicio que son relevantes para la implementación en la práctica de la ingeniería. Además, se resumen fórmulas importantes. Por último, se presenta una breve revisión de los métodos avanzados y referencias alternativas que facilitarán sus estudios adicionales de la diferenciación e integración numérica.

FT6.3.2 Metas y objetivos

Objetivos de estudio. Después de terminar la parte seis, usted será capaz de resolver muchos problemas de integración y diferenciación numérica y apreciará su aplicación para solución de problemas en ingeniería. También deberá esforzarse para manejar las diferentes técnicas y asegurar su confiabilidad. Usted deberá entender que los elementos de juicio involucrados en la selección del "mejor" método (o métodos) para cualquier problema en particular. Además de estos objetivos generales, debería asimilarse y manejarse los conceptos específicos que se enlistan en la tabla PT6.3.

Objetivos computacionales. Se le proporcionó ya el software y algoritmos de cómputo simple para ímplementar las técnicas analizadas en la parte seis. Todo esto tiene utilidad como herramientas de aprendizaje.

Se le proporcionó para su PC el software TOOLKIT de métodos numéricos que es de uso amigable. Emplea la regla trapezoidal para evaluar la integral de funciones continuas o datos tabulados. Las gráficas obtenidas con este software le permitirán visualizar con facilidad su problema y las operaciones matemáticas asociadas, como el área entre la curva y el eje x. El software es fácil de usar para resolver muchos problemas prácticos

Page 286: Chapra12-20

6 1 6 DIFERENCIACIÓN NUMÉRICA E INTEGRACIÓN

T A B L A P T 6 . 3 Objetivos de estudio específicos para la parte seis.

1. Entender la derivación de las fórmulas de Newton-Cotes; saber cómo derivar la regla trapezoidal y cómo acondicionar la derivación de ambas reglas de Simpson; reconocer que las reglas trapezoidal y de Simpson 1/3 y 3/8 representan las áreas de los polinomios de primer, segundo y tercer orden, respectivamente.

2. Conocer las fórmulas y ecuaciones de error para a) la regla trapezoidal, b) la regla trapezoidal de aplicación múltiple, c) regla de Simpson 1/3, d) regla de Simpson 3/8 , y e). regla de Simpson de aplicación múltiple. Ser capaz de escoger la "mejor" de estas fórmulas para cualquier problema de contexto particular.

3. Reconocer que la regla de Simpson 1 / 3 es exacta de cuarto orden, aun cuando está basada en sólo tres puntos; darse cuenta de que todas las fórmulas de Newton-Cotes de segmentos pares y puntos nones tienen exactitud resaltada similar.

4. Saber cómo evaluar la integral y derivada de datos desigualmente espaciados. 5. Reconocer la diferencia entre las fórmulas de integración abierta y cerrada. 6. Entender la base teórica de extrapolación Richardson y cómo se aplica en el algoritmo de

integración Romberg para diferenciación numérica. 7. Entender la diferencia fundamental entre las fórmulas de Newton-Cotes y cuadratura de Gauss. 8. Reconocer por qué la integración de Romberg y la cuadratura de Gauss tienen utilidad cuando se

integran ecuaciones (como opuestas a datos tabulares o discretos). 9. Saber cómo se emplean la fórmulas de integración abierta para evaluar integrales impropias.

10. Entender la aplicación de fórmulas por diferenciación numérica de alta exactitud. 1 1. Saber cómo diferenciar datos desigualmente espaciados. 1 2. Reconocer los diferentes efectos del error de datos en el proceso de integración y diferenciación

numérica.

y se puede también usar para verificar los resultados de cualquiera de los programas de computadora que usted haya desarrollado.

Además, se proporcionan los algoritmos para la mayoría de los otros métodos de la parte cinco. Esta información le permitirá aumentar su librería de software al incluir técnicas más allá de la regla trapezoidal. Por ejemplo, usted podría encontrarlo útil, desde un punto de vista profesional, al tener el software para implementar integración y diferenciación numérica para datos espaciados de manera no uniforme. También podría desarrollar su propio software para las reglas de Simpson, integración de Romberg y cuadratura de Gauss, los cuales son más eficientes y exactos que la regla trapezoidal.

Por último, una de las metas más importantes debería ser manejar varios paquetes de software de uso general que están ampliamente disponibles. En particular, usted debería habituarse a usar estas herramientas para implementar métodos numéricos en la solución de problemas de ingeniería.