Click here to load reader
Upload
alex-vasquez
View
213
Download
1
Embed Size (px)
Citation preview
MINIMOS CUADRADOS
Ajuste de curvas por mínimos cuadradosCuando se asume que existe un error sustancial en los datos de f(xi), la interpolación polinomial, ya sea de Newton o de Lagrange, es inapropiada debido a que cuando se utiliza para encontrar los valores intermedios la variabilidad de los datos hará que la curva representada a través del polinomio oscilará en forma amplia en el intervalo entre los puntos. En este caso se utiliza la regresión por mínimos cuadrados, técnica cuyo objetivo es derivar una curva que minimice la discrepancia entre los puntos y la curva. Algunas suposiciones estadísticas inherentes en los procedimientos por mínimos cuadrados lineales son:
1. Cada x tiene un valor fijo, no es aleatorio y es conocido sin error.
2. Los valores y son valores aleatorios independientes y todos tienen la misma varianza.
3. Los valores de y para una x dada deben ser normalmente distribuidos.
4. La regresión de y contra x no es la misma que la de x contra y.
Ajuste para una rectaLa aproximación por mínimos cuadrados se presenta cuando se ajusta un conjunto de pares de observaciones: (x1,y1), (x2,y2),…, (xn,yn) a una línea recta. La expresión matemática para ésta última es
0 1y a a x e …(4.13)
Error entre el modelo y las observaciones (residuo)
Pendiente
Intercepto
Para ajustar a la “mejor” línea a través de los datos se minimiza la suma de los cuadrados de los residuos entre la y medida y la y calculada con el modelo lineal
2 2 2, ,mod 0 1
1 1 1( ) ( )
n n n
r i i medida i elo i ii i i
S e y y y a a x
…(4.14)
La ventaja de (4.13) es que se obtiene una línea única para el conjunto de datos.
Para obtener los valores a0 y a1 de (4.13) calculamos
0 10
0 11
2 ( )
2 [( ) ]
ri i
ri i i
S y a a xaS y a a x xa
Igualando con cero y simplificando
0 1
20 1
0
0i i
i i i i
y a a x
y x a x a x
Haciendo 0 0a na y despejando
0 1
20 1
i i
i i i i
na a x y
a x a x x y
…(4.15)
Y al resolver (4.15) en forma simultánea se tiene que
1 22
0 1
i i i i
i i
n x y x ya
n x x
a y a x
…(4.16)
Donde y y x son las medias de y y x, respectivamente.
Ejemplo. Ajusta a una línea recta los valores de x y y de la siguiente tabla:
i xi yi=f(xi)
1 1 0.5
2 2 2.5
3 3 2.0
4 4 4.0
5 5 3.5
6 6 6.0
7 7 5.5
Solución. En la siguiente tabla se tienen algunos cálculos necesarios para obtener la recta por medio de mínimos cuadrados:
i xi yi=f(xi) xi2 xi yi yi
2 (yi-a0-a1xi)2
1 1 0.5 1 0.5 0.25 0.1687
2 2 2.5 4 5 6.25 0.5624
3 3 2.0 9 6 4 0.3473
4 4 4.0 16 16 16 0.3264
5 5 3.5 25 17.5 12.25 0.5897
6 6 6.0 36 36 36 0.7971
7 7 5.5 49 38.5 30.25 0.1994
28 24 140 119.5 105 2.9911
Como se tienen 7 puntos, n=7 y entonces
1
1
28 47
24 3.42867
ni
i
ni
i
xxn
yyn
La pendiente y el intercepto de la recta, respectivamente, son:
1 2
0
(7)(119.5) (28)(24) 164.5 0.8393196(7)(140) (28)
3.4286 (0.8393)(4) 0.07143
a
a
De manera que la recta buscada es
0.07143 0.8393y x e
Cabe destacar que Sr=2.9911 y que esta suma de los cuadrados de los residuos es la mínima. A continuación se presentan los valores de la yi medida, de la yi del modelo y del error en la aproximación:
i xi yi,medida yi,modelo ei
1 1 0.5 0.9108 0.4108
2 2 2.5 1.7506 0.7499
3 3 2.0 2.5893 0.5893
4 4 4.0 3.4286 0.5714
5 5 3.5 4.2679 0.7679
6 6 6.0 5.1072 0.8928
7 7 5.5 5.9465 0.4465
Lo cual puede apreciarse gráficamente:
0 1 2 3 4 5 6 70
1
2
3
4
5
6
7
x
y=f(x
)
y=0.07143+0.8393 x
e3e2
e4
e1
e5e4
e6e7
Cuantificación del error en una ajuste a una recta por mínimos cuadrados:
La ecuación del error estándar del estimado es:
/ 2r
Y XSS
n
Se considera el denominador n-2 debido a que se usan dos datos estimados a0 y a1 para realizar los cálculos, y por lo tanto se tienen n-2 grados de libertad. Esta ecuación cuantifica la dispersión alrededor de la recta de regresión, la cual sigue una distribución normal.
El coeficiente de correlación está dado por:
2 2 2 2
i i i i
i i i i
n x y x yr
n x x n y y
e indica qué tan relacionados están los datos de x y los de y. Conforme r se acerque más a -1 ó 1, los datos estarán más relacionados.
El coeficiente de determinación es r2 y al hacer r2x100, tendremos entonces el porcentaje en que la incertidumbre original ha sido explicada por el modelo lineal.
Ajuste para una parábolaSupongamos que tenemos la siguiente gráfica correspondiente a una serie de datos:
0 1 2 3 4 5 6 7 8 90
0.5
1
1.5
2
2.5
3
3.5
4
4.5
x
y=f(x
)
Es claro que una regresión lineal por mínimos cuadrados no explica adecuadamente el comportamiento de los datos y es preferible una parábola. Una alternativa simple es utilizar manipulaciones matemáticas para transformar las ecuaciones en una forma lineal, utilizar regresión lineal y luego volver al estado original para propósitos predictivos.
Ejemplo. Ajusta los valores de x y y a una parábola.
i xi yi=f(xi)
1 1 0.5
2 2 1.7
3 3 3.4
4 4 5.7
5 5 8.4
Solución. En la siguiente tabla se resumen los datos que resultan de aplicar logaritmo en base 10 tanto a los datos x como a los datos y:
i xi yi=f(xi) log10(xi) log10(yi)
1 1 0.5 0 -0.301
2 2 1.7 0.301 0.230
3 3 3.4 0.477 0.531
4 4 5.7 0.602 0.756
5 5 8.4 0.699 0.924
Las gráficas de los valores de la tabla antes y después de la transformación, respectivamente son las siguientes:
1 2 3 4 5 6 7 8 90
1
2
3
4
5
6
7
8
9
x
y=f(x
)
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
x
y=f(x
)
La recta resultante de aplicar mínimos cuadrados es:
10 10log ( ) 1.75log ( ) 0.300i iy x
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
x
y=f(x
)
log10(yi)=1.75*(xi)-0.300
Para encontrar la parábola que describe el comportamiento de los datos originales, aplicamos a la recta el antilogaritmo (10x) de x:
y=0.5x1.75
1 2 3 4 5 6 7 8 90
1
2
3
4
5
6
7
8
9
x
y=f(x
)
y=0.5*x1.75
Bibliografía Akai Terrence J., Métodos numéricos aplicados a la ingeniería. México, Limusa
Wiley, 2004.
Burden Richard L. & Faires J. Douglas, Análisis numérico. 2ª. ed., México, Grupo Editorial Iberoamérica, 1993.
Chapra Steven C. & Canale Raymond P., Métodos numéricos para ingenieros. 4ª. ed., México, McGraw-Hill, 2003.
Iriarte R. & Balderrama V., Métodos numéricos. México, Facultad de Ingeniería U.N.A.M., Trillas, 199