36
Regresión Exponencial mediante el Método de los Mínimos Cuadrados Enviado por Mario Orlando Suárez Ibues Regresión exponencial mediante el principio de los mínimos cuadrado Regresión exponencial mediante el principio de los mínimos cuadrados Fue Francis Galton (1822-1911 !uien utili"ó por primera #e" el t$r indicar !ue% aun!ue influida por la estatura de sus padres% la esta regresa)a a la media general. *a regresión examina la relación entre dos #aria)les% pero restring o)'eto de estudiar las #ariaciones de una #aria)le cuando la otra p otras pala)ras% la regresión es un m$todo !ue se emplea para predec de una #aria)le en función de #alores dados a la otra #aria)le. +n todos los casos de regresión existe una dependencia funcional en caso de dos #aria)les% siendo una de ellas (, #aria)le independien dependiente% se &a)la de regresión de so)re ,/ 0or e'emplo% los utili"an la regresión de la altura de los r)oles so)re su di metro midiendo el di metro (#aria)le independiente reempla"ando su #al definida seg n la clase de r)ol se o)tiene la altura% aun sin n aprecian la altura utili"ando gr ficas de la función de dependencia di metro. 4uando la cur#a de regresión de so)re x es exponencial% es decir considerada% la media de la distri)ución est dada por la siguiente

Regresión Exponencial mediante el Método de los Mínimos Cuadrados

Embed Size (px)

DESCRIPTION

La regresión examina la relación entre dos variables, pero restringiendo una de ellas con el objeto de estudiar las variaciones de una variable cuando la otra permanece constante.

Citation preview

Principio del formularioFinal del formularioRegresin Exponencial mediante el Mtodo de los Mnimos CuadradosEnviado por Mario Orlando Surez Ibujes

Regresin exponencial mediante el principio de los mnimos cuadrados - Monografias.com Regresin exponencial mediante el principio de los mnimos cuadradosFue Francis Galton (1822-1911) quien utiliz por primera vez el trmino regresin para indicar que, aunque influida por la estatura de sus padres, la estatura de los hijos "regresaba" a la media general.La regresin examina la relacin entre dos variables, pero restringiendo una de ellas con el objeto de estudiar las variaciones de una variable cuando la otra permanece constante. En otras palabras, la regresin es un mtodo que se emplea para predecir el valor de una variable en funcin de valores dados a la otra variable.En todos los casos de regresin existe una dependencia funcional entre las variables. En el caso de dos variables, siendo una de ellas (X) variable independiente y la otra (Y) la dependiente, se habla de regresin de Y sobre X; Por ejemplo, los ingenieros forestales utilizan la regresin de la altura de los rboles sobre su dimetro, lo cual significa que midiendo el dimetro (variable independiente) y reemplazando su valor en una relacin definida segn la clase de rbol se obtiene la altura, y aun sin necesidad de clculos aprecian la altura utilizando grficas de la funcin de dependencia, altura = funcin del dimetro.Cuando la curva de regresin de y sobre x es exponencial, es decir para cualquier x considerada, la media de la distribucin est dada por la siguiente ecuacin predictora:

Ejemplo ilustrativo: Las cifras siguientes son datos sobre el porcentaje de llantas radiales producidas por cierto fabricante que an pueden usarse despus de recorrer cierto nmero de millas:Miles de Millas recorridas (X)1251525303540

Porcentaje til (Y)9995855530242015

1) Elaborar el diagrama de dispersin.2) Ajustar una curva exponencial aplicando el mtodo de mnimos cuadrados.3) Calcular la ecuacin predictora.4) Graficar la ecuacin predictora.5) Estimar qu porcentaje de las llantas radiales del fabricante durarn 50000 millas.Solucin:1) Elaborando el diagrama de dispersin empleando Excel se obtiene la siguiente figura:

Empleando el programa Graph se obtiene la siguiente figura:

2) Se llena la siguiente tabla:

Resolviendo empleando Excel se muestra en la siguiente figura:

Reemplazando valores en el sistema se obtiene:

Resolviendo empleando Excel se muestra en la siguiente figura:

3) Reemplazando en la ecuacin predictora se obtiene:

4) Graficando la ecuacin predictora empleando Excel se obtiene la siguiente figura:

En Graph se obtiene la siguiente figura:

5) La estimacin del porcentaje de llantas radiales que durarn 50000 millas se obtiene reemplazando en la ecuacin predictora el valor de X = 50

Entonces el porcentaje sera de 9,106%

1. Recta de mejor ajuste (Recta de regresin)Empezamos intentando construir una funcin lineal de demanda. Suponga que su investigacin de mercado muestra las siguientes estadsticas de venta para casas de varios precios durante el ao pasado: Precio (Miles de dlares)160180200220240260280

Ventas de nueva casas este ao1261038275824020

Queremos utilizar estos datos para construir una funcin de demanda para el mercado de los bienes races. (Recuerde que una funcin de demanda especifica la demanda, y, medida aqu por ventas anual, como una funcin del precio, x.) Aqu est una traza de y contra x:

Los datos sugiera una recta, ms o menos, y entonces una relacin lineal entre y y x. Aqu son varias rectas que se acercan a los puntos:

P Cul recta ajusta los puntos lo ms estrechamente que posible? R Nos gustara que las ventas que pronosticara la recta (los valores pronosticados ) estuvieran tan cerca como fuera posible de las ventas reales (los valores observados). Las diferencias entre los valores esperados y los valores pronosticados, que son los errores residuales, son las distancias verticales que se marcan in la figura ms abajo. Error residual = Valor observado - Valor pronosticado

P Entonces como podemos hacerlo? R Sumamos primero todos los cuadrados de los errores residuales para obtener un solo error que se llama el suma de los errores al cuadrado (SSE -- siglas en ingls de "Sum of Squares Error") y escogemos la recta que se da el ms pequeo valor de SSE. Esta recta se llama la recta de mejor ajuste, recta de regresin, o recta de mnimos cuadrados asociada a los datos. Ejemplo 1: Calculando SSE para una recta dadaSupngase que nos gustara calcular SSE para una recta especifica, como y=x+300 como mostrada ms abajo:

Tenemos la siguiente tabla de valores: Principio del formulariox y Observadoy y Pronosticadoy=x+300 Error residualyy

160 126140-14

180103120-17

20082100-18

22075

24082

26040

28020

Final del formulario

Principio del formulario

Final del formularioEntonces, para la recta y=x+300 SSE=Suma de los valores de errores residuales

=- 14 - 17 - 18 - 5 + 22 + 0 + 0

=-32

P Muy bien. Ahora sabemos como se calcula el valor de SSE para una recta ya dada. Como hallamos la recta de mejor ajuste; es decir, la recta para que SSE es lo menor? R Presentaremos aqu la formula que la determina. Justificarla necesita clculo; puede consultar el capitulo de funciones de varias variables en Clculo Aplicado para una explicacin detallada. Recta de regresin (o mejor ajuste) La recta que se ajusta mejor a los n puntos (x1y1)(x2y2)(xnyn) tiene la forma y=mx+bdonde Pendiente=m=n(x2)x2nxyxy

Interseccin=b=nymxAqu, significa "la suma de." As, xy= suma del productos =x1y1+x2y2++xnynx= suma del valores de x=x1+x2++xny= suma del valores de y=y1+y2++ynx2= suma del valores de x2=x21+x22++x2n

El uso de las formulas as bastante fcil, como se muestra el siguiente ejemplo.Ejemplo 2: Calculando la recta de regresin a mano Determine la recta de regresin asociada a los siguientes datos: xx1234

yy1.51.62.13.0

Solucin Para aplicar las formulas, es mejor organizar los datos en forma de tabla como sigue: (Cuando ha rellenado los valores de xy y x2 correctamente, pulse "Sumas" para obtener la suma de cada columna.) Principio del formularioxxyyxyxyx2x2

11.5

Final del formulario

21.6

32.1

43.0

x= 10y= 8.2xy= x2=

Principio del formulario

Final del formularioSustituyendo los valores correctos de la tabla ms arriba en las formulas, obtenemos Pendiente=m=n(x2)x2nxyxy=4(30)1024(23)(10)(82)=05Interseccin=b=nymx=482(05)(10)=08Por lo tanto, la recta de regresin es y=05x+08Antes de seguir... Aqu esta una traza de los pontos de dados y la recta de regresin.

Observe que ni siquiera pasa la recta por uno de los puntos, pero es la recta que se ajusta mejor a los puntos.

Regresamos a los datos sobre la demanda para el mercado de los bienes races con la que empezamos este tema. Ejemplo 3: Funcin de demandaObtenga la ecuacin de demanda que se ajusta mejor a los siguientes datos, y sela para pronosticar ventas anuales de casas preciadas a $140,000. Precio (Miles de dlares)160180200220240260280

Ventas de nueva casas este ao1261038275824020

Solucin Aqu esta una tabla como la que usamos ms arriba para organizar las calculaciones: xxyyxyxyx2x2

16012620,16025,600

18010318,54032,400

2008216,40040,000

2207516,50048,400

2408219,68057,600

2604010,40067,600

280205,60078,400

x=1540y=528xy=107280x2=350000

Sustituyendo estos valores en la formula (con n=7), obtenemos Pendiente=m=n(x2)x2nxyxy=7(350000)154027(107280)(1540)(528)07929Interseccin=b=nymx7528(07928571429)(1540)2499Observe que usamos el valor ms exacto que pudimos obtener en la calculadora, m07928571429, en lugar del valor redondeado (07929) en la calculacin de b. Eso ilustra la sigiuente regla general: Al calcular, no redondee los resultados intermedios; en vez de eso, utilice los resultados ms exactos que puede obtener, usando los valores guardados en su computadora o calculadora si es posible. Por lo tanto, la recta de regresin es y=07929x+2499Ahora podemos utilizar esta ecuacin pronosticar las ventas anuales de casa cuyo precio es $140,000: Principio del formularioVentas anuales de casas preciadas a $140,000 redondee al nmero entero ms cercano

Final del formulario Principio del formulario

Final del formularioAntes de seguir... Ms abajo est una traza de la recta de regresin.

P Si mis puntos estn en una recta, est la recta de mejor ajuste? R S. Si los puntos estn en una recta, el valor mnimo posible de SSE es cero, y eso sucede si se usa la recta que pasa por todos los puntos. Una consecuencia de este hecho es que se puede usar la herramienta regresin en su graficadora o la herramienta regresin en este sitio para calcular la ecuacin de la recta que pasa por dos puntos especificados. P Si no todos los untos estn en una recta, cmo puedo saber cunto se acercan a una recta? R Hay un nmero que mide la "bondad de ajuste" de la recta de regresin llamado coeficiente de correlacin. Este nmero, que se representa por r, est entre 1 y 1. Cuanto ms se acerca r a1 o 1, el ajuste es mejor. Si el ajuste es malo, se acerca r a 0. Si el ajusto es exacto, r=1 para una recta con pendiente negativa, o r=1 para una recta de pendiente positiva. La figura ms abajo muestra varios conjuntos de puntos con sus rectas de regresin, y los valores correspondientes de r.

El coefficiente de correlacin se puede calcular con la siguiente formula. Para obtener la se requieren buenos conocimientos de estadstica. Coeficiente de correlacin Coeficiente de correlacin =r=nxyxynx2x2ny2y2

2. Curva exponencial de mejor ajuste (Curva exponencial regresin)P Ahora sabemos como ajustar una recta a un conjunto de datos. Que hay una curva exponencial de la forma y=Arx?R La idea es convertir una curva exponencial a una recta por medio de logaritmos, como sigue: Empiece con la funcin exponencial y=Arxy tome el logaritmo de ambos lados: logy=log(Arx)Las propiedades de logaritmos nos dan entonces logylogy=logA+logrxo=logA+xlogrEsto expresa logy como una funcin lineal de x, con Pendiente =m=logrInterseccin =b=logAPor lo tanto, si calculamos la recta de mejor ajuste usando logy como una funcin de x, entonces la pendiente y la interseccin en y seran dados como ms arriba, y despus podemos obtener los coeficientes r y A por rA=10m=10bPara resumir, Regresin exponencial Para obtener la curva exponencial de mejor ajuste de la forma y=Arx1. Obtenga la recta de regresin usando los datos (xlogy).2. Los coeficientes deseados A y r son entonces rA=10m=10bdonde m y b son la pendiente y interseccin de la recta de regresin.

Ejemplo 4: Ventas de Compaq Ingresos de ventas de computadores Compaq (una marca ahora extinguida) son mostrados en la siguiente tabla, donde t representa aos desde 1990.* Obtenga el modelo exponencial de regresin para los datos. tt = Ao (1990 = 0)0247

RR = Ingreso ($ billn)341125

* Datos son redondeados. Fuente: Informes de compaa/The New York Times, Enero 27, 1998, p. D1.Solucin Pues necesitamos modelar logR como una funcin lineal de t, primero construimos una tabla con x=t y y=logR, y entonces calculamos la recta de regresin, y=mx+b. x(=t)x(=t)0247

y(=logR)y(=logR)0.4771210.6020601.041391.39794

En lugar de hacer la calculacin a mano como hicimos ms arriba, podemos utilizar la herramienta regresin en este sitio para hacerlo automticamente. Simplemente ingrese los valores de x y y y pulse el botn "y=mx+b". (S, la herramienta puede hacer regresin exponencial directamente, pero preferimos que sabe usted como funciona!) La recta de regresin que obtenemos es y=013907x+042765Por lo tanto, el modelo exponencial deseado es R=Art,donde r=10m=1001390713774, y A=1004276526770. Nuestra modelo de ingresos es, por lo tanto, R=26770(13774)t. Antes de seguir... Vaya a la herramienta regresin, ingrese los datos originales (sin tomar logaritmos) y pulse el botn "y=a(bx)". Qu encuentra? Note: Pues hemos tomado logaritmos antes de hacer la regresin lineal, se puede decir que la curva de regresin exponencial no es la curva que minimiza SSE para los datos originales, esta curva minimiza SSE para los datos tranformados --- es decir, para los datos (xlogy). Por lo tanto, la curva de regresin exponencial no es la curva exponencial de mejor ajuste en el sentido "estricto." Vea los libros de texto "Applied Calculus" para un mtodo obtener esta curva.

3. Otras formas de regresinA la herramienta de regresin se puede encontrar tambin curvas de regresin de las siguientes formas: y=ax2+bx+cy=ax3+bx2+cx+dy=axb(Regresin cuadrtica)( Regresin cbica)(Regresin potencia)En la calculadora TI-83/84, se puede encontrar todos estos y tambin los siguientes:y=ax4+bx3+cx2+dx+ey=asin(bx+c)(Regresin curtica)(Regresin seno)

Interpolacin lineal

La interpolacin lineal parte de dos puntos y pretende establecer la lnea recta que pasa por ambos puntos. De esta forma podremos determinar los puntos intermedios entre ambos puntos como los puntos que pertenecen a esa recta.

La ecuacin de la recta es:y=a+bx

siendo y la variable dependiente. Se representa en el eje de ordenadas, en vertical x la variable independiente. Se representa en el eje de abcisas, en horizontal a la constante de la recta. Es el punto de corte con el eje y b la pendiente de la rectaNo es lo mismo Interpolar que calcular la recta de regresin o lnea de tendencia. Cuando disponemos de una nube de puntos y efectuamos un ajuste por el mtodo de los mnimos cuadrados no todos los puntos caen en la recta de regresin, salvo que estemos en un caso de correlacin perfecta, donde R2 es igual a 1.

Si nicamente disponemos de dos puntos (dos parejas de datos (x,y)) podemos calcular la recta de regresin y habremos obtenido una recta que pasa exactamente por esos dos puntos. Esa recta es la misma que hubiramos obtenido si buscamos la recta de interpolacin. Por tanto, en el caso de una recta, es lo mismo interpolar que ajustar por mnimos cuadrados cuando nicamente disponemos de dos puntos. La recta pasa justo por esos dos puntos y la correlacin es perfecta, siendoR2igual a 1.

Esto lo podemos ver en la Hoja1 de nuestro fichero.

Hemos representado la recta utilizando los grficos de tipo dispersin con lneas suavizadas y marcadores.

Sobre la recta obtenida hemos aadido una lnea de tendencia.

La ventana que se abre nos permite aadir diferente lneas de tendencia: Exponencial Lineal Logartmica Polinmica Potencial Media mvil

Elegiremos, para este caso, la lineal y al final de la ventana marcaremos las opciones: Presentar ecuacin en el grfico Presentar el valor R cuadrado en el grfico

Observamos queR2es igual a 1 y que la ecuacin de la recta es:

y=0,5x+1

Al tratarse nicamente de dos puntos en la nube de datos la recta pasa exactamente por ellos y el ajuste es perfecto (R2=1).

La ecuacin de la recta se puede obtener con la siguientes funciones estadsticas. a es la constante =INTERSECCION.EJE(conocido_y;conocido_x) b es la pendiente =PENDIENTE(conocido_y;conocido_x)

Aunque estamos hablando de interpolacin se ha de considerar que no estamos aplicando los clsicos mtodos de interpolacin. Lo que hacemos es efectuar un ajuste por el mtodo de los mnimos cuadrados a una nube de datos que nicamente tiene dos puntos, por lo que necesariamente la recta de regresin que obtenemos pasa por esos dos puntos. Siendo la correlacin perfecta podemos inferir que la recta de regresin coincide con la recta que obtendramos mediante los mtodos de interpolacin lineal.

Interpolacin Parablica

Una parbola es un polinomio de grado 2, cuya ecuacin es:y=a+bx+cx2En la Hoja2 de nuestro fichero podemos ver un caso en el que nos dan 3 puntos. Nuestra nube de puntos es pequea y lo que pretendemos es encontrar la parbola que pasa justo por esos tres puntos. Si lo conseguimos habremos obtenido una interpolacin parablica.

Pulsando con el botn derecho del ratn sobre el grfico (justo sobre la curva) obtenemos el men contextual y elegimos Agregar lnea de tendencia.

Tambin marcamos abajo las opciones: Presentar ecuacin en el grfico Presentar el valor R cuadrado en el grfico

As veremos la ecuacin de la parbola:

y tambin veremos el coeficiente de determinacin que esR2=1, lo cual indica que estamos en un caso de correlacin perfecta.

Observar que aunque aumentemos el grado del polinomio (lo que aqu Excel llama 'Ordenacin') no por ello mejora el valor deR2ya que lo mximo que puede valer es 1.

La sorpresa es que al trazar Excel la parbola (lnea negra) no coincide con la curva (lnea azul), y ambas curvas pasan por los tres puntos. La respuesta es que existen muchas formas de interpolar y por lo que vemos Excel en la curva azul ha elegido otro mtodo muy diferente del que nosotros estamos buscando. Nosotros queramos una parbola y usando este sistema hemos obtenido la parbola, que es un polinomio de grado 2.

Si aumentamos el grado del polinomio en la ventana de las opciones de la lnea de tendencia no cambia la curva ajustada y no mejoraR2ya que al llegar a 1 ha llegado al mximo.R2igual a 1 indica que estamos ante un ajuste perfecto por lo que no se gana nada intentando aumentar el grado del polinomio.

Para calcular la ecuacin de la parbola debemos determinar los valores de sus parmetros: a, b y c. Nos reservamos el mtodo para ms adelante, ya que lo aplicaremos para un caso de un polinomio de grado 4 y como es un mtodo matricial es vlido para cualquier grado.

A la vista del grfico podemos observar la ecuacin de la parbola:y=a+bx+cx2en nuestro caso es: y=1+0,5x-2x2

Polinomio grado 3

En la Hoja3 de nuestro fichero pretendemos obtener el polinomio de interpolacin que pasa por 4 parejas de datos.

La curva que obtenemos es la siguiente.

Nuevamente, observamos que pese a estar en el caso de correlacin perfecta (R2=1)nuestro polinomio de grado 3 (color negro) no coincide con la curva del grfico generada por Excel (color azul).

Polinomio grado 4

En la Hoja4 disponemos de 5 parejas de datos, con lo que podemos obtener un polinomio de grado 4.

Aqu tambinR2=1 ya que el polinomio pasa por todos los puntos.

Interpolacin: determinacin de la curva

En la Hoja5 vamos a estudiar un caso real. Nos proporcionan datos para construir dos curvas.

Por cada curva son cinco parejas de datos, por lo que el polinomio al que queremos llegar es de grado 4. Siempre el grado del polinomio es uno menos que el nmero de parejas de datos. Esto se debe a que para determinar un polinomio de grado 4 necesitamos determinar 5 parmetros:

y=a+bx+cx2+dx3+ex4

Los cinco parmetros a determinar son: a, b, c, d, e.

En lugar de usar esta terminologa vamos a denotar a los parmetros as: a0,a1,a2,a3,a4,a5.

Por tanto el polinomio de grado 4 ser este:y=a0+a1x+a2x2+a3x3+a4x4

Esta expresin se puede escribir de forma matricial y as es vlida no solo para polinomios de grado 4 sino para polinomios de cualquier grado.

y=AX

Siendo A un vector fila con todos los parmetros del polinomio:a0,a1,a2,a3,a4, ......, an.

Siendo X un vector columna con la variable x elevada a los diferentes grados:x0,x1,x2,x3,x4, ......,xn.

Excel dispone de una funcin matricial que calcula todos los parmetros del vector A. La funcin que emplearemos es la siguiente:

{=+ESTIMACION.LINEAL(y;x^{1;2;3;4})}

Hemos aadido las llaves {} para indicar que es una funcin matricial, pero no debemos escribir nosotros esas llaves, ya que es Excel el que las pone al validar con CONTROL + MAYSCULAS + ENTER.

Creamos una tabla para la Curva 1. En la zona amarilla escribimos nuestra funcin matricial.

=+ESTIMACION.LINEAL(Curva1;X^{1;2;3;4})

Previamente hemos nombrado los siguientes rangos.

Para la Curva 2 construimos una tabla similar.

En las celdas amarillas de esta segunda tabla escribimos la siguiente frmula matricial:

=+ESTIMACION.LINEAL(Curva2;X^{1;2;3;4})

Los valores interpolados son los dados por la siguiente tabla. Establecemos el valor de x (color verde) y luego con SUMAPRODUCTO calculamos el valor y interpolado para cada curva.

Lo que estamos haciendo es una regresin mltiple donde las variables que usamos las hemos transformado para que sean los diferentes valores de la variable x elevados al grado necesario.

La correlacin es perfecta. Se puede comprobar dando valores a x en la celda J20 y viendo que para los valores de la tabla original de datos los valores interpolados que se obtienen son los mismos que los de la tabla de datos.

Prctica

Usando este mtodo puede intentar obtener el polinomio de grado 4 que interpola los datos de la Hoja4. Puede comprobar si lo ha realizado correctamente ya que en el grfico se ve la ecuacin del polinomio a la que ha de llegar.

Obtendr los siguientes valores.

El polinomio obtenido es:

y=1+0,5x-2x2+0,3x3+0,2x4

Para facilitar el clculo hemos dejado la tabla preparada con sus nombres de rango creados.

Falta introducir la frmula matricial ESTIMACION.LINEAL que ha de introducirse en las celdas amarillas del rango E5:I5.

Para introducir una frmula matricial ha de seguir tres pasos.

ESTIMACION.LINEAL es una frmula matricial.Como toda frmula matricial requiere 3 pasos:1. Seleccionar la zona amarilla (rango E5:I5)2. Escibir la frmula matricial=+ESTIMACION.LINEAL(miY;miX^{1;2;3;4})3. No pulse ENTER para validar. Debe pulsar las 3 teclas siguientes: CONTROL + MAYUSCULAS + ENTER