25
Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Embed Size (px)

Citation preview

Page 1: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Pronósticos, Series de Tiempo y Regresión

Capítulo 4: Regresión Lineal Múltiple

Page 2: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Temas

Modelo de Regresión Lineal Estimaciones de Mínimos Cuadrados y

Estimación Puntual y Predicción Error Cuadrático Medio y Error Estándar Utilidad del Modelo: R2, R2 Ajustada y la

Prueba F Global Prueba de la Significancia de Una Variable

Independiente Intervalos de Confianza Para Valores

Esperados y de Predicción Temas Avanzados

Page 3: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Modelo de Regresión Lineal

Se emplean más de una variable independiente.

relaciona y con x1, x2, ..., xk

modelo:

kkxxxy xxxyk

22110,...,,| 21

Page 4: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Modelo de Regresión Lineal

Valor medio de y cuando los valores de las variables independientes son x1, x2, ..., xk :

parámetros: β0, β1, β2, ..., βk

término de error:

kkxxxy xxxyk

22110,...,,| 21

Page 5: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Modelo de Regresión Lineal

Suposiciones del modelo de regresión lineal:

1. En cualquier combinación dada de valores de x1, x2, ..., xk , la media de la población de los valores

potenciales de = 0

2. Suposición de la varianza constante

3. Suposición de normalidad

4. Suposición de la independencia

Page 6: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Modelo de Regresión Lineal

Interpretación de los parámetros de regresión β0, β1, β2, ..., βk

Los parámetros relacionan la media de la variable dependiente con

las variables independientes en un sentido global.

β0 : ordenada al origen

β1 : cambio en el consumo medio de combustible a la semana que se

asocia con el incremento de un grado en la temperatura promedio

cuando no cambia el índice de enfriamiento.

β2 : cambio en el consumo medio de combustible a la semana que se

asocia con el incremento de una unidad en el índice de enfriamiento

cuando no cambia la temperatura horaria promedio.

Page 7: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Modelo de Regresión Lineal

Interpretación geométrica del modelo de

regresión

región experimental: combinaciones de los

valores observados de x1, x2, ..., xk

plano de medias

Page 8: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Estimaciones de Mínimos Cuadrados y Estimación Puntual y Predicción Estimación puntual del valor medio y de un

valor individual de la variable dependiente y cuando los valores de las variables independientes son x01, x02, ..., x0k .

Se predice = 0 Esta ecuación se llama la ecuación de

predicción de mínimos cuadrados

kk xbxbxbby 00220110ˆ

Page 9: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Error Cuadrático Medio y Error Estándar Una estimación puntual de σ2 es el error

cuadrático medio:

Una estimación puntual de σ es el error estándar:

12

kn

SSEs

1

kn

SSEs

Page 10: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Utilidad del Modelo: R2, R2 Ajustada y la Prueba F Global En el caso del modelo de regresión lineal múltiple,

1. Variación total = Σ(yi-y)2

2. Variación explicada = Σ(yi-y)2

3. Variación inexplicada = Σ(yi-yi)2

4. Variación total = Variación explicada + Variación inexplicada

5. El coeficiente de determinación múltiple es R2 = (variación explicada)/(variación total)

6. El R2 es la proporción de la variación total en los n valores observados de la variable dependiente que explica el modelo de regresión global

7. Coeficiente de correlación múltiple: R = √R2

Page 11: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Utilidad del Modelo: R2, R2 Ajustada y la Prueba F Global R2 Ajustada

donde R2 es el coeficiente de determinación múltiple n es la cantidad de observaciones y k es la cantidad de variables independientes en

el modelo

1

1

122

kn

n

n

kRR

Page 12: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Utilidad del Modelo: R2, R2 Ajustada y la Prueba F Global

H0: β0 = β1 = β2 =... = βk = 0

Ha: por lo menos uno de los β0, β1,

β2, ..., βk ≠ 0

Estadística F global:

1/exp_

/exp_)(mod

knlicadainVariación

klicadaVariacióneloF

Page 13: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Utilidad del Modelo: R2, R2 Ajustada y la Prueba F Global

Se puede rechazar H0 y aceptar Ha en el nivel

de significancia α si se mantiene alguna de las

condiciones siguientes: Estadística F (modelo) > F[α]

valor p < α donde el punto F[α] se basa en k grados de

libertad pra el numerador y n-(k+1) para el denominador.

Page 14: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Prueba de la Significancia de Una Variable Independiente

Defina la estadística de una prueba

y asuma que las suposiciones de regresión se mantienen.

jb

j

s

bt

Page 15: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Prueba de la Significancia de Una Variable Independiente

Hipótesis alternativa

Condición de punto de rechazo

Valor p

Ha : βj ≠ 0 2 (área bajo la curva t a la derecha de |t|)

Ha : βj > 0 área bajo la curva t a la derecha de t

Ha : βj < 0 área bajo la curva t a la izquierda de t

)1(2/|| kntt

1 kntt

1 kntt

Page 16: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Prueba de la Significancia de Una Variable Independiente

Si se cumplen las suposiciones de la

regresión, un intervalo de confianza de

100(1-α)% para el parámetro de

regresión βj es

jbkn

j stb 12/

Page 17: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Intervalos de Confianza Para Valores Esperados y de Predicción Para calcular el valor de distancia en un

modelo de regresión múltiple, se requiere de álgegra de matrices.

(Véase el Apéndice B.)

Page 18: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Intervalos de Confianza Para Valores Esperados y de Predicción Si se cumplen las suposiciones de la

regresión, un intervalo de confianza de 100(1-α)% para el valor medio de y cuando los valores de las variables independientes son x01, x02, ..., x0k es

..ˆ 12/ dvsty kn

Page 19: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Intervalos de Confianza Para Valores Esperados y de Predicción Si se cumplen las suposiciones de la

regresión, un intervalo de predicción 100(1-α)% para un valor individual de y cuando los valores de las variables independientes son x01, x02, ..., x0k es

..1ˆ 12/ dvsty kn

Page 20: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Temas Avanzados

Modelo de Regresión Cuadrática Interacción Uso de Variables Ficticias para Modelar

Variables Independientes Cualitativas Prueba F Parcial: Prueba de la

Significancia de una Parte de un Modelo de Regresión

Page 21: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Modelo de Regresión Cuadrática El modelo de regresión cuadrática que

relaciona y con x es

2210 xxy

Page 22: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Modelo de Regresión Cuadrática

μy|x μy|x μy|x

μy|x μy|x μy|x

x x x

x x x

Page 23: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Interacción

Se introduce un término de interacción

cuando se cree que una variable (xi)

influye en la relación entre otra variable

(xj) independiente y la variable

dependiente, y.

21322110 xxxxy

Page 24: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Uso de Variables Ficticias para Modelar Variables Independientes Cualitativas Cuando se quiere incluir una variabla

cualitativa, se pueden utilizar variables ficticias (variables indicadoras, dummies).

Toman el valor de 1 o 0. En efecto, esta variable influye en el

intercepto.

Page 25: Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple

Uso de Variables Ficticias para Modelar Variables Independientes Cualitativas Ejemplo para comparar tres

ubicaciones:

DM DDxy 32110

DM DDxy 864.6374.2886859.0978.14ˆ