24
© 2001 Alfaomega Grupo Editor 1-1 Capítulo doce Regresión lineal y correlación OBJETIVOS Al termiar este capítulo podrá: UNO Dibujar un diagrama de dispersión. DOS Entender e interpretar los términos variable dependiente y variable independiente. TRES Calcular e interpretar el coeficiente de correlación, el coeficiente de determinación y el error estándar de la estimación. CUATRO Realizar una prueba de hipótesis para determinar si existe una diferencia entre las medias de bloques. © 2001 Alfaomega Grupo Editor

Regrecion lineal simple

Embed Size (px)

Citation preview

Page 1: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

1-1

Capítulo doceRegresión lineal y correlación

OBJETIVOSAl termiar este capítulo podrá:

UNODibujar un diagrama de dispersión.

DOS Entender e interpretar los términos variable dependiente y variable independiente.

TRESCalcular e interpretar el coeficiente de correlación, el coeficiente de determinación y el error estándar de la estimación.

CUATRO

Realizar una prueba de hipótesis para determinar si existe una diferencia

entre las medias de bloques. © 2001 Alfaomega Grupo Editor

Page 2: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

1-1

Capítulo doce continuación

Regresión lineal y correlación

OBJETIVOSAl terminar este capítulo podrá:

CINCO Calcular la recta de regresión de mínimo cuadrados e interpretar la pendiente y las intercepciones.

SEISConstruir e interpretar intervalos de confianza e intervalos de predicción para la variable independiente.

SIETE

Establecer e interpretar una tabla de ANOVA.

© 2001 Alfaomega Grupo Editor

Page 3: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

Análisis de correlación

• Análisis de correlación: se usa un gupo de técnicas estadísticas para medir la fuerza de la relación (correlación) entre dos variables.

• Diagrama de dispersión: gráfica que describe la relación entre las dos variables de interés.

• Variable dependiente: la variable que se pronostica o estima.

• Variable independiente: la variable que proporciona la base para la estimación. Es la variable predictora.

12-3

Page 4: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

Coeficiente de correlación, r

• El coeficiente de correlación (r) es una medida de la intensidad de la relación entre dos variables.· Requiere datos con escala de intervalo o de

razón (variables). · Puede tomar valores entre -1.00 y 1.00.· Valores de -1.00 o 1.00 indican correlación

fuerte y perfecta.· Valores cercanos a 0.0 indican correlación

débil.· Valores negativos indican una relación inversa

y valores positivos indican una relación directa.

12-4

Page 5: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

Correlación negativa perfecta

0 1 2 3 4 5 6 7 8 9 10

10 9 8 7 6 5 4 3 2 1 0

X

Y

12-5

Page 6: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

Correlación positiva perfecta

0 1 2 3 4 5 6 7 8 9 10

10 9 8 7 6 5 4 3 2 1 0

X

Y

12-6

Page 7: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

Correlación cero

0 1 2 3 4 5 6 7 8 9 10

10 9 8 7 6 5 4 3 2 1 0

X

Y

12-7

Page 8: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

Correlación positiva fuerte

0 1 2 3 4 5 6 7 8 9 10

10 9 8 7 6 5 4 3 2 1 0

X

Y

12-8

Page 9: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

Fórmula para r

[ ] ( )( )[ ]2222 ))((

))()((=

YYnXXn

YXXYnr

12-9

Page 10: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

Coeficiente de determinación

• El coeficiente de determinación, r2 - la proporción de la variación total en la variable dependiente Y que está explicada por o se debe a la variación en la variable independiente X. · El coeficiente de determinación es el

cuadrado del coeficiente de correlación, y toma valores de 0 a 1.

12-10

Page 11: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

EJEMPLO 1

• Dan Ireland, presidente de la sociedad de alumnos de la Universidad de Toledo, está preocupado por el costo de los libros. Para tener un panorama del problema elige una muestra de 8 libros de venta en la librería. Decide estudiar la relación entre el número de páginas del libro y el costo. Calcule el coeficiente de correlación.

12-11

Page 12: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

EJEMPLO 1 continuación

Libro Páginas Costo ($)

1 500 28

2 700 25

3 800 33

4 600 24

5 400 23

6 500 27

7 600 21

8 800 31

12-12

Page 13: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

EJEMPLO 1 continuación

• r =.614 (verifique)• Pruebe la hipótesis de que no existe

correlación en la población. Use .02 de nivel de significancia.

• Paso 1: H0 la correlación en la población es cero. H1 la correlación en la población es distinta de cero.

• Paso 2: H0 se rachza si t>3.143 o si t<-3.143, gl = 6, = .02

12-13

Page 14: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

EJEMPLO 1 continuación

• El estadístico de prueba es t = 1.9055, calculado por

con (n - 2) grados de libertad• Paso 4: H0 no se rechaza

tr n

r

2

1 2

12-14

Page 15: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

Análisis de regresión

• Propósito: determinar la ecuación de regresión; se usa para predecir el valor de la variable dependiente (Y) basado en la variable independiente (X).

• Procedimiento: seleccionar una muestra de la población y enumerar los datos por pares para cada observación; dibujar un diagrama de dispersión para visualizar la relación; determinar la ecuación de regresión.

12-15

Page 16: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

Análisis de regresión

• La ecuación de regresión: Y’= a + bX, donde: • Y’ es el valor promedio pronosticado de Y para

cualquier valor de X.• a es la intercepción en Y, o el valor estimado de

Y cuando X = 0• b es la pendiente de la recta, o cambio promedio

en Y’ por cada cambio de una unidad en X• se usa el principio de mínimos cuadrados para

obtener a y b:

bn XY X Y

n X X

aY

nb

X

n

( ) ( )( )

( ) ( )

2 2

12-16

Page 17: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

EJEMPLO 2

• Desarrollar una ecuación de regresión para la información dada en el EJEMPLO 1 que puede usarse para estimar el precio de venta basado en el número de páginas.

• Por el principio de mínimos cuadrados, b = .01714 y a = 16.00175Y’ = 16.00175 + .01714X

12-17

Page 18: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

Error estándar de la estimación

• El error estándar de la estimación mide la dispersión de los valores observados alrededor de la recta de regresión.

• Fórmulas usadas para calcular el error estándar:

SY Y

n

Y a Y b XY

n

Y X

( ' )

( ) ( )

2

2

2

2

12-18

Page 19: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

Suposiciones fudamentales de regresión lineal

• Para cada valor de X, existe un grupo de valores de Y que tienen una distribución normal.

• Las medias de estas distribuciones normales de valores de Y deben estar sobre la recta de regresión.

• Las desviaciones estándar de estas distribuciones normales son iguales.

• Los valores de Y son estadísticamente independientes. Es decir, que en la selección de una muestra, los valores elegidos de Y para un valor particular de X no depende de los valores de Y para otro valor de X.

12-19

Page 20: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

Intervalo de confianza

• El intervalo de confianza para el valor medio de Y para un valor dado de X está definido por:

Y t Sn

X X

XXn

Y X' ( )( )

( )

1 2

22

12-20

Page 21: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

Intervalo de predicción

• El intervalo de predicción para un valor individual de Y para un valor dado de X se define por:

Y t Sn

X X

XXn

Y X' ( )( )

( )

1

1 2

22

12-21

Page 22: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

EJEMPLO 3

• Use la información del EJEMPLO 1:· calcule el error estándar de la estimación:

· desarrolle un intervalo de confianza de 95% para los libros de 650 páginas: [24.03, 30.25]. Verifique

· desarrolle un intervalo de predicción de 95% para un libro de 650 páginas: [18.09, 36.19] Verifique

SY X = 3.471

12-22

Page 23: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

Más sobre el coeficiente de determinación

12-23

2

22

2

)-()'-(-)-(

=

totalvariaciónexplicada no variación- totalvariación

=

YYYYYY

r

Regresión = SSR = (Y’ - Y )2

Variación del error = SSE = (Y’ - Y )2

Variación total = SS total = (Y - Y )2

Page 24: Regrecion lineal simple

© 2001 Alfaomega Grupo Editor

Más sobre el coeficiente de determinación

rSSR

SS total

SSE

SS total

SSSE

nY X

2 1

2

12-24