9
EJERCICIOS REGRESION Y CORRELACION LINEAL 1. El número de españoles (en millones) ocupados en la agricultura, para los años que se indican, era: Año 1980 1982 1984 1986 1988 1990 1992 1994 Ocupados 2,1 2,04 1,96 1,74 1,69 1,49 1,25 1,16 a) ¿Explicar su evolución mediante una recta de regresión? b) ¿Cuál es el porcentaje de correlación? El porcentaje de correlación es -0.986 Análisis de regresión: OCUPADOS vs. AÑO La ecuación de regresión es OCUPADOS = 143 - 0.0714 AÑO Predictor Coef SE Coef T P Constante 143.489 9.650 14.87 0.000 AÑO -0.071369 0.004856 -14.70 0.000 S = 0.0629452 R-cuad. = 97.3% R-cuad.(ajustado) = 96.8% Análisis de varianza Fuente GL SC CM F P Regresión 1 0.85571 0.85571 215.97 0.000

Ejercicios Regresion y Correlacion Lineal

Embed Size (px)

Citation preview

Page 1: Ejercicios Regresion y Correlacion Lineal

EJERCICIOS REGRESION Y CORRELACION LINEAL1. El número de españoles (en millones) ocupados en la agricultura, para los años que se indican, era:Año 1980 1982 1984 1986 1988 1990 1992 1994

Ocupados 2,1 2,04 1,96 1,74 1,69 1,49 1,25 1,16

a) ¿Explicar su evolución mediante una recta de regresión?

b) ¿Cuál es el porcentaje de correlación? El porcentaje de correlación es -0.986

Análisis de regresión: OCUPADOS vs. AÑO

La ecuación de regresión esOCUPADOS = 143 - 0.0714 AÑO

Predictor Coef SE Coef T PConstante 143.489 9.650 14.87 0.000AÑO -0.071369 0.004856 -14.70 0.000

S = 0.0629452 R-cuad. = 97.3% R-cuad.(ajustado) = 96.8%

Análisis de varianza

Fuente GL SC CM F PRegresión 1 0.85571 0.85571 215.97 0.000Error residual 6 0.02377 0.00396Total 7 0.87949

Correlaciones: AÑO, OCUPADOS

Correlación de Pearson de AÑO y OCUPADOS = -0.986Valor P = 0.000

Page 2: Ejercicios Regresion y Correlacion Lineal

2. Asocia las rectas de regresión y = –x +16, y = 2x – 12, y = 0,5x + 5 a las nubes de puntos siguientes:

y = –x +16 --- = - 8 + 16 = 8 y = -16 + 16 = 0 Esta recta en la nube cy = 2x – 12 --- = 16 – 12 = 4 y = 32 – 12 = 20 Esta recta en la nube by = 0,5x + 5 --- = 4 + 5 = 9 y 8 + 5 = 13 Esta recta en la nube a

3. Asigna los coeficientes de correlación lineal r = 0,4, r = –0,85 y r = 0,7, a las nubes del problema anterior. 4. a) Calcula la recta de regresión de Y sobre X en la distribución:X 10 7 5 3 0

Y 2 4 6 8 10

b)  ¿Cuál es el valor que correspondería según dicha recta a X = 7? Y=4.304

Análisis de regresión: y vs. x

La ecuación de regresión esy = 10.1 - 0.828 x

Predictor Coef SE Coef T PConstante 10.1379 0.2409 42.09 0.000x -0.82759 0.03982 -20.78 0.000

S = 0.303239 R-cuad. = 99.3% R-cuad.(ajustado) = 99.1%

Análisis de varianza

Fuente GL SC CM F PRegresión 1 39.724 39.724 432.00 0.000Error residual 3 0.276 0.092Total 4 40.000

Page 3: Ejercicios Regresion y Correlacion Lineal

5. El número de bacterias por unidad de volumen, presentes en un cultivo después de un cierto número de horas, viene expresado en la siguiente tabla:

X: Nº de horas 0 1 2 3 4 5

Y: Nº de bacterias 12 19 23 34 56 62

Calcula:a) Las medias y desviaciones típicas de las variables, número de horas y número de bacterias. La media de las horas es de 2.5 y la desviación típica es de 1.7La media de las bacterias es de 34.3 y la desviación típica es de 18.69

b) La covarianza de la variable bidimensional. Es de 31

c) El coeficiente de correlación e interpretación. Es de 0,97

d) La recta de regresión de Y sobre X. La ecuación es Y= 7.762 + 10.63 X

Análisis de regresión: bacterias vs. horas

La ecuación de regresión esbacterias = 7.762 + 10.63 horas

S = 5.48678 R-cuad. = 94.3% R-cuad.(ajustado) = 92.8%

Análisis de varianza

Fuente GL SC CM F PRegresión 1 1976.91 1976.91 65.67 0.001Error 4 120.42 30.10Total 5 2097.33

Page 4: Ejercicios Regresion y Correlacion Lineal

6. La tabla siguiente muestra las notas obtenidas por 8 alumnos en un examen, las horas de estudio dedicadas a su preparación y las horas que vieron la televisión los días previos al examen.Nota (Y) 5 6 7 3 5 8 4 9

Horas de estudio (X1) 7 10 9 4 8 10 5 14

Horas de TV (X2) 7 6 2 11 9 3 9 5a) Representa gráficamente las ecuaciones de regresión correspondientes a nota-estudio y nota-TV Nota Estudio Nota TV

Análisis de regresión: notay vs. estudiox1

La ecuación de regresión esnotay = 0.7961 + 0.6064 estudiox1

S = 0.727679 R-cuad. = 89.0% R-cuad.(ajustado) = 87.2%

Análisis de varianza

Fuente GL SC CM F PRegresión 1 25.6979 25.6979 48.53 0.000Error 6 3.1771 0.5295Total 7 28.8750

Análisis de regresión: notay vs. tvX2

La ecuación de regresión esnotay = 9.460 - 0.5515 tvX2

S = 1.16868 R-cuad. = 71.6% R-cuad.(ajustado) = 66.9%

Análisis de varianza

Fuente GL SC CM F PRegresión 1 20.6801 20.6801 15.14 0.008Error 6 8.1949 1.3658Total 7 28.8750

b) ¿En qué caso la correlación es más fuerte? En el de notas - estudio

Page 5: Ejercicios Regresion y Correlacion Lineal

7. Con los mismos datos, estima para un alumno que sacó un 2 en el examen: Análisis de regresión: tvX2 vs. notay

La ecuación de regresión estvX2 = 14.13 - 1.299 notay

S = 1.79345 R-cuad. = 71.6% R-cuad.(ajustado) = 66.9%

Análisis de varianza

Fuente GL SC CM F PRegresión 1 48.7013 48.7013 15.14 0.008Error 6 19.2987 3.2165Total 7 68.0000

a) Las horas que estudió. 2.689 hrsb) Las horas que vio la TV. 11.532 hrs

Page 6: Ejercicios Regresion y Correlacion Lineal

EJERCICIOS DE ANOVA8. Realizar el Análisis de Varianza (ANOVA) de las siguientes 3 tablas por separado:a) Calcular Fo vs F tablas y realizar el contraste de las Hipótesis.b) Describe una conclusión.

alumnosrespuesta materia

respuesta Modelo

respuesta

Carlos 3.1 Estadística 3.1 Nuevo 3.1

Carlos 7.5 Estadística 7.5 Anterior 7.5

Carlos 2.5Matemáticas 2.5 Nuevo 2.5

Carlos 5.1Matemáticas 5.1 Anterior 5.1

Lucas 3.4 Estadística 3.4 Nuevo 3.4

Lucas 7.8 Estadística 7.8 Anterior 7.8

Lucas 2.7Matemáticas 2.7 Nuevo 2.7

Lucas 5.5Matemáticas 5.5 Anterior 5.5

Manuel 3.3 Estadística 3.3 Nuevo 3.3

Manuel 6.9 Estadística 6.9 Anterior 6.9

Manuel 2.5Matemáticas 2.5 Nuevo 2.5

Manuel 5.4Matemáticas 5.4 Anterior 5.4

Luis 3.6 Estadística 3.6 Nuevo 3.6

Luis 7.8 Estadística 7.8 Anterior 7.8

Luis 2.4Matemáticas 2.4 Nuevo 2.4

Luis 4.8Matemáticas 4.8 Anterior 4.8

Pablo 3.8 Estadística 3.8 Nuevo 3.8

Pablo 8.1 Estadística 8.1 Anterior 8.1

Pablo 2.8Matemáticas 2.8 Nuevo 2.8

Pablo 5.3Matemáticas 5.3 Anterior 5.3

En la tabla de alumnos – respuesta Se acepta F0 = 0.03 porque es menor que F = 3.056 de tablas Se aceptan porque no están siendo afectadas las respuestas por los

factores Si el valor P valua es mayor que el nivel de significancia se acepta H0 en

este caso es mayor por lo cual se acepta pues P valua = 0.998En la tabla de materia – respuesta

Se acepta F0 = 3.82 porque es menor que F = 4.414 de tablas Se aceptan porque no están siendo muy afectadas las respuestas por los

factores solo un poco el de matemáticas Si el valor P valua es mayor que el nivel de significancia se acepta H0 en

este caso es mayor por lo cual se acepta pues P valua = 0.066En la tabla de modelo – respuesta

Se rechaza F0 = 58.84 porque es mayor que F = 4.414 de tablas Se rechaza porque están siendo muy afectadas las respuestas por el factor

“nuevo”

Page 7: Ejercicios Regresion y Correlacion Lineal

Si el valor P valua es mayor que el nivel de significancia se acepta H0 en este caso es mayor por lo cual se rechaza pues P valua = 0.000

ANOVA unidireccional: respuesta vs. alumnos

Fuente GL SC CM F Palumnos 4 0.67 0.17 0.03 0.998Error 15 75.26 5.02Total 19 75.93

S = 2.240 R-cuad. = 0.88% R-cuad.(ajustado) = 0.00%

ICs de 95% individuales para la media basados en Desv.Est. agrupadaNivel N Media Desv.Est. ------+---------+---------+---------+---Carlos 4 4.550 2.259 (---------------*---------------)Lucas 4 4.850 2.299 (---------------*---------------)Luis 4 4.650 2.317 (---------------*---------------)Manuel 4 4.525 2.001 (---------------*---------------)Pablo 4 5.000 2.308 (---------------*---------------) ------+---------+---------+---------+--- 3.0 4.5 6.0 7.5

Desv.Est. agrupada = 2.240

ANOVA unidireccional: respuesta vs. materia Fuente GL SC CM F Pmateria 1 13.28 13.28 3.82 0.066Error 18 62.64 3.48Total 19 75.93

S = 1.865 R-cuad. = 17.50% R-cuad.(ajustado) = 12.91%

ICs de 95% individuales para la media basados en Desv.Est. agrupadaNivel N Media Desv.Est. --------+---------+---------+---------+-Estadística 10 5.530 2.231 (---------*---------)Matemáticas 10 3.900 1.408 (----------*---------) --------+---------+---------+---------+- 3.6 4.8 6.0 7.2

Desv.Est. agrupada = 1.865

ANOVA unidireccional: respuesta vs. modelo Fuente GL SC CM F Pmodelo 1 58.140 58.140 58.84 0.000Error 18 17.785 0.988Total 19 75.925

S = 0.9940 R-cuad. = 76.58% R-cuad.(ajustado) = 75.27%

ICs de 95% individuales para la media basados en Desv.Est. agrupadaNivel N Media Desv.Est. +---------+---------+---------+---------Anterior 10 6.4200 1.3139 (----*-----)Nuevo 10 3.0100 0.4999 (----*-----) +---------+---------+---------+--------- 2.4 3.6 4.8 6.0

Page 8: Ejercicios Regresion y Correlacion Lineal

Desv.Est. agrupada = 0.9940