View
373
Download
11
Embed Size (px)
Citation preview
EJERCICIOS REGRESION Y CORRELACION LINEAL1. El número de españoles (en millones) ocupados en la agricultura, para los años que se indican, era:Año 1980 1982 1984 1986 1988 1990 1992 1994
Ocupados 2,1 2,04 1,96 1,74 1,69 1,49 1,25 1,16
a) ¿Explicar su evolución mediante una recta de regresión?
b) ¿Cuál es el porcentaje de correlación? El porcentaje de correlación es -0.986
Análisis de regresión: OCUPADOS vs. AÑO
La ecuación de regresión esOCUPADOS = 143 - 0.0714 AÑO
Predictor Coef SE Coef T PConstante 143.489 9.650 14.87 0.000AÑO -0.071369 0.004856 -14.70 0.000
S = 0.0629452 R-cuad. = 97.3% R-cuad.(ajustado) = 96.8%
Análisis de varianza
Fuente GL SC CM F PRegresión 1 0.85571 0.85571 215.97 0.000Error residual 6 0.02377 0.00396Total 7 0.87949
Correlaciones: AÑO, OCUPADOS
Correlación de Pearson de AÑO y OCUPADOS = -0.986Valor P = 0.000
2. Asocia las rectas de regresión y = –x +16, y = 2x – 12, y = 0,5x + 5 a las nubes de puntos siguientes:
y = –x +16 --- = - 8 + 16 = 8 y = -16 + 16 = 0 Esta recta en la nube cy = 2x – 12 --- = 16 – 12 = 4 y = 32 – 12 = 20 Esta recta en la nube by = 0,5x + 5 --- = 4 + 5 = 9 y 8 + 5 = 13 Esta recta en la nube a
3. Asigna los coeficientes de correlación lineal r = 0,4, r = –0,85 y r = 0,7, a las nubes del problema anterior. 4. a) Calcula la recta de regresión de Y sobre X en la distribución:X 10 7 5 3 0
Y 2 4 6 8 10
b) ¿Cuál es el valor que correspondería según dicha recta a X = 7? Y=4.304
Análisis de regresión: y vs. x
La ecuación de regresión esy = 10.1 - 0.828 x
Predictor Coef SE Coef T PConstante 10.1379 0.2409 42.09 0.000x -0.82759 0.03982 -20.78 0.000
S = 0.303239 R-cuad. = 99.3% R-cuad.(ajustado) = 99.1%
Análisis de varianza
Fuente GL SC CM F PRegresión 1 39.724 39.724 432.00 0.000Error residual 3 0.276 0.092Total 4 40.000
5. El número de bacterias por unidad de volumen, presentes en un cultivo después de un cierto número de horas, viene expresado en la siguiente tabla:
X: Nº de horas 0 1 2 3 4 5
Y: Nº de bacterias 12 19 23 34 56 62
Calcula:a) Las medias y desviaciones típicas de las variables, número de horas y número de bacterias. La media de las horas es de 2.5 y la desviación típica es de 1.7La media de las bacterias es de 34.3 y la desviación típica es de 18.69
b) La covarianza de la variable bidimensional. Es de 31
c) El coeficiente de correlación e interpretación. Es de 0,97
d) La recta de regresión de Y sobre X. La ecuación es Y= 7.762 + 10.63 X
Análisis de regresión: bacterias vs. horas
La ecuación de regresión esbacterias = 7.762 + 10.63 horas
S = 5.48678 R-cuad. = 94.3% R-cuad.(ajustado) = 92.8%
Análisis de varianza
Fuente GL SC CM F PRegresión 1 1976.91 1976.91 65.67 0.001Error 4 120.42 30.10Total 5 2097.33
6. La tabla siguiente muestra las notas obtenidas por 8 alumnos en un examen, las horas de estudio dedicadas a su preparación y las horas que vieron la televisión los días previos al examen.Nota (Y) 5 6 7 3 5 8 4 9
Horas de estudio (X1) 7 10 9 4 8 10 5 14
Horas de TV (X2) 7 6 2 11 9 3 9 5a) Representa gráficamente las ecuaciones de regresión correspondientes a nota-estudio y nota-TV Nota Estudio Nota TV
Análisis de regresión: notay vs. estudiox1
La ecuación de regresión esnotay = 0.7961 + 0.6064 estudiox1
S = 0.727679 R-cuad. = 89.0% R-cuad.(ajustado) = 87.2%
Análisis de varianza
Fuente GL SC CM F PRegresión 1 25.6979 25.6979 48.53 0.000Error 6 3.1771 0.5295Total 7 28.8750
Análisis de regresión: notay vs. tvX2
La ecuación de regresión esnotay = 9.460 - 0.5515 tvX2
S = 1.16868 R-cuad. = 71.6% R-cuad.(ajustado) = 66.9%
Análisis de varianza
Fuente GL SC CM F PRegresión 1 20.6801 20.6801 15.14 0.008Error 6 8.1949 1.3658Total 7 28.8750
b) ¿En qué caso la correlación es más fuerte? En el de notas - estudio
7. Con los mismos datos, estima para un alumno que sacó un 2 en el examen: Análisis de regresión: tvX2 vs. notay
La ecuación de regresión estvX2 = 14.13 - 1.299 notay
S = 1.79345 R-cuad. = 71.6% R-cuad.(ajustado) = 66.9%
Análisis de varianza
Fuente GL SC CM F PRegresión 1 48.7013 48.7013 15.14 0.008Error 6 19.2987 3.2165Total 7 68.0000
a) Las horas que estudió. 2.689 hrsb) Las horas que vio la TV. 11.532 hrs
EJERCICIOS DE ANOVA8. Realizar el Análisis de Varianza (ANOVA) de las siguientes 3 tablas por separado:a) Calcular Fo vs F tablas y realizar el contraste de las Hipótesis.b) Describe una conclusión.
alumnosrespuesta materia
respuesta Modelo
respuesta
Carlos 3.1 Estadística 3.1 Nuevo 3.1
Carlos 7.5 Estadística 7.5 Anterior 7.5
Carlos 2.5Matemáticas 2.5 Nuevo 2.5
Carlos 5.1Matemáticas 5.1 Anterior 5.1
Lucas 3.4 Estadística 3.4 Nuevo 3.4
Lucas 7.8 Estadística 7.8 Anterior 7.8
Lucas 2.7Matemáticas 2.7 Nuevo 2.7
Lucas 5.5Matemáticas 5.5 Anterior 5.5
Manuel 3.3 Estadística 3.3 Nuevo 3.3
Manuel 6.9 Estadística 6.9 Anterior 6.9
Manuel 2.5Matemáticas 2.5 Nuevo 2.5
Manuel 5.4Matemáticas 5.4 Anterior 5.4
Luis 3.6 Estadística 3.6 Nuevo 3.6
Luis 7.8 Estadística 7.8 Anterior 7.8
Luis 2.4Matemáticas 2.4 Nuevo 2.4
Luis 4.8Matemáticas 4.8 Anterior 4.8
Pablo 3.8 Estadística 3.8 Nuevo 3.8
Pablo 8.1 Estadística 8.1 Anterior 8.1
Pablo 2.8Matemáticas 2.8 Nuevo 2.8
Pablo 5.3Matemáticas 5.3 Anterior 5.3
En la tabla de alumnos – respuesta Se acepta F0 = 0.03 porque es menor que F = 3.056 de tablas Se aceptan porque no están siendo afectadas las respuestas por los
factores Si el valor P valua es mayor que el nivel de significancia se acepta H0 en
este caso es mayor por lo cual se acepta pues P valua = 0.998En la tabla de materia – respuesta
Se acepta F0 = 3.82 porque es menor que F = 4.414 de tablas Se aceptan porque no están siendo muy afectadas las respuestas por los
factores solo un poco el de matemáticas Si el valor P valua es mayor que el nivel de significancia se acepta H0 en
este caso es mayor por lo cual se acepta pues P valua = 0.066En la tabla de modelo – respuesta
Se rechaza F0 = 58.84 porque es mayor que F = 4.414 de tablas Se rechaza porque están siendo muy afectadas las respuestas por el factor
“nuevo”
Si el valor P valua es mayor que el nivel de significancia se acepta H0 en este caso es mayor por lo cual se rechaza pues P valua = 0.000
ANOVA unidireccional: respuesta vs. alumnos
Fuente GL SC CM F Palumnos 4 0.67 0.17 0.03 0.998Error 15 75.26 5.02Total 19 75.93
S = 2.240 R-cuad. = 0.88% R-cuad.(ajustado) = 0.00%
ICs de 95% individuales para la media basados en Desv.Est. agrupadaNivel N Media Desv.Est. ------+---------+---------+---------+---Carlos 4 4.550 2.259 (---------------*---------------)Lucas 4 4.850 2.299 (---------------*---------------)Luis 4 4.650 2.317 (---------------*---------------)Manuel 4 4.525 2.001 (---------------*---------------)Pablo 4 5.000 2.308 (---------------*---------------) ------+---------+---------+---------+--- 3.0 4.5 6.0 7.5
Desv.Est. agrupada = 2.240
ANOVA unidireccional: respuesta vs. materia Fuente GL SC CM F Pmateria 1 13.28 13.28 3.82 0.066Error 18 62.64 3.48Total 19 75.93
S = 1.865 R-cuad. = 17.50% R-cuad.(ajustado) = 12.91%
ICs de 95% individuales para la media basados en Desv.Est. agrupadaNivel N Media Desv.Est. --------+---------+---------+---------+-Estadística 10 5.530 2.231 (---------*---------)Matemáticas 10 3.900 1.408 (----------*---------) --------+---------+---------+---------+- 3.6 4.8 6.0 7.2
Desv.Est. agrupada = 1.865
ANOVA unidireccional: respuesta vs. modelo Fuente GL SC CM F Pmodelo 1 58.140 58.140 58.84 0.000Error 18 17.785 0.988Total 19 75.925
S = 0.9940 R-cuad. = 76.58% R-cuad.(ajustado) = 75.27%
ICs de 95% individuales para la media basados en Desv.Est. agrupadaNivel N Media Desv.Est. +---------+---------+---------+---------Anterior 10 6.4200 1.3139 (----*-----)Nuevo 10 3.0100 0.4999 (----*-----) +---------+---------+---------+--------- 2.4 3.6 4.8 6.0
Desv.Est. agrupada = 0.9940