Upload
cristian-serna
View
7
Download
1
Embed Size (px)
DESCRIPTION
Documento con respuestas al taller de regresión lineal propuesto por el docente Omar Tapasco, U Caldas
Citation preview
2015-1
DISEO EXPERIMENTAL
CRISTIAN SERNA Cod. 1711323062 KENNETH FLOREZ Cod. 1711416427
TALLER N1 - REGRESIN LINEAL (Simple y Mltiple)
Profesor: OMAR ALBERTO TAPASCO ALZATE
DESARROLLO
Ejercicio No.1 Relacin entre el periodo de incubacin y la media del tiempo de incubacin
a) Diagrama de dispersin:
b) Modelo de mnimos cuadrados
t incubacin (estimado)= 21.54 + 0.88 periodo incubacin
Interpretacin:
0: Si transcurren cero (0) das desde que se pusieron los huevos (periodo de incubacin), se
esperara que el nmero de minutos dedicados a la incubacin ininterrumpida del nido
(media del tiempo de incubacin) fuese de 21.54 minutos.
1: Por cada minuto dedicado a la incubacin (media del tiempo de incubacin)
incrementado, se espera un incremento del 0.87 % en el periodo de incubacin.
13182328333843
0 5 10 15 20
Tiempo medio de incubacin Vs Periodo de incubacin
y = 0.8781x + 21.535 R = 0.7418
0
20
40
60
0 5 10 15 20 25
Tiempo medio de incubacin Vs Periodo de incubacin
Tiempo medio de incubacin- Y
Lineal (Tiempo medio deincubacin - Y )
c) Intervalos de confianza
El coeficiente para o (21.53) cae dentro del intervalo de confianza. Margen de
error para o {19.13, 23.9}
El coeficiente para 1 (0.878) cae dentro del intervalo de confianza. Margen de
error para 1 {0.66, 1.09}
Intervalos Inferior 95%
Superior 95%
Bo 19.1293144 23.9407358
B1 0.65986891 1.09636993
d) Tabla ANOVA:
ANLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados Fo Valor P
Regresin 1 880.6186851 880.6186851 68.9562024 1.6207E-08
Residuos 24 306.4966996 12.77069581 Total 25 1187.115385
e) Conclusin de las pruebas de Hiptesis
H0 1=0 {El tiempo medio de incubacin no se relaciona con el perodo de incubacin}
Hi 10 {Existe relacin lineal entre el tiempo medio de incubacin y el perodo de
incubacin del ave marina estudiada.}
Con un nivel de confianza del 95% se rechaza la H0 (p = 1.6207*10-08 < 0.05 = ); es decir,
existe una relacin lineal entre el periodo de incubacin y la media del tiempo de
incubacin.
f) Coeficiente de determinacin:
El 74% de la variabilidad total en los datos del tiempo medio de incubacin, es explicado
por el modelo lineal que contempla el perodo de incubacin como variable
independiente. Hay correlacin aceptable (> 0.70) en el modelo.
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0.861286185
Coeficiente de determinacin R^2 0.741813893
R^2 ajustado 0.731056139
Error tpico 3.573611033
g) Grfico de residuales:
Se cumple el supuesto de homocedasticidad. El grfico de residuales sigue una
distribucin normal (no sigue ningn patrn).
h) Grfico de probabilidad normal:
El comportamiento de la grfica muestra una tendencia de relacin lineal entre las
variables periodo de incubacin (nmero de das desde que se pusieron los huevos) y la
media del tiempo de incubacin (nmero de minutos dedicados ininterrumpidamente al a
incubacin del nido); indicando que una variable influye fuertemente en la otra.
i) Conclusiones generales del anlisis:
El modelo lineal explica la correlacin entre las variables: periodo de incubacin y
la media del tiempo de incubacin de manera satisfactoria.
El tiempo de incubacin estimado, arrojado por el modelo, se relaciona con el
tiempo de incubacin observado; lo que nos dice que el pronstico del modelo se
acerca a la realidad.
El modelo que mejor explica la relacin es el polinmico (R = 0.755)
-20
0
20
0 5 10 15 20 25Re
sid
uo
s
Periodo de Incubacin - X
Periodo de Incubacin - X Grfico de los residuales
0
20
40
60
0 20 40 60 80 100
Tie
mp
o m
ed
io d
e
incu
bac
in
Muestra percentil
Grfico de probabilidad normal
j) Otros modelos:
y = 21.891e0.0299x R = 0.7189
15
25
35
45
0 5 10 15 20 25
Tiempo medio incubacin
Tiempo medioincubacin
Exponencial (Tiempomedio incubacin )
y = 4.9182ln(x) + 20.749 R = 0.6547
15
25
35
45
0 5 10 15 20 25
Tiempo medio incubacin
Tiempo medioincubacin
Logartmica (Tiempomedio incubacin )
y = 21.055x0.1746 R = 0.6887
15
25
35
45
0 5 10 15 20 25
Tiempo medio incubacin
Tiempo medioincubacin
Potencial (Tiempomedio incubacin )
y = -0.02x2 + 1.3024x + 20.232 R = 0.755
15
25
35
45
0 5 10 15 20 25
Tiempo medio incubacin
Tiempo medioincubacin
Polinmica (Tiempomedio incubacin )
Ejercicio No.2 Saponificacin del acetato de etilo por el HCL.
Ecuacin de la reaccin:
= 0
Modelo de linealizacin:
Modelo exponencial: = 0
= 3.40380 0.0051
Dnde:
0: 3.4038 => ( + )
: -0.0051 => 0
a) La constante de velocidad de esta reaccin (k) es -0.0051
Los intervalos de confianza estn determinados as:
Variables Inferior 95% Superior 95%
0 = 3.40375289 3.31756416 3.48994162
1 = -0.00512214 -0.00606676 -0.00417752
Lo que nos dice que los coeficientes de relacin caen dentro del rango de confianza
estipulado
b) Conclusin:
Coeficiente de determinacin: R^2 (0.96704103).
El 96.70% de la variabilidad total de los datos de concentracin es explicado por el modelo
lineal, que contempla la cantidad de tiempo como variable explicativa.
Coeficiente de relacin: R (0.98338245)
Tiene un alto nivel de correlacin inversa, ya que se observa en la grfica un patrn
inverso (r-1); patrn inversamente proporcional.
y = -0.0051x + 3.4038 R = 0.967
2
2.5
3
3.5
0 50 100 150 200
CONCENTRACIN
CONCENTRACIN
Lineal (CONCENTRACIN)
c) La pendiente obtenida 1, puede interpretarse como el cambio en la medida de Y para un
cambio unitario en X. En trminos del ejercicio, para un 1= -0.00512214 sera el valor del
incremento unitario para cada valor de X, que se vera reflejado en Y
En el planteamiento de las hiptesis encontramos lo siguiente:
H0: 1=0 {Se rechaza la hiptesis nula}
Hi: 10 {Se acepta la hiptesis alterna}
Interpretacin: Con un nivel de confianza del 95% se rechaza la H0 (1.133*10-05 < =0.05) y
se acepta la (Hi); quiere decir que hay una relacin lineal inversamente proporcional entre
la concentracin C(mmol)/Lt y el tiempo t(min) como variable independiente
Ejercicio No.3 Seguimiento a pacientes de hipertensin.
El anlisis del ejercicio para verificar la incidencia de las variables X1,, X4 en Y, est basado
en las pruebas de hiptesis y en la determinada probabilidad de cada variable X en la
tabla ANOVA.
Prueba de hiptesis
H0: 1 = 2 = 3 = 4 = 0 {Ninguna de las variables (Xj) influye en Y}
Hi: j 0 {Al menos una de las variables incide en Y}
Tabla ANOVA
ANLISIS DE VARIANZA
Grados de
libertad Suma de
cuadrados Promedio de los
cuadrados Fo Valor P
Regresin 4 518.5478499 129.6369625 46.910822 2.632E-08
Residuos 15 41.45215013 2.763476676 Total 19 560
Conclusin: Con un nivel de confianza del 95% se rechaza la H0 (p = 2.632*10-08< 0.05 = );
es decir, existe una relacin de al menos una variable Xj frente a Y.
Procedemos a exponer cual variable Xj influye en Y:
Coeficientes Error tpico Estadstico t Probabilidad
Intercepcin 0.789919593 8.716042145 0.090628244 0.92898713
X1 1.121665734 0.133237796 8.418525113 4.5698E-07
X2 0.155779644 0.196072333 0.794500891 0.43929401
X3 0.103253275 0.178960896 0.576959983 0.57252443
X4 0.011361315 0.013522209 0.840196706 0.41399037
La variable con mayor coeficiente de probabilidad (Valor P) en primera instancia es la
variable X3, puesto que esta es mayor a Alpha (0.57252443 > = 0.05); por lo tanto se
elimina de las variables a tener en cuenta y se hace un nuevo anlisis.
Coeficientes Error tpico Estadstico t Probabilidad
Intercepcin 2.31887041 8.12847475 0.28527743 0.77909147
X1 1.177987 0.08877113 13.2699342 4.7284E-10
X2 0.18146988 0.18692632 0.97080968 0.34609133
X4 0.01603502 0.01059919 1.51285325 0.1498176
Nuevamente encontramos que la variable X2 es mayor a Alpha (0.34609133 > = 0.05);
por lo tanto se elimina de las variables a tener en cuenta y se hace un nuevo anlisis.
Coeficientes Error tpico Estadstico t Probabilidad
Intercepcin 1.71022723 8.09053664 0.21138613 0.83509934
X1 1.19522437 0.08683 13.7651086 1.2005E-10
X4 0.01923779 0.01005563 1.91313628 0.07272597
Nuevamente encontramos que la variable X2 es mayor a Alpha (0.07272597 > = 0.05);
por lo tanto se elimina de las variables a tener en cuenta y se hace un nuevo anlisis.
NOTA: Si se trabajara a un nivel de confianza menor, como un 90% ( = 0.1) podran
aceptarse estas dos variables como incidencia directa en Y
Coeficientes Error tpico Estadstico t Probabilidad
Intercepcin 2.20530533 8.66333119 0.25455628 0.80195129
X1 1.2009313 0.09297008 12.9173953 1.5279E-10
CONCLUSIN:
En vista de que el valor P de solo una variable es menor a alhpa, podemos considerarla
como la nica influyente en Y, lo cual quiere decir que con un nivel de confianza (N.C) del
95% la hiptesis alterna (Hi) se acepta.
El valor observado y el estimado tienen una relacin estrecha, lo que nos dice que el
modelo se acerca a la realidad.
y = 0.7516x + 7.4068 R = 0.9026
80
90
100
110
104 109 114 119 124 129
X1
X1
Lineal (X1)