Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
ANALISIS Y DISEÑO DE EXPERIMENTOSProf. Héctor Javier Vázquez
A continuación se dan las bases para estudiar EXPERIMENTOS CON UN FACTOR
FormalizaciónRecordemos que tenemos k tratamientos o niveles diferentes, y n réplicas de un solo factor, y como resultado del experimento hay na observaciones.
N = nkN = Número total de observaciones del experimento.
1 2 ... n Totales Promedios
1
Y11 Y12 ... Y1n
2 Y21 Y22 ... Y2n
: : : ... : : :
k Ya1 Ya2 ... Y2n
Diseño balanceado
Tabla ANOVA para un factor con a niveles
Fuente de Variación Suma de Cuadrados Grados de
libertad Cuadrado Medio Fo
Tratamientos[between groups] k-1
Error[within groups] n-k
Totalo bien
n-1 y es un buen estimador de
Esta guía presenta un ejemplo del diseño y análisis de los experimentos con un solo factor con a niveles [a tratamientos] Se supone que las observaciones se realizan al azar “experimento es completamente aleatorizado”.
n Réplicas
kNiveles
Ejemplo 12-1. En Design and Análisis of Experiments, 4ª edición [John Wiley & Sons], D.C. Montgomery describe un experimento en el que la resistencia a la tensión de una fibra sintética es de interés para el fabricante. Se piensa que la resistencia se relaciona con el porcentaje de algodón de la fibra. Se usan cinco niveles de porcentaje de algodón y se hacen cinco réplicas en orden aleatorio, obteniéndose los siguientes datos como resultado:
Diseño del ExperimentoRéplicas
n = 5FACTOR
% DE ALGODÓN 1 2 3 4 5
Trat
amie
ntos
k =
5
15 7 7 15 11 920 12 17 12 18 1825 14 18 18 19 1930 19 25 22 19 2335 7 10 11 15 11
k = Número de tratamientos o niveles del factor. Estos pueden ser fijos o aleatorios n = Número de réplicas
Notar que no siempre el layout esta orientado de la misma maneraPara resolver el problema en una herramienta de cómputo se usan uno o los dos layouts
Layout1
P15 P20 P25 P30 P357 12 14 19 77 17 18 25 10
15 12 18 22 1111 18 19 19 159 18 19 23 11
Layout 2
Tratamiento Resistencia1 71 71 151 111 92 122 172 122 182 183 143 183 183 19
3 194 194 254 224 194 235 75 105 115 155 11
En este caso el número de réplicas es el mismo para cada tratamiento
Deseamos probar la hipótesis
al meno sel promedio de un Tratamiento es diferenteA un nivel de significancia dado
Otra forma de escribirla es suponiendo que hay un promedio general Cada valor del promedio puede alejarse mucho o poco del promedio general, si se eleja mucho se dice que el efecto es importante sino pues se dice que el efecto es pequeño. Con este razonamiento las hipótesis se pueden expresar de la manera siguiente
al menos un efecto es diferente de ceroA un nivel de significancia dado
Solución en Statgraphics
Los datos se introducen usando los dos LayoutsLayout 1: cada tratamiento corresponde a una columna y se usa el menu para
comparar muestras múltiples.
Layout 2: los valores se ponen en dos columnas una columna codificada con el nivel del tratamiento y la otra con los valores correspondientes para cada tratamiento. Se usa el Menu Analisis de Varianza
.
Los resultados son los mismos.
El Análisis de varianza esANOVA
[Análisis de Varianza]
El Análisis de Varianza nos va a ayudar a comparar los diferentes tratamientos o niveles del factor de nuestro experimento.
Antes de continuar usted puede checar las varianzas
al menos una varianza es diferente
De acuerdo a estos Resultados la Pruebe de Bartlett nos dice que no se debe rechazar la hipótesis de varianzas iguales
Evaluación de la Normalidad
O bien
Directamente
De donde resulta
Normal Probability Plot
-3.8 -1.8 0.2 2.2 4.2 6.2residuos
0.115
2050809599
99.9
cum
ulat
ive
perc
ent
Tal parece que los residuos siguen una distribución Normal.La Prueba de Shapiro Wilks no existe en Statgraphics
Solución en RLeer los datos con el layout 1
> resistencias<-read.table("c:resistencias.txt", header=T)> resistencias P15 P20 P25 P30 P351 7 12 14 19 72 7 17 18 25 103 15 12 18 22 114 11 18 19 19 155 9 18 19 23 11> bartlett.test(resistencias)
Bartlett test of homogeneity of variances
data: resistencias Bartlett's K-squared = 0.9331, df = 4, p-value = 0.9198
> shapiro.test(resistencias$P15)
Shapiro-Wilk normality test
data: resistencias$P15 W = 0.881, p-value = 0.3140
> shapiro.test(resistencias$P20)
Shapiro-Wilk normality test
data: resistencias$P20 W = 0.7538, p-value = 0.03228
> shapiro.test(resistencias$P25)
Shapiro-Wilk normality test
data: resistencias$P25 W = 0.7387, p-value = 0.02332
> shapiro.test(resistencias$P30)
Shapiro-Wilk normality test
data: resistencias$P30 W = 0.902, p-value = 0.4211
Tambien podemos tranformar los datos al Layout 2 vertical con la instrucción
> resistencias.vert<-data.frame(porcentaje=gl(5,5),resistencia=c(resistencias$P15,resistencias$P20,resistencias$P25, resistencias$P30, resistencias$P35))
De donde resulta> resistencias.vert porcentaje resistencia1 1 72 1 73 1 154 1 115 1 96 2 127 2 178 2 129 2 1810 2 18
11 3 1412 3 1813 3 1814 3 1915 3 1916 4 1917 4 2518 4 2219 4 1920 4 2321 5 722 5 1023 5 1124 5 1525 5 11>
> attach(resistencias.vert)
> porcentaje<-factor(porcentaje)
> is.factor(porcentaje)[1] TRUE
> resistencias.aov<-aov(resistencia~porcentaje)
> summary(resistencias.aov)
Df Sum Sq Mean Sq F value Pr(>F) porcentaje 4 475.76 118.94 14.757 9.128e-06 ***Residuals 20 161.20 8.06 ---Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Normalidad en Excel
Tratamiento Resistencia promportrat residuos1 7 9.8 -2.81 7 9.8 -2.81 15 9.8 5.21 11 9.8 1.21 9 9.8 -0.82 12 15.4 -3.42 17 15.4 1.62 12 15.4 -3.42 18 15.4 2.62 18 15.4 2.63 14 17.6 -3.63 18 17.6 0.43 18 17.6 0.43 19 17.6 1.43 19 17.6 1.44 19 21.6 -2.64 25 21.6 3.44 22 21.6 0.44 19 21.6 -2.64 23 21.6 1.45 7 10.8 -3.85 10 10.8 -0.85 11 10.8 0.2
5 15 10.8 4.25 11 10.8 0.2
j residuos (j-0.5)/251 -3.8 0.022 -3.6 0.063 -3.4 0.14 -3.4 0.145 -2.8 0.186 -2.8 0.227 -2.6 0.268 -2.6 0.39 -0.8 0.34
10 -0.8 0.3811 0.2 0.4212 0.2 0.4613 0.4 0.514 0.4 0.5415 0.4 0.5816 1.2 0.6217 1.4 0.6618 1.4 0.719 1.4 0.7420 1.6 0.7821 2.6 0.8222 2.6 0.8623 3.4 0.924 4.2 0.9425 5.2 0.98
(j-0.5)/25
0
0.2
0.4
0.6
0.8
1
1.2
-3.8
-3.4
-2.8
-2.6
-0.8 0.2 0.4 0.4 1.4 1.4 2.6 3.4 5.2
Prueba de Hipótesis sin tablas
al menos un Tratamiento es diferente
Criterio de aceptación o rechazo
Cuando Ho Es decir
o biennivel de significancia
NO SE RECHAZA Los tratamientos son iguales
o biennivel de significancia
SE RECHAZA Existe al menos un nivel que produce un efecto significativo al .
Como , es decir;
14.76 > 2.87 o bien Pvalue < 0.05 Se rechaza Ho
y se dice que, sí existe al menos un nivel que produce un nivel significativo al 0.05
PRUEBA DE HIPOTESIS
Ho SE ACEPTA ?
Solo se concluye que cualquier tratamiento
nos da los mismos resultados
Evaluar la variabilidad de los promedios de cada tratamiento,
especificando exactamente mediante comparaciones y
análisis cuáles medias son las que difieren.
SI NO Al menos un tratamiento es diferente
PRUEBA DE HIPOTESIS
Ho SE ACEPTA ?
Solo se concluye que cualquier tratamiento
nos da los mismos resultados
Evaluar la variabilidad de los promedios de cada tratamiento,
especificando exactamente mediante comparaciones y
análisis cuáles medias son las que difieren.
SI NO Al menos un tratamiento es diferente
Evaluar la variabilidad de los promedios de cada tratamiento
Cuando Ho se rechaza, se dice que, hay diferencias entre las medias de los tratamientos, pero no se especifica exactamente cuáles medias producen un efecto significativo. Existen diferentes Métodos de Comparación en donde estudiamos las medias, la variabilidad y los intervalos de confianza de los tratamientos.
étodo de desviación estándar individual
Se aprecian diferencias importantes
Método de desviación estándar ponderada
El procedimiento es igual al método anterior, pero aquí se usa el MSE de la tabla ANOVA, es decir;
Método de Intervalo de ConfianzaUsando desviación estándar individual
Método de Intervalo de ConfianzaUsando desviación estándar ponderada
Método de Diferencia Mínima Significativa - Fisher
cuando son réplicas iguales
Método HSD – Tukey
en donde
cuando son réplicas iguales
Se obtiene de TABLA I
Por lo tanto, cualquier par de promedios de los tratamientos que difieran en valor absoluto por más de 6.72 implicaría que el par correspondiente de medias poblacionales son significativamente diferentes.
* Estadísticamente denota una diferencia significativa
Comparaciones
posibles por pares
> TukeyHSD(resistencias.aov, ordered = TRUE) Tukey multiple comparisons of means 95% family-wise confidence level factor levels have been ordered
Fit: aov(formula = resistencia ~ porcentaje)
$porcentaje diff lwr upr p adj5-1 1.0 -4.3729583 6.372958 0.97977092-1 5.6 0.2270417 10.972958 0.03850243-1 7.8 2.4270417 13.172958 0.00259484-1 11.8 6.4270417 17.172958 0.00001902-5 4.6 -0.7729583 9.972958 0.11629703-5 6.8 1.4270417 12.172958 0.00906464-5 10.8 5.4270417 16.172958 0.00006243-2 2.2 -3.1729583 7.572958 0.73724384-2 6.2 0.8270417 11.572958 0.01889364-3 4.0 -1.3729583 9.372958 0.2101089
> plot(TukeyHSD(resistencias.aov,ordered=TRUE))