25
DISEÑOS FACTORIALES JULIAN HERNANDO PATIÑO RODRIGUEZ ORLEY CAMILO SILVA FREDDY ARMANDO MERCHAN RAMIREZ PRESENTADO A: OLMEDO GONZÁLEZ HERRERA DISEÑO DE EXPERIMENTOS

Estadistica Olmedo

Embed Size (px)

Citation preview

Page 1: Estadistica Olmedo

DISEÑOS FACTORIALES

JULIAN HERNANDO PATIÑO RODRIGUEZ

ORLEY CAMILO SILVA

FREDDY ARMANDO MERCHAN RAMIREZ

PRESENTADO A: OLMEDO GONZÁLEZ HERRERA

DISEÑO DE EXPERIMENTOS

UNIVERSIDAD INDUSTRIAL DE SANTANDER

BUCARAMANGA

Page 2: Estadistica Olmedo

2010

INTRODUCCIÓN

El termino experimento factorial o arreglo factorial hace referencia a la constitución de los tratamientos o combinaciones de tratamientos que se desean comparar. Este término no afecta lo que se conoce como diseño de tratamientos, pues este se refiere a la selección de factores que se desean estudiar los niveles de los factores a ensayar y combinación de estos.

En un experimento factorial se investigan simultáneamente los efectos de cierto número de diferentes factores. La necesidad de estudiar conjuntamente varios factores obedece principalmente a dos razones:

Encontrar un modelo que describa el comportamiento general del fenómeno en estudio. Esto se restringe al rango de variación de los niveles de los factores.

Optimizar la respuesta o variable independiente, es decir, encontrar la combinación de niveles de los factores que optimizan esa respuesta.

Los experimentos factoriales deben ser usados cuando los factores no son independientes.

Algunas de las ventajas de esta clase de experimentos son:

i. Al obtener información sobre varios factores sin aumentar el tamaño del experimento hay economía en el material experimental.

ii. Se amplía la base de la inferencia en relación a un factor ya que se estudia en las diferentes condiciones representadas por los niveles de otros factores.

iii. Se puede obtener una estimación de la interacción de los efectos, o sea, se determina el grado y la forma en la cual se modifica el efecto de un factor en presencia de los niveles de los otros factores.

iv. El conjunto de los tratamientos en el diseño factorial es optimo para estudiar efectos principales e interacciones.

Page 3: Estadistica Olmedo

DISEÑOS ANIDADOS

Por anidación se entiende que los valores de la variable anidada no se combinan con los valores de la variable de anidación. De esta forma, la relación entre las variables no es cruzada, como en los diseños factoriales, sino jerárquica

Una estructura anidada o jerárquica ocurre cuando los datos son obtenidos por muestreo aleatorio en dos o más etapas. Esto implica que, para cada categoría de la variable de agrupación, los sujetos son distintos; es decir, los sujetos no se repiten con los valores de la variable clasificatoria.

En el diseño jerárquico o anidado, hay dos niveles de integración o de dependencia. El primero, las medidas repetidas se hallan anidadas en los sujetos y esto constituye un primer nivel, y en segundo, los sujetos de los centros se hallan anidados en los valores de la variable de tratamiento o métodos.

Modelo Aditivo Lineal Doble:

I = 1,2,…,t (Tratamientos) j = 1,2,…,r (Individuos) k = 1,2,…,k (Muestras)

Donde:μ = Media poblacional.

= efecto de tratamientos.

=efecto de tratamientos.

Page 4: Estadistica Olmedo

= error experimental.

=representa el error aleatorio de sub-muestreo, o el efecto neto de

todos los factores peculiares inespecíficos de una observación sobre un

sujeto.

DETERMINACIÓN DE SUMAS DE CUADRADOS

CONSTRUCCIÓN DEL ANOVA

Page 5: Estadistica Olmedo

Ejercicio:

Durante un estudio de suelos el geólogo de la mina de carbón de Yellowside Park decide estudiar el contenido de trazas radiactivas de los 5 tipos de suelos de perforación. Tomando cuatro muestras de cada tipo de suelo de exploración obtiene la siguiente tabla.

FORMATO DEL ENSAYO

Page 6: Estadistica Olmedo

SOLUCIÓN

Page 7: Estadistica Olmedo

Se acepta la Hipótesis nula, según la cual no existen diferencias significativas entre los terrenos para un nivel de confianza de 0.99, por otra parte:

Luego se rechaza la Hipótesis de la no existencia de diferencias significativas en β para α=0.01 y se comparan los contrastes individuales por nivel:

ANOVA

Page 8: Estadistica Olmedo

Como: existen diferencias significativas en cuanto a los niveles B(2) y C(3) en el contenido de sustancias radioactivas.

DISEÑO FACTORIAL 3K

Un diseño factorial 3K es un arreglo de k factores que tienen tres niveles cada uno. Se hará referencia a los tres niveles de los factores como bajo, medio y alto. Existen varias notaciones para representar estos niveles de los factores; una posibilidad es representar los niveles de los factores con los dígitos 0 (bajo), 1 (medio) y 2 (alto). Cada combinación de tratamientos del diseño 3k se denotara por k dígitos, donde el primer dígito indica el nivel del factor A, el segundo digito indica el nivel del factor B, . . ., y el dígito k-ésimo indica el nivel del factor K.

El diseño más simple del sistema 3k es el diseño 32, el cual tiene dos factores, cada uno con tres niveles obteniendo un total de 9 tratamientos diferentes. Las combinaciones de tratamientos de este diseño.

Page 9: Estadistica Olmedo

El modelo estadístico para el diseño 3 a la 2 se puede escribir considerando el efecto individual de cada factor y de la interacción entre ambos, como se presenta a continuación:

yijk = µ + αi + βj + (αβ)ij + eijk

Con i, j = 0, 1, 2 y k = 1,. . ., r, y donde; αi es el efecto del factor A, βj representa el efecto del factor B y (αβ)ij es la interacción entre los dos factores.

En consecuencia, se contrasta la hipótesis H0 : (αβ)ij = 0 (no hay efecto de interacción de los factores A y B sobre la variable respuesta), al igual que en los diseños 2k , si esta hipótesis no se rechaza entonces se contrastan las hipótesis:

i. H0: αi = 0 (no hay efecto significativo del factor A sobre la variable respuesta).

ii. H0 : βj = 0 (no hay efecto significativo del factor B sobre la variable respuesta).

Estas hipótesis se juzgaran con el ANOVA, para ello las sumas de cuadrados para los tres efectos incluidos en el modelo se calculan mediante los métodos usuales.

La suma de cuadrados total se calcula de la siguiente forma:

Page 10: Estadistica Olmedo

El error está caracterizado por:

Los grados de libertad asociados son:

El ANOVA para el diseño 32 donde se analiza el efecto de los factores sobre la variable respuesta es:

Se requieren como mínimo dos replicas para que existan grados de libertad en el error, el criterio de rechazo es: Se rechaza H0 si F0 > FCR. Es decir que la variable si se ve afectad por la correspondiente fuente de variación.

La partición de la interacción de dos factores AB puede hacerse de dos maneras.

El primer método consiste en subdividir AB en dos cuadrados latinos ortogonales y el segundo método divide esta interacción en cuatro componentes con un solo grado de libertad que corresponden a AL BL , AL BC , AC BL y AC BC , este método tiene sentido siempre y cuando los factores involucrados sean cuantitativos.

Los dos cuadrados latinos ortogonales que se obtienen mediante el primer método, se muestran en la figura, los cuales se obtienen al realizar la descomposición en las componentes A1 B1 y A1 B2 de la interacción.

Page 11: Estadistica Olmedo

Cada una de estas componentes tiene dos grados de libertad. Se usa la terminología de grupos porque si los niveles (0, 1, 2) de A y B se denotan por x1 y x2 , respectivamente, entonces se encuentra que las letras ocupan una celda de acuerdo con el siguiente patrón:

PATRÓN DEL ORDEN

Ejercicio:

Un entomólogo realiza un experimento sobre la energía consumida por las abejas al beber para determinar si la temperatura del ambiente y la viscosidad del líquido afectan el consumo de energía. Se utilizaron tres referencias de temperatura 20, 30 y 400C y la viscosidad del líquido se controla a través del nivel de sacarosa que fue de 20, 40 y 60% del total de sólidos disueltos en el líquido que bebían las abejas, se tomaron los registros encontrándose los siguientes datos:

Page 12: Estadistica Olmedo

Se procede entonces a realizar los cálculos pertinentes:

La suma de cuadrados total es:

Y finalmente la suma de cuadrados del error:

Page 13: Estadistica Olmedo

Los grados de libertad son 2, 2 y 4 respectivamente.

ANOVA

DISEÑOS CONFUNDIDOS

En un factorial 2n a medida que aumenta n, se aumenta el tamaño del bloque, haciendo mas difícil la homogeneidad del material experimental dentro del bloque; una solución a este problema es usar:

i. Confusión

ii. Replicación fraccionada con el fin de disminuir costos en el experimento.

Ciertas interacciones de poca importancia se pueden sacrificar, de manera que la imprecisión resultante del uso de bloques grandes y heterogéneos se concentre en esas interacciones en vez de afectar el resto de los efectos e interacciones que son de mayor interés para la investigación.

El principio de confusión consiste en formar bloques incompletos de tal modo que los efectos de interés sean ortogonales con bloques y que algunos efectos o interacciones de poco interés queden confundidos con bloques. La idea original de éste análisis fue propuesta por Yates (1935).

Page 14: Estadistica Olmedo

Un efecto o interacción puede estar confundido con bloques en todas las repeticiones, se dice en este caso que hay confusión total, necesariamente hay sacrificio de efectos principales o interacciones (que fueron confundidos con bloques).

Cuando un efecto o interacción se confunde con bloques en algunas repeticiones, se dice en este caso que hay confusión parcial. En ´este caso se tiene información de todo el conjunto de tratamientos en el arreglo factorial.

Las variaciones que se consideran entre bloques se denominan error interno del bloque.

Nota. Se llama repetición del experimento a un conjunto de bloques en el cual están todos los tratamientos una sola vez.

Como en los experimentos factoriales 2k no es posible estimar efectos cuadráticos, los efectos lineales son de hecho los factores principales, el término dentro de las llaves contendría las interacciones de dos factores, etc. Es evidente que se han de considerar más importantes los efectos principales de los factores que las interacciones de primer orden, estas últimas más importantes que las de segundo orden, etc.

Como se confunden los diseños por bloques:

Page 15: Estadistica Olmedo

Así se genera la matriz de experimentación:

Page 16: Estadistica Olmedo

Para diseños de tipo 23, y 4 réplicas la confusión se basa en la siguiente tabla del ANOVA:

Page 17: Estadistica Olmedo

Ejercicio: Se desea estudiar los efectos de los factores: Temperatura, Presión, Concentración de Soluto y Grado de Agitación, sobre el rendimiento de un proceso químico, el experimentador dispone de una pequeña muestra por ello no puede replicar el experimento. Basándose en los datos de la tabla de conclusiones.

SOLUCIÓN

Confundir el diseño en dos bloques, con el orden de interacción ABCD más alto con un contraste L= x1+x2+x3+x4.

Formación de los Bloques:

Page 18: Estadistica Olmedo

Establecimiento del Efecto Bloque:

Se modelan las diferentes combinaciones:

Se calcula el efecto:

Suma de Cuadrados de Bloque:

Page 19: Estadistica Olmedo

CONSTRUCCIÓN DEL ANOVA

Page 20: Estadistica Olmedo

PARCELAS DIVIDIDAS

Alternativamente, algunas veces encontramos que la aleatorización completa no es factible porque es más difícil cambiar los niveles de algunos factores, por lo que los factores difíciles van a las parcelas grandes, mientras que los fáciles van a las pequeñas.

Las suposiciones de los modelos de parcelas divididas son las usuales, en el sentido de que los términos de error para cada uno de los tamaños de unidad experimental se distribuyen independientemente como normales con media cero y una varianza propia.

Modelo Aditivo Lineal

I = 1,2,…,a j = 1,2,…,b k = 1,2,…,r

Donde:

= Valor en el k bloque en la parcela i y la subparcela j.

= Valor constante similar a la media de la población.

= efecto del i-ésimo nivel del factor “A”.

= Error experimental de parcelas grandes.

= Efecto del j - ésimo nivel del factor “B”

= Efecto de la interacción del i- ésimo nivel del factor A con el

bloque j-esimo nivel del

factor B.

= Error experimental de sub parcelas.

Hipótesis

Page 21: Estadistica Olmedo

Para un diseño completamente al azar:

DISEÑO DEL ANOVA PARA PARCELAS DIVIDIDA BLOQUE COMPLETAMENTE AL AZAR

Bloques:

Page 22: Estadistica Olmedo

Parcelas Grandes A:

= Error a:

Ejercicio:

Considere el siguiente caso factor A dos niveles, factor B tres niveles, 4 réplicas.

SOLUCIÓN

Page 23: Estadistica Olmedo

BIBLIOGRAFIA

Design of Experiments: Statistical Principles of Research Design and Analysis, Kuehl, R. O Thomson. 1999

Statistics Principles and Methods. Johnson, Richard. Bhattacharyya, Gouri

University of Wisconsin of Madison, John Wiley & Sons, 1998

Nonparametric Statistics with Applications to Science and Engineering. Kvam, Paul H. Vidakovic, Brani, John Wiley & Sons, 2007

All of Nonparametric Statistics, Wasserman, Larry. Springer. 2006

Page 24: Estadistica Olmedo

Design and Analysis of Experiments. Montgomery, Douglas C, John Wiley & Sons, 1997.