17

Click here to load reader

trabajo

Embed Size (px)

Citation preview

Page 1: trabajo

Republica Bolivariana de Venezuela

Universidad de los Andes

Facultad de Ingeniería

Escuela de Sistemas

Departamento de Investigación de Operaciones

Cátedra: Estocástica 3

Profesor: Franklin Dávila

Diseño Factorial 2K

y Diseño Factorial Fraccionado 2K- P

Br. Castellano, Anyer C.I: 16.528.334

Mérida, 14 de Julio de 2007.

Introducción

Page 2: trabajo

Los diseños factoriales son a ampliamente utilizados en experimentos en los que intervienen varios factores para estudiar el efecto conjunto de estos sobre una respuesta.  Existen varios casos especiales del diseño factorial general que resultan importantes porque se usan ampliamente en el trabajo de investigación, y porque constituyen la base para otros diseños de gran valor práctico.

El más importante de estos casos especiales ocurre cuando se tienen k factores, cada uno con dos niveles.  Estos niveles pueden ser cuantitativos como sería el caso de dos valores de temperatura presión o tiempo.  También pueden ser cualitativos como sería el caso de dos máquinas, dos operadores, los niveles "superior" e "inferior" de un factor, o quizás, la ausencia o presencia de un factor.

Una réplica completa de tal diseño requiere que se recopilen 2 x 2 x .... x 2 = 2k

observaciones y se conoce  como diseño general 2k.El segundo caso especial es el de k factores con tres niveles cada uno, conocido como diseño factorial 3k. Se supone que:

a) los factores son fijos.

b) los diseños son completamente aleatorios.

c) se satisface la suposición usual de normalidad.

El diseño 2k es particularmente útil en las primeras fases del trabajo experimental, cuando es probable que haya muchos factores por investigar. Conlleva el menor número de corridas con las cuales pueden estudiarse k factores en un diseño factorial completo.  Debido a que sólo hay dos niveles para cada factor, debe suponerse que la respuesta es aproximadamente lineal en el intervalo de los niveles elegidos de los factores.

Los experimentos fraccionados 2K - P tienen por objetivo determinar la significación de los efectos principales y de las interacciones de 2 o 3 factores.

Por ejemplo: un experimento con 7 factores, requiere identificar 7 + 21 = 28 efectos por lo que necesita 29 tratamientos (en vez de los 128 del experimento 27 completo).

A estos diseños se les llama Screening Designs. Su intención es determinar de una lista grande de factores cuáles son aquellos sobre los que se realizará un experimento posterior con un diseño experimental no fraccionado (experimentación secuencial).Un experimento factorial fraccionado es uno en el que solo se observa una fracción de las condiciones experimentales. La fracción es ½, ¼, 1/8, 1/16, … del experimento sin fraccionar.

Diseño Factorial

Page 3: trabajo

Los diseños factoriales estadísticos involucran la combinación de dos o más factores, cada uno a distintos niveles, lo que conduce a distintos tratamientos. Los factores son variables independientes de las cuales nos interesa medir su efecto sobre una variable dependiente o respuesta; los niveles son las categorías en las cuales se puede dividir un factor. El objetivo general de los diseños factoriales es determinar si existe efecto de los factores estudiados y también si existe interacción entre ellos.

Un Diseño Factorial es aquel en el que se investigan todas las posibles combinaciones de los niveles de los factores en cada ensayo completo o replica del experimento.

Diseños factoriales fraccionales. Es un método estadístico de gran utilidad debido a que reduce tiempo y recursos al estudiar las interacciones de mayor importancia de un diseño experimental completo

Específicamente el diseño factorial 2K completo es el que estudia k factores con dos niveles cada uno, y donde se evalúan los 2K posibles tratamientos. Se dice que son útiles principalmente cuando el numero de factores esta entre 2 y 5, rango en el cual su tamaño se encuentra entre 4 y 32 tratamientos. Si el número de factores es mayor a 5 se recomienda usar un factorial fraccionado.

Para facilitar el entendimiento de un diseño factorial 2K estudiemos el diseño más simple de la familia de 2K, el diseño 22.

Diseño Factorial 22

Este modelo estudia el efecto de dos factores considerando dos niveles en cada uno. Cada replica de este diseño consiste de 2x2=4 combinaciones o tratamientos que se pueden denotar de diferentes maneras.

Algoritmo de Yates. Es un método numérico que simplifica efectos e interacciones entre los factores manejados a sus diferentes niveles

La notación de Yates tiene un significado diferente a las demás: con ella se representa el total o suma de las observaciones en cada tratamiento, mas que el tratamiento mismo. En la notación de Yates la lógica es la siguiente: si una letra minúscula esta presente, entonces el factor correspondiente se encuentra en su nivel alto; si esta ausente, el factor esta en su nivel bajo. Este hecho hace que la notación de Yates simplifique la escritura de las expresiones de los efectos a estudiar.

Ejemplo:

Tabla 1. Notación de Yates

A B Notación de YatesTratamiento 1 -1 -1 (1)Tratamiento 2 1 -1 aTratamiento 3 -1 1 bTratamiento 4 1 1 ab

¿Como se calculan los efectos?

Page 4: trabajo

En el caso de este diseño hay tres efectos de interés: los dos efectos principales (A y B) y el efecto de interacción (AB). Con el uso de la notación de Yates como los totales de las n repeticiones en cada punto de diseño, se tiene que en el nivel alto del factor A se mide a y ab y en el nivel bajo del mismo se observa b y (1). La media en el nivel alto de A es entonces (a+ab)/2n y en el nivel bajo es (b+(1))/2n, donde la constante 2n sale del hecho de que en cada nivel del factor se están sumando 2n datos, que son la mitad de los datos del experimento. Entonces:

El efecto de interacción entre los dos factores A y B esta dado por la diferencia entre el efecto de A en el nivel alto de B y el efecto de A en el nivel bajo de B.

Análisis de Varianza

Aunque los efectos calculados sean números distintos de cero, esto no implica que el efecto correspondiente sea estadísticamente diferente de cero. Para poder afirmar que tales efectos contribuyen a explicar el comportamiento de la respuesta, se debe hacer un Análisis de Varianza.

Contraste

Es una combinación de la forma con

Donde lo ci son los coeficientes.En el caso del diseño 22 los contrastes correspondientes a los tres efectos A, B, AB son:Contraste A = [a + ab - b - (1)]

Contraste B = [b + ab – a - (1)]

Contraste AB = [ab + (1) – a - b]

Son contrastes por el hecho de que son combinaciones lineales donde los coeficientes suman cero (1 + 1 – 1 – 1 = 0). Una vez obtenido el contraste, el efecto correspondiente se obtiene dividiéndolo entre la constante que lo convierta en una diferencia de medias. En el factorial 2K con n replicas los contrastes se dividen por

Page 5: trabajo

n2(K-1) para estimar los efectos. Lo que indica que para el diseño 22 se divide por n2(2-1)

= 2n.

Métodos para calcular contrastes

La tabla de signos es una manera práctica de calcular contrastes de cualquier efecto. Se construye a partir de la matriz de diseño multiplicando las columnas que intervienen en la interacción calculada. Para el diseño 22:

Tabla 2. Matriz de Diseño para el diseño 22

A B AB Yates- - + (1)+ - - a- + - b+ + + ab

El calculo de contrastes se complica en la medida de que el numero de factores crece, dado que se incrementa rápido el numero de términos que contiene el contraste.

Pasos para llegar al ANOVA

Para investigar cuales de los tres efectos están activos o son significativos se procede a probar las hipótesis dadas por:

Efecto A = 0Ho: Efecto B = 0

CONTRASTES

EFECTOS

SUMAS DE CUADRADOS

ANOVA

Page 6: trabajo

Efecto AB = 0

Cada una contra la alternativa de que el efecto en cuestión es diferente de cero.

Tabla 3. ANOVA para el diseño 22

FV SC GL CM Fo P-Value

A SCA 1 CMA CMA/CME P(F>Fo)

B SCB 1 CMB CMB/CME P(F>Fo)

AB SCAB 1 CMAB CMAB/CME P(F>Fo)

Error SCE 4(n-1) CME

Total SCT n22-1

Diseño factorial 2K

Una vez obtenida la tabla de signos, el cálculo de contrastes es más fácil. La tabla de signos se construye haciendo todas las posibles combinaciones de los K factores. Como se menciono anteriormente los diseños factoriales 2K son recomendados en experimentos cuyos factores son menor o igual a 5, para un numero mayor de factores se recomienda usar los diseños factoriales fraccionados 2K-P.

Para el diseño factorial 25 se tendrán 32 tratamientos, es decir, 32 posibles combinaciones entre los 5 factores en 2 niveles. Una vez construida la tabla se signos, el contraste de cada efecto se obtiene al multiplicar su columna de signos por la columna de totales expresados en la notación de Yates. Con los contrastes se procede a estimar los efectos mediante la formula:

Para la cual su suma de cuadrados con un grado de libertad esta dada por:

Si en la tabla de ANOVA se incluyen el total de efectos que se pueden estimar con el factorial completo 2K será necesario realizar cuando menos dos replicas del experimento para poder estimar una suma de cuadrados del error. Sin embargo, en la mayoría de los casos interesa solo estudiar a los efectos principales y las interacciones dobles. Esto hace que cuando el número de factores es mayor o igual a cuatro (K≥4) no sea estrictamente necesario realizar replicas, puesto que se puede construir una suma de cuadrados del error aproximada, utilizando las sumas de cuadrados de las interacciones triples o de mayor orden que generalmente son pequeñas.Diseño Factorial 2K no replicado

Page 7: trabajo

Al aumentar el numero de factores en el diseño 2K crece rápido el numero de tratamientos y por lo tanto el numero de corridas experimentales. Si se realiza dos repeticiones en cada punto se tiene que hacer 2x2K corridas experimentales, lo cual puede consumir muchos recursos para mas de cuatro factores (K≥5), ya que serian 64 o mas corridas. El diseño 25 es el factorial mas grande que todavía se puede correr con dos replicas, lo que implica hacer 32 corridas del proceso, pero incluso con una replica (16 pruebas) de este diseño es muchas veces suficientes para estudiar los 10 efectos de interés como se muestra en la tabla 4.

Tabla 4. Tabla de signos del diseño factorial 2K

Notación de Yates

A B C D E AB AC AD AE BC BD BE CD CE DE

(1) - - - - - + + + + + + + + + +a + - - - - - - - - + + + + + +b - + - - - - + + + - - - + + +ab + + - - - + - - - - - - + + +c - - + - - + - + + - + + - - +ac + - + - - - + - - - + + - - +bc - + + - - - - + + + - - - - +abc + + + - - + + - - + - - - - +d - - - + - + + - + + - + - + -ad + - - + - - - + - + - + - + -bd - + - + - - + - + - + - - + -abd + + - + - + - + - - + - - + -cd - - + + - + - - + - - + + - -acd + - + + - - + + - - - + + - -bcd - + + + - - - - + + + - + - -abad + + + + - + + + - + + - + - -e - - - - + + + + - + + - + - -ae + - - - + - - - + + + - + - -be - + - - + - + + - - - + + - -abe + + - - + + - - + - - + + - -ce - - + - + + - + - - + - - + -ace + - + - + - + - + - + - - + -bce - + + - + - - + - + - + - + -abce + + + - + + + - + + - + - + -de - - - + + + + - - + - - - - +ade + - - + + - - + + + - - - - +bde - + - + + - + - - - + + - - +abde + + - + + + - + + - + + - - +cde - - + + + + - - - - - - + + +acde + - + + + - + + + - - - + + +bcde - + + + + - - - - + + + + + +abcde + + + + + + + + + + + + + + +

La siguiente tabla muestra las replicas recomendadas en la familia de diseños 2K.

Page 8: trabajo

Tabla 5. Replicas en la familia de diseños 2K

Diseño Replicas recomendadas Numero de corridas22 3 o 4 12, 1623 2 1624 1 o 2 16, 3225 Fracción 25-1 o 1 16, 3226 Fracción 26-2 o fracción 26-1 16, 3227 Fracción 27-3 o fracción 27-2 16, 32

Ninguno de los diseños listados en la tabla tiene más de 32 corridas, sin contar las posibles repeticiones al centro que se explicaran mas adelante. Se puede afirmar que la mayoría de los experimentos factoriales 2K o fracciones de ellos que se utilizan en la practica requieren a lo mas 32 corridas experimentales, y con ellas se pueden estudiar hasta una cantidad grande de factores (K>8).

Una sola replica del factorial 2K completo es una estrategia adecuada cuando se tienen cuatro o mas factores, considerando que a partir de K=4 se comienza a tener mucha información con el diseño factorial completo. Esta información extra se refleja en que los efectos de interés primario, como lo son los efectos principales y las interacciones dobles, se estiman con gran precisión, por ejemplo en el caso de K=5, estos efectos se estimarían como la diferencia de medias de 16 datos cada una. Pero además se pueden estimar interacciones de alto orden, las cuales generalmente no son significativas. Tales interacciones de alto orden pueden utilizarse para estimar un error que permita construir un ANOVA aproximado.

Se deben eliminar o mandar al error al menos 8 efectos pequeños para que tenga mayores posibilidades de estar bien estimado. Puede haber efectos con los que no es nada claro si se deben o no mandar al error.

¿Como decidir cuales efectos mandar al error?

Existen varia técnicas que ayudan a detectar con bastante seguridad los efectos que pueden utilizarse para conformar el error. El uso de tales técnicas es lo que permite construir un cuadrado medio del error los mas apegado posible a la realidad. Si mandamos al error un efecto que no se debe al azar, que es un efecto real, este puede inflar el CME lo que reduciría la potencia del ANOVA para detectar efectos significativos; por otro lado, si el error resulta exageradamente pequeño, se estaría detectando como significativos efectos que no lo son, lo cual puede llevar a decisiones incorrectas.

Las técnicas para decidir que efectos mandar al error no funcionan bien cuando los efectos que tiene el diseño son pocos. Por ejemplo, los diseños 22 y 23 no tendrían suficientes efectos para que estos métodos realmente tengan utilidad práctica. Pero estos diseños se corren frecuentemente con replicas suficientes para construir el análisis de varianza directamente, evitando la necesidad de construir un error hasta cierto punto arbitrario.

Grafico de efectos en papel normal (Daniel’s plot)

Page 9: trabajo

Este grafico permite visualizar cuales efectos pueden ser significativos: entre mas se aleje un punto de la línea, más importante será el correspondiente efecto.

o Papel probabilístico medio normal (half normal)Es una grafica basada solo en la parte positiva de la distribución normal, que cuando se tienen efectos positivos y negativos da una mejor perspectiva de los efectos que pueden ser significativos.

Diagrama de Pareto de efectos

El Pareto representa la realidad observada de los efectos de manera descriptiva sin considerar supuestos distribucionales. Es un grafico de barras que representa los efectos ordenados en forma ascendente de acuerdo con su magnitud absoluta.

Factoriales 2K con punto al centro

Punto al centro es un tratamiento formado por la combinación del nivel intermedio o medio de todos los factores. Hay dos razones por las que es deseable correr el punto central con cierto número de replicas:

1. Obtener grados de libertad adicionales para el error en la tabla de ANOVA, sin perjudicar el balance en la estimación de los efectos de interés.

2. Las repeticiones al centro permiten detectar la posible presencia de curvatura en al menos uno de los factores objeto de estudio.

Factoriales 2K en bloques

El objetivo del experimento repartido en bloques es estudiar el efecto de los k factores sobre la respuesta; no es el objetivo estudiar el efecto de los factores de bloques, pero una vez incluidos en el experimento se puede evaluar su efecto sobre la respuesta y conocer la pertinencia de haberlo considerado. Algunos casos típicos son los siguientes:

1. No es posible correr el factorial completo 2K en el mismo día, ya sea por lo lento de las corridas o del proceso de medición, o por la cantidad de las corridas. Si se considera el factor día puede afectar los resultados del estudio, entonces se decide incorporarlo en el experimento como factor de bloque. Si el proceso estudiado es sensible a los cambios de turno dentro del mismo día, los turnos deberían considerarse como el factor de bloque.

2. Cuando un lote de material no alcanza para hacer todas las corridas experimentales y se sospecha que las diferencias entre lotes podrían sesgar los resultados, entonces es necesario repartir adecuadamente las corridas experimentales en varios lotes (bloques). O bien cuando el material de prueba tiene dos o más características distintivas que pueden sesgar las conclusiones del estudio, de no considerarse.

No se trata de pretender bloquear activamente en el experimento todas las posibles fuentes de variación, sino aquellas que puedan tener algún impacto importante sobre la respuesta de interés.

Diseños factoriales fraccionados 2K-P

Page 10: trabajo

Los diseños factoriales fraccionados son una parte o una fracción de los diseños factoriales completos, permiten reducir el numero de corridas experimentales, y al mismo tiempo obtener la información acerca de los efectos considerados de antemano relevantes. La teoría de diseños factoriales fraccionados se basa en una jerarquización de los efectos: son mas importantes los efectos principales, seguido por las interacciones dobles, luego las triples, cuádruples, etc.

La tabla 6 muestra el numero de efectos potencialmente de mayor interés para diferentes diseños factoriales 2K, de ahí se observa que el primer diseño factorial completo que genera un importante exceso de información es el factorial completo 25.

Tabla 6. Efectos en lo factoriales 2K

Diseño 2K Total de efectos Efectos no ignorables

Efectos ignorables

22 3 3 023 7 6 124 15 10 525 31 15 1626 63 21 4227 127 28 99

Cuando k≥5 el numero de efectos ignorables supera el numero de efectos no ignorables o potencialmente importantes, lo cual indica que estos diseños se pueden fraccionar muchas veces sin perder información valiosa. Mientras mas grande es el valor de k, el diseño admite un grado de fraccionamiento mayor.

Al correr solo una fracción del diseño factorial completo ocurren dos hechos:

1. se pierde información, ya que habrán efectos que no podrán estimarse y se tienen menos grados de libertad disponibles para el error.

2. los efectos que si se pueden estimar tienen al menos un alias. El que un efecto sea alias de otro significa que son en realidad el mismo efecto con nombres distintos, y al estimar a uno de ellos se estima al mismo tiempo el otro, de manera que no se pueden separar

Diseño factorial fraccionado 2K-1

La notación 2K-1 significa una fracción a la mitad del diseño factorial completo 2K.

No tiene sentido fraccionar a la mitad el diseño 22 porque prácticamente desaparece. Cuando se tienen cinco factores en adelante, al fraccionar a la mitad el diseño factorial completo, se pierde poca información relevante.

Diseño factorial fraccionado 23-1

Si se quiere fraccionar a la mitad este diseño, entonces es necesario seleccionar cuatro de entre los ocho tratamientos. Se sabe que existen 70 posibles maneras de elegir una fracción a la mitad del diseño factorial 23, por lo que surge la interrogante sobre cual o cuales de esas 70 posibles fracciones son las más adecuadas. Es adecuada aquella que permita estimar los efectos considerados importantes. Con el

Page 11: trabajo

diseño 23 completo se pueden estimar 7 efectos: A, B, C, AB, AC, BC y ABC. De acuerdo a su jerarquía, el efecto menos importante a priori es la interacción triple ABC, así que este es el efecto mas sacrificable para generar la fracción a la mitad de manera que se pierda un mínimo de información. La generación de la fracción se hace en base a los signos del contraste ABC: los signos “+” del contraste ABC señalan a los tratamientos que conforman la llamada fracción principal, y los signos “-“ señalan la fracción complementaria. De aquí que el efecto no estimable ABC se llama generador de la fracción, puesto que su contraste es la base para construir las dos fracciones.

Tabla 7. Diseño factorial completo 23 y contraste ABC

A B C ABC-1 -1 -1 -1 -1 -1 +-1 1 -1 +1 1 -1 --1 -1 1 +1 -1 1 --1 1 1 -1 1 1 +

Tabla 8. Dos posibles diseños fraccionados 23-1

fracción 1(I= +ABC)

fracción 2(I= -ABC)

A B C A B C1 -1 -1 a -1 -1 -1 (1)-1 1 -1 b 1 1 -1 ab-1 -1 1 c 1 -1 1 ac1 1 1 abc -1 1 1 bc

La estructura de alias consiste en escribir explícitamente cuales son los alias de cada efecto, y esta estructura se deduce finalmente del generador de la fracción, considerando el signo utilizado. Por ejemplo: De la tabla 8:

Contraste A = (a + abc – b - c)

Mientras que al multiplicar las columnas BxC:

Contraste BC = (a + abc – b – c)

Lo que indica que los efectos A y BC son alias, porque al estimar el efecto A también se estima el efecto B.

La estructura alias de un diseño factorial fraccionado se puede obtener de la relación definidora del diseño. En este caso la relación definidora coincide con el generador I=ABC. Multiplicando cada efecto por esta relación, con el uso de multiplicación modulo 2, se obtiene directamente la estructura de alias. La multiplicación modulo 2 significa que al multiplicar cualquier efecto por la identidad es igual al efecto, y al

Page 12: trabajo

multiplicar un efecto por si mismo es igual a la identidad; por ejemplo, aplicando esto para el efecto A, se tiene que AxI=A y que AXA(mod2)=A2=I. Entonces el alias de A se obtiene al multiplicar por A ambos lados de la relación I=ABC, y resulta:

AxI=AxABC=A2BC=BC

Interpretación de los efectos alias

Para interpretar los efectos alias es necesario suponer que solo uno de ellos es el responsable del efecto observado y que los demás efectos son nulos. Por ejemplo, si se utilizara el diseño 23-1 con estructura de alias dada, los efectos alias se interpretan atribuyendo (por jerarquía) el efecto observado al efecto principal de cada grupo, considerando nulas las interacciones dobles. En general resulta bastante riesgoso suponer a priori que las interacciones dobles no afectan, de aquí que no se recomienda usar este diseño, a menos que el costo experimental no permita correr el factorial completo. En general no es buena estrategia utilizar diseños fraccionados donde se alían dos efectos que son potencialmente importantes, como son los efectos principales y las interacciones dobles.

Resolución

Un diseño factorial fraccionado es de resolución R si los efectos formados por la interacción de P factores no son alias de efectos de interacción que tengan menos de R – P factores. A mayor resolución se observa más claramente lo que sucede con los efectos potencialmente importantes.

1. Diseños de resolución III. Es cuando los efectos principales no son alias entre ellos, pero existen efectos principales que son alias de interacciones dobles.

2. Diseños de resolución IV. Es cuando los efectos principales no tienen alias entre ellos ni con las interacciones dobles, pero algunas interacciones dobles son alias entre ellas.

3. Diseños de resolución V. Es cuando los efectos principales y las interacciones dobles están alias con interacciones triples o de mayor orden.

Construcción de fracciones 2K-1

Una manera de construir en dos pasos diseños fraccionados 2K-1 con la más alta resolución posible es la siguiente:

1. se lista el diseño factorial completo para K – 1 factores, y de esta forma se obtienen las k – 1 columnas de la fracción deseada.

2. la columna faltante (la k-exima) se construye multiplicando entre si las columnas previas. Si se quiere la fracción complementaria se cambian los signos de esta última columna. El diseño que resulta es un diseño factorial fraccionado 2K-1 con resolución máxima R=K.