125
- DISEÑO DE EXPERIMENTOS - L. CID S. - 2014 1 DISEÑO DE EXPERIMENTOS Prof. Luis Cid Serrano Departamento de Estadistica Universidad del Bio Bio ASIGNATURA : DISEÑO DE EXPERIMENTOS CÓDIGO : 1.- IDENTIFICACIÓN DISEÑO DE EXPERIMENTOS 2.- DESCRIPCIÓN Este curso presenta los fundamentos de una buena planificación y diseño de un experimento. Se enfatizan los aspectos estadísticos inferenciales y las restricciones de los modelos en relación a los proceso de aleatorización utilizados. Asignatura destinada a reforzar los conceptos y metodologías incluidas en las asignaturas de pregrado que se orientan a temas semejantes. 3.- OBJETIVOS Generales: Identificar y desarrollar los elementos esenciales de la planificación, ejecución y análisis de un buen diseño experimental. Específicos · Identificar las bases de la planificación de un experimento en presencia de restricciones reales. · Conocer los distintos modelos lineales asociados a un experimento y relacionarlos con los procesos de aleatorización. · Definir la tabla de análisis de varianza asociada los procesos de aleatorización, utilizando el cuadrado medio del error como elemento determinante en el control de los errores tipo I y II. · Complementar los resultados de las tablas de análisis de varianza con pruebas específicas incluyendo contrastes ortogonales. · Conocer modelos más complejos, presentados bajo restricciones específicas. · Relacionar los modelos lineales de regresión con los modelos de diseño experimental.

apuntes_diseao_2014

Embed Size (px)

DESCRIPTION

para los que estudien Diseño de Experimentos, un muy buen apunte resumen.

Citation preview

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    1

    DISEO DE EXPERIMENTOSProf. Luis Cid Serrano

    Departamento de EstadisticaUniversidad del Bio Bio

    ASIGNATURA : DISEO DE EXPERIMENTOSCDIGO :

    1.- IDENTIFICACIN DISEO DE EXPERIMENTOS

    2.- DESCRIPCIN

    Este curso presenta los fundamentos de una buena planificacin y diseo de unexperimento. Se enfatizan los aspectos estadsticos inferenciales y las restriccionesde los modelos en relacin a los proceso de aleatorizacin utilizados.Asignatura destinada a reforzar los conceptos y metodologas incluidas en lasasignaturas de pregrado que se orientan a temas semejantes.

    3.- OBJETIVOS

    Generales: Identificar y desarrollar los elementos esenciales de la planificacin,ejecucin y anlisis de un buen diseo experimental.

    Especficos Identificar las bases de la planificacin de un experimento en presencia de restricciones reales. Conocer los distintos modelos lineales asociados a un experimento y relacionarlos con los procesos de aleatorizacin. Definir la tabla de anlisis de varianza asociada los procesos de aleatorizacin, utilizando el cuadrado medio del error como elemento determinante en el control de los errores tipo I y II. Complementar los resultados de las tablas de anlisis de varianza con pruebas especficas incluyendo contrastes ortogonales. Conocer modelos ms complejos, presentados bajo restricciones especficas. Relacionar los modelos lineales de regresin con los modelos de diseo experimental.

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    2

    4.- UNIDADES PROGRAMTICAS (*)

    UNIDADESUnidad 1: Planificacin de Experimentos, identificacin de las componentes esenciales mnimas. Modelos tipo I, II y III. Unidad 2: Procesos de aleatorizacin como determinantes de los modelos lineales asociados. Unidad 3: Modelos basados en aleatorizaciones clsicas.Unidad 4: Experimentos Factoriales.Unidad 5: Comparaciones de medias, contrastes,Unidad 6: Modelos para de anlisis de covarianza.Unidad 7: Modelos especiales. Modelos anidados, para rplicas fraccionarias, etc.Unidad 8: Modelos de diseo experimental como modelos de regresin

    5.- CONTENIDO UNIDADES PROGRAMTICAS

    UNIDADES CONTENIDOUnidad 1: Planificacin de Experimentos, identificacin de las componentesesenciales mni-mas. Modelos tipo I, II y III. Definicione bsicas. Caracterizacin delas unidades experimentales y los tratamientos. Modelos en funcin de la naturalezade los tratamientos. Modelos tipo I, II y III. El nmero de rplicas como controladorde los errores tipo I y II.

    Unidad 2: Procesos de aleatorizacin como determinantes de los modelos linealesaso-ciados. Modelos lineales asociados a cada proceso de aleatorizacin. La tabla deanlisis de varianza y su relacin con los procesos de aleatorizacin.

    Unidad 3: Modelos basados en aleatorizaciones clsicas. Diseo completamentealeatorio, en bloques, parcelas divididas.

    Unidad 4: Experimentos factoriales. Modelos de dos y tres factores. Anlisis yestimacn e interpretacin de las interacciones.

    Unidad 5:Comparaciones de medias Post-hoc y Contrastes 0rtogonales. Pruebas deTukey, Duncan, Scheff, Bonferroni, etc.

    Unidad 6. Anlisis de Covarianza. Modelo conceptual. interpretaciones.Modelos anidados y modelos de unidades subdivididas Planificacin de unexperimento mediante factores anidados. Tablas de anlisis de varianza y pruebasespecficas.

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    3

    Unidad 7: Modelos anidados tipo I, tipo II y Mixtos. Modelos para rplicasfraccionarias.Anlisis y planificacin de experimentos rplicas parciales y diseosfraccionarios. Determinacin de los factores de confundido en experimentos de ordensuperior.

    Unidad 8: Modelos de diseo experimental como modelos de regresin Representacin de los diferentes modelos lineales asociados con la aleatorizacin delos tratamientos, mediante modelos de regresin, utilizando variables indicadoras.Estudios comparativos de la eficiencia de los modelos de regresin y de diseo deexperimentos.

    6.- METODOLOGA Clases presenciales en las que se presentarn y discutirn los modelos a utilizar. Sesiones de laboratorio en las que analizarn casos de problemas reales que necesiten el uso de modelos ms complejos. Estudios comparativos que permitan evaluar los diferentes resultados obtenidos mediante la aplicacin de diferentes metodologas.

    7.- TIPOS DE EVALUACIN (PROCESO Y PRODUCTO)

    Dos Certmenes ms un Proyecto de curso. La propuesta de proyecto debepresentarse durante las tres primeras semanas del curso y debe ser aprobada por elprofesor. Se trabajar en grupos de dos personas, agrupadas segn el orden de la listadel curso. Los certmenes tienen una poderacin de 35% y 45% de la nota. Elproyecto de curso un 20%.

    8.- BIBLIOGRAFA:

    Bsica Apuntes de Diseo Experimental, L. Cid S. Neter J., Kutner, M.H., Nachtsheim C.J., Wasserman W., 1996. Applied Linear Statistical Models. McGraw Hill, Boston Cox, R. Planning of experiments. 1992. Wiley and Sons. N. Y. Steel R.G.D, Torrie J.H., Dickey D.A., , 1997. Principles and Procedures of Statistics. McGraw Hill.

    Complementaria Snedecor. G.W., Cochran W.G. Statistical Methods, Iowa State University Press. 8 Edicin. 1989.

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    4

    Cochran W.G., G. Cox, 1957. Experimental Designs. Wiley and Sons, N.Y. Montgomery, D.C.: Design and analysis of Experiments. Fifth Edition. Wiley. 2000. Robert Mason, Richard Gunst, James Hess Statistical Design and Analysis of Experiments. Wiley, 1989.

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    5

    CURSO DE DISEO EXPERIMENTALLuis Cid Serrano

    Universidad del Bio Bio

    1. Introduccin

    1.1 Ideas Generales

    Los modelos lineales asociados con los diseos experimentales, son herramientas que nos permitenestudiar las relaciones entre una o ms variables dependientes e independientes o predictoras. Estosmodelos no requieren supuestos previos respecto de la naturaleza de las relaciones entre estasvariables, ni tampoco contienen exigencias sobre la naturaleza de las variables explicativas, las queno necesariamente deber ser de tipo numrico. Estos hechos hacen posible el uso de estos modelosen una gran variedad de estudios, que tienen, en general ms cobertura que en el caso de losmodelos de regresin recin vistos. De este modo, los (MDE)Modelos de Diseo Experimental,tambin llamados , difieren de los modelos de regresinModelos de Anlisis de Varianzafundamentalmente por el tipo de variables y en el tipo de relacin existente entre las variables, yaque aqu se incluyen como variables explicativas (predictoras) principalmente variables cualitativaso categricas.No obstante lo anterior, una de las principales diferencias entre ambos tipos de modelos, es que enel caso de los MDE, aun cuando las variables explicativas sean de tipo numrico y representen portanto magnitudes, no necesariamente se hace uso explcito de dicha magnitud, la que generalmentedefine slo una categora de variable y no un valor numrico, a diferencia de los modelos deregresin en los que dicha magnitud es fundamental al momento de construir el modelo linealcorrespondiente. Por estas razones, entre otras, las variables explicativas se llaman, en el caso de losMDE, factores, a diferencia de los modelos de regresin que reciben el nombre de variablesexplicativas o predictoras.

    Otro aspecto fundamental en el estudio de los MDE es que, a pesar de lo que su nombre indica,modelos de diseo " stos pueden ser aplicados tanto a estudios experimentalesexperimental",como observacionales. En efecto, consideremos los siguientes ejemplos,

    Ejemplo 1. Estudios ExperimentalesPara el estudio del mejoramiento de las propiedades mecnicas de la madera mediante suimpregnacin, se desea conocer el efecto de cuatro temperaturas sobre el Mdulo de Elasticidad(MOE) de la madera de pino impregnada. Para ello se someten a ensayo cinco probetas (trozosestandarizados de madera de pino) diferentes, a cada una de las cuales se le aplica aleatoriamenteuna de las cuatro temperaturas. En este caso se trata de un estudio experimental puesto que lostratamientos, (temperaturas) son controladas por el experimentador, el que ha sometido a ensayo 20trozos de madera, asignndoles las temperaturas de acuerdo a un procedimiento aleatorio adeterminar, pero que no cambia la naturaleza experimental del estudio.

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    6

    Ejemplo 2. Estudios ObservacionalesSe desea determinar el efecto de los aos de experiencia y los aos de educacin, sobre elrendimiento acadmico de los alumnos de una institucin de educacin superior. Para ello se obtuvouna muestra de docentes de una universidad que durante un cierto nmero de aos ha enseado elmismo tipo de asignaturas y al mismo tipo de alumnos, registrndose los porcentajes de aprobacin.En este caso se trata de un estudio observacional, puesto que el investigador no tiene control sobrelas variables a considerara en el estudio, aos de experiencia y aos de educacin.

    No obstante las diferencias entre estos dos tipos de estudios, ambos pueden realizarse igualmentemediante modelos de diseo experimental.

    Objetivos de los MDESuponga que deseamos comparar el volumen de madera por hectrea que produce, despus de uncierto periodo de crecimiento, una variedad de eucaliptus, digamos cuando laEucaliptus nittens,plantacin es tratada con dos fertilizantes diferentes, Fertilizante A y Fertilizante B Respecto de. este estudio, podemos definir dos objetivos bsicos para realizar esta comparacin. El primero esresponder la pregunta Hay una diferencia real en la produccin de las plantaciones sometidas acada uno de los tratamientos?. Una segunda pregunta podra ser Cul es la magnitud de taldiferencia?.

    As, el primer objetivo involucra una prueba de la hiptesis que no hay diferencia real en laproduccin y esperamos que los datos experimentales recolectados nos permitan tomar una decisinrespecto de rechazar o no esta hiptesis. Para el segundo objetivo calculamos un estimador, o mejoran, determinamos un intervalo de confianza para la verdadera diferencia en la produccin y, enbase a los resultados de esta estimacin decidimos sobre las bondades de cada fertilizante. En casitodos los experimentos se realizan con uno o ambos de estos propsitos; es decir, probar estashiptesis o estimar las diferencias o los efectos de los diferentes tratamientos. Adems del propsitocomplementario de obtener informacin de por qu estas diferencias ocurren.

    El rol del es proporcionar una informacin eficiente y precisa paraDiseo de Experimentossatisfacer estos objetivos. En particular los experimentos son diseados para los siguientespropsitos:

    1.- Proporcionar estimadores de los efectos de los tratamientos o diferencias entre los efectos de los tratamientos.

    2.- Proporcionar de una manera eficiente la confirmacin o negacin de las conjeturas acerca de la respuesta del tratamiento.

    3.- Asignar confiabilidad a los estimadores y pruebas.

    4.- Estimar la variabilidad del material experimental.

    5.- Aumentar la precisin eliminando variaciones extraas a las comparaciones de inters.

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    7

    6.- Proporcionar un patrn sistemtico, eficiente para conducir un experimento.

    Volviendo al ejemplo anterior, un procedimiento simple podra ser entonces, plantar una ciertacantidad de plantas de en un sector, que llamaremos y que sometemos alE. nittens parcelatratamiento A, y otra cantidad, preferentemente similar, en otra parcela, la que sometemos altratamiento B. Recolectadas las plantas, ahora rboles, despus de un periodo predeterminado decrecimiento, se mide la biomasa de ambas y se obtiene la diferencia entre los rendimientos de ambasparcelas. Existe, sin embargo, un inconveniente obvio en este procedimiento, y ste es que elproductor podra tener ms de una forma de determinar que fraccin de las diferencias observadases debida al efecto de los tratamientos aplicados y cul es debida simplemente por las diferencias ovariaciones biolgicas, causadas por ejemplo por diferencias en la informacin gentica propia decada planta que es examinada.

    En diseo de experimental estas estn claramente identificadas, unados fuentes de variacincorresponde al , y la otra al . El objetivo de losefecto de los tratamientos error experimentaldistintos diseos experimentales que estudiaremos en este curso, es obtener una medicin, lo msprecisa posible, de estas dos fuentes de variacin de las medidas observadas.

    1.2. Definiciones

    Para efecto de este curso, definiremos a continuacin algunos de los conceptos bsicos mscomunes y que son propios de prcticamente todos estos diseos.

    Modelo de Diseo Experimental. Corresponde, en la mayor parte de los casos a un modelode tipo lineal, en el cual encontramos tres elementos bsicos, una , un conjuntovariable respuestade y un trmino de .parmetros error experimental

    Tratamientos. Corresponde a un procedimiento, generalmente de tipo experimental, cuyo efectoqueremos medir.Considerando la naturaleza de los tratamientos, analizaremos tres modelos anlisis de anlisis devarianza.

    Modelo I. Los resultados son atingentes slo a los tratamientos o niveles de factores bajo estudio.Se les llama , yModelo de Efectos Fijos

    Modelo II. Las conclusiones son aplicables a una familia de tratamientos, de la cual lostratamientos o factores bajo estudio son slo una muestra. Se les llama Modelo de EfectosAleatorios.

    Modelo III. Los tratamientos corresponden a una mezcla de efectos fijos y aleatorios. Se les llamaModelo de Efectos Mixtos.

    Unidad Experimental. Es la unidad muestral bsica sobre la que se aplica el tratamiento y porlo tanto nos permite medir la respuesta al tratamiento.

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    8

    Factor. Es una variable independiente o explicativa cuyo efecto sobre las unidades queremosmedir. Por ejemplo, supongamos que en ejemplo recin visto, los tratamientos A y B, correspondena distintas concentraciones de un fertilizante. En este caso el factor es el fertilizante, el que semanifiesta a dos , A y B.niveles

    Un factor puede ser clasificado segn se trate de un , como en el ejemplo recinfactor experimentalvisto, o un . Como sera por ejemplo si los tratamientos A y B correspondenfactor de clasificacina dos diferentes procedencias de las plantas de . Los factores de clasificacin se asocianE. nittensgeneralmente a caractersticas que no estn bajo el control del investigador, ya que ste no puedecambiar arbitrariamente el tratamiento aplicado a la unidad experimental, como es el caso de laprocedencia de las plantas, recin visto, sino que se trata de una caracterstica que es propia de launidad experimental, una planta. El factor experimental puede ser asignado aleatoriamente acualquier unidad experimental. En nuestro ejemplo, si las plantas tienen la misma procedencia, unopuede decidir aleatoriamente a qu planta le asigna la concentracin A y a cul B.

    Existe una clasificacin adicional de los factores, estos son los y losfactores de efecto fijo factoresde efecto aleatorio. Son factores de efecto fijo aquellos en los que se espera que los niveles delfactor sobre las unidades experimentales sean siempre los mismos (asumiendo que las unidadesexperimentales son equivalentes) es el caso, por ejemplo, de un experimento en el que se deseaevaluar el efecto de aplicacin de un fertilizante, en que las opciones son aplicar fertiliante versusno aplicarlo, por lo que las opciones vlidas son dos y slo esas dos. En aquellos casos en que setrata de factores de efectos aleatorios, se asume que los niveles del factor corresponden a unamuestra aleatoria de todos los posibles valores que pueda asumir un factor Un ejemplo tpico de. este tipo de situaciones, es el caso en que los tratamientos corresponden a dosis (concentraciones) deun cierto compuesto, las que se eligen al azar entre un rango amplio de concentraciones posibles.

    Diseo Experimental, es un conjunto de reglas, generalmente asociadas con un modelo lineal,por las cuales los tratamientos son asignados a las unidades experimentales.

    Error Experimental, corresponde a una medida de las distintas respuestas que dan unidadesexperimentales equivalentes y que son tratadas en forma similar (con un mismo tratamiento).

    Rplica. Es la repeticin del tratamiento o nivel de un factor sobre unidades experimentales decaractersticas similares. Las rplicas permiten obtener una estimacin del error experimental. Si noexisten rplicas no es posible obtener una estimacin de dicho error.

    Bloqueo. Un MDE considera como esquema bsico, que es posible disponer de un nmerosuficiente de unidades experimentales, de modo que cada tratamiento o nivel de cada factor puedaser replicado un nmero adecuado de veces. Esto, obviamente no siempre es posible, en tales casosser necesario agrupar las unidades que sean ms homogneas. Generalmente este bloqueo serealiza, considerando, como criterio de agrupacin, a un factor que tiene efecto sobre la variablerespuesta pero que se desea no sea parte del experimento o cuyo efecto no interesa evaluar.

    Aleatorizacin. Corresponde al proceso aleatorio mediante el cual los tratamientos o niveles defactores se asignan a las distintas unidades experimentales (por aleatorio entendemos que lostratamientos son asignados a las unidades de tal manera que cualquier unidad sea igualmenteprobable de recibir cualquier tratamiento). La naturaleza del proceso de aleatorizacin define el tipo

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    9

    de diseo experimental y el modelo lineal asociado, as como la forma de anlisis de los resultados.Existen al menos al menos dos razones adicionales para la aleatorizacin de un diseo deexperimento,

    1.- : la aleatorizacin nos asegura que ningn tratamiento es favorecido oEliminar el sesgo discriminado.

    2.- : entre las observaciones. Esto es necesario para proporcionar laAsegurar la independencia validez de las pruebas de significacin y la estimacin de los parmetros del modelo.

    Suponiendo que hemos decidido realizar un experimento para medir los efectos de un conjunto detratamientos, claramente definidos y diferenciados unos de otros, todo diseo experimental necesita,para su correcta ejecucin, de la definicin de los siguientes elementos bsicos, a saber:

    Elementos bsicos para la planificacin de un diseo experimental.

    1. que es el objetivo sobre el cual se aplican losUnidad experimental, tratamientos y nos entrega la medida de la variable respuesta.

    2. que se deben aplicar a cada una de las unidades experimentalesTratamientos, definidas.

    3. Esta es una variable aleatoria que nos permite definir los Variable respuesta. supuestos del modelo y cuyas medidas son obtenidas mediante mediciones realizadas en la unidad experimental.

    4. que nos permite definir la forma en que losEstrategia de aleatorizacin, tratamientos sern aplicados las unidades experimentales.

    5. lo que nos permite determinar si estamos haciendo unaNmero de rplicas, correcta estimacin del error experimental.

    1.3 Seleccin de Tratamientos y Unidades Experimentales

    La determinacin de los tratamientos y las unidades experimentales sobre los que ellos se aplicanno siempre es necesariamente una tarea trivial y frecuentemente nos encontramos con que stospueden ser fcilmente mal interpretados. Un ejemplo tpico de estas interpretaciones se producecuando uno de lo factores a considerar en el estudio corresponde, por ejemplo, a la especie a quepertenecen los individuos. As, si queremos estudiar el rendimiento de dos especies de eucaliptus,digamos y , respecto del volumen de madera que ellas producen luego de unE. Nittens E. Globulusperiodo dado de crecimiento, uno se pudiera sentir inclinado a pensar que el factor especie puededescomponerse en dos niveles (las dos especies). Para enseguida preguntarse, es posible aleatorizarla especie entre un conjunto de unidades experimentales (los rboles), pensando en que stas, antesde serles aplicados los tratamientos, tienen la misma probabilidad de ser de cualquiera de las

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    10

    especies?. Sin duda que sta es una situacin al menos ambigua, desde el punto de vista de laefectividad del proceso de aleatorizacin.

    Supongamos, por otra parte, que en una empresa pesquera se desea iniciar un proceso decapacitacin entre sus trabajadores. Para ello dispone de instructores, los que deben realizar dichacapacitacin de acuerdo a dos mtodos A y B los que se desea evaluar para decidir cul de los dosmtodos es ms efectivo. De este modo se seleccionan aleatoriamente a dos conjuntos detrabajadores los que se asignan tambin aleatoriamente a los dos grupos de tratamientos, midindoseluego las habilidades adquiridas. Debemos, en este ejemplo, evaluar los resultados de cada mtodoindependientemente de las capacidades de los instructores para ensear y transmitir susexperiencias?, o las capacidades docentes de los instructores afectan los resultados finales de losprocesos de capacitacin?. En este caso, vemos que no es posible discriminar el efecto de lostratamientos del efecto instructor. Cules son entonces los tratamientos?. Son los mtodos decapacitacin, o los instructores, o una combinacin de ambos?. Este tipo de problema se reproduceen todos aquellos casos en que los resultados de la aplicacin de los tratamientos est condicionado,por ejemplo, a la habilidad o capacidad de los investigadores para medir los resultados de laaplicacin de dichos tratamientos, pues estas mediciones pueden requerir personal altamentecapacitado.

    Este tipo de ambiguedades puede producirse tambin al momento de definir el tipo o naturaleza delas unidades experimentales. Por definicin una unidad experimental es aquella sobre la que seaplica el tratamiento y que por lo tanto que nos proporciona la medida de la variable respuesta queestamos interesados en evaluar.En los siguientes dos ejemplos, se ilustra parte de la problemtica que es parte de los objetivos delos diseos experimentales, indicndose que tipo de preguntas es la que tratamos de respondemediante estos modelos.

    Ejemplo 1. Supongamos que deseamos determinar el efecto de una cierta dieta sobre cultivosartificiales de salmones en su etapa de juveniles. Estos salmones se cran en contenedores quealbergan varios miles de ellos. Los diferentes tipos de nutrientes se asignan al azar a un ciertonmero de estos contenedores, digamos tres por cada tratamiento (dieta). Despus de un tiempopredeterminado, se selecciona al azar desde cada contenedor un total de 25 peces los que sonmedidos para compara la diferencias en peso y evaluar las diferencias entre tratamientos. Culdebiera ser aqu la unidad experimental?, es el pez que nos da la medida de su peso; es el containersobre el cual se aplic el tratamiento, o es el conjunto de 25 peces seleccionados de entre variosmiles?. Este problema ser discutido ampliamente ms adelante pues, dependiendo de lo quedefinamos como unidad experimental, el tipo de anlisis puede variar significativamente. Elejemplo nos ilustra sobre el tipo de problemas que se pueden producir al momento de definir lasunidades, las que es necesario clarificar antes de comenzar con el experimento.

    Ejemplo 2. Suponga que deseamos determinar el efecto, sobre la productividad de una empresa,de tres planes de capacitacin diferentes, A, B y C, los que corresponden a los tratamientos Trat A,Trat B y Trat C.

    Podemos definir los objetivos bsicos para realizar esta comparacin.

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    11

    1. Hay una diferencia real en la productividad de la empresa despus de aplicados los tratamientos?.2. Cul es la magnitud de tal diferencia?.3. Cmo realizamos la seleccin de los trabajadores y la aplicacin de los planes de entrenamiento?

    Sometidos los trabajadores a los tratamientos, el problema a resolver es entonces cmo determinarqu parte de la distinta respuesta de los trabajadores se debe al efecto de los tratamientos y cul a

    la variabilidad natural de los propios trabajadores?.

    Retomando el ejemplo de la empresa y sus planes de capacitacin. Se seleccionan aleatoriamentetres conjuntos de trabajadores los que se asignan tambin aleatoriamente a los tres de tratamientos,midindose luego las habilidades adquiridas.

    Debemos evaluar los resultados de cada mtodo independientemente de las capacidades de losinstructores para ensear y transmitir sus experiencias?, o las capacidades docentes de losinstructores afectan los resultados finales de los procesos de capacitacin?.

    En este caso no es posible discriminar el efecto de los tratamientos del efecto instructor.

    ?.Cules son entonces los tratamientos

    Son los mtodos de capacitacin, o los instructores, o una combinacin de ambos?.

    Cules son las unidades experimentales?

    Son los trabajadores independientes de sus propias capacidades o entrenamiento previo?

    1.4. Experimentos controlados

    En este tipo de experimentos se encuentran todos aquellos de tipo farmacolgico que utilizan unplacebo (una dosis similar en forma, tamao y color que aquellas que si contienen una droga, peroque contiene una sustancia inerte) como una de la opciones de tratamiento. Tambin se utilizan enaquellos experimentos para medir el efecto de diferentes concentraciones de una sustancia, siendouno de los niveles del factor, la concentracin cero de la sustancia bajo estudio. Este tipo de estudiose utiliza preferentemente cuando se desconoce el efecto que la aplicacin de las drogas o lassustancias o cuando su resultado no es siempre consistente bajo cualquier condicin, y debe portanto contrastarse contra la "ausencia de tratamiento".

    En este caso, es esencial que el tratamiento control se aplique en exactamente las mismascondiciones que el resto de los tratamientos. Este es el caso, por ejemplo, de los denominados de"doble ciego". En este caso, ni el sujeto que recibe el tratamiento (o el control), ni el investigador,sabe quien ha recibido el tratamiento y quien el placebo. Este procedimiento de aleatorizacin, "aciegas", permite evitar sesgos pues, usualmente las personas sometidas a tratamiento suelen adoptarun comportamiento distinto al habitual. No sera posible tampoco, en el caso de experimentosconsistentes en agregar saborizantes a los alimentos, discriminar entre tres o cuatro de estos tipos de

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    12

    saborizantes, si los consumidores no tienen (sin que necesariamente ellos lo sepan) disponible ungrupo de alimentos que no han recibido dicho saborizante y que acte como control. Este tipo deestudios es particularmente til en el caso de la fabricacin de vinos de distintas cepas, las quepueden poseer diferencias muy sutiles, perceptibles slo bajo condiciones controladas.

    Las pruebas de hiptesis relativas a experimentos controlados son, en general, diferentes a lasdesarrolladas en torno a las tablas de anlisis de varianza, pues existe particular inters en contrastarlos efectos del tratamiento control con el resto de los tratamientos o factores que participan delexperimento. Una herramienta particularmente til para este efecto, es la de los contrastesortogonales que estudiaremos ms adelante.

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    13

    2. Diseo completamente aleatorio (Anlisis de varianza de una va)

    2.1. Introduccin

    Este es un procedimiento simple para ensayos en los que se dispone de un nmero suficiente deunidades experimentales esencialmente homogneas; esto es, unidades en las que la variacin entreellas es pequea. El proceso de aleatorizacin asociado a este diseo consiste en aplicar lostratamientos a las unidades experimentales en forma completamente aleatoria, es decir sin ningntipo de restricciones. El procedimiento ms frecuentemente usado para este efecto, consiste ennumerar las unidades experimentales, para luego generar nmeros aleatorios sucesivos, para serasignados a cada uno de los tratamientos.

    Consideraremos dos modelos alternativos de anlisis de varianza. El , cuyos resultados sonModelo Iatingentes slo a los tratamientos o niveles de factores bajo estudio, y el , en el que lasModelo IIconclusiones son aplicables a una familia de tratamientos de la cual los tratamientos o factores bajoestudio son slo una muestra. Algunos ejemplos de este tipo de modelos, al parecer no tan obvioscomo el primero, son los siguientes:

    Ejemplo 1. Supongamos que un investigador desea explorar el efecto la procedencia de unasemilla sobre el rendimiento de sus productos finales. Dispone para ello de cuatro proveedores quele proporcionan semilla proveniente de cuatro regiones diferentes. Para probar si existen diferenciasentre las distintas procedencias, selecciona al azar un cierto nmero de semillas de cadaprocedencia, las que somete a ensayo de germinacin por un periodo predeterminado. En este casolos resultados son aplicables slo a las procedencias consideradas en el ensayo y no es posibleextrapolar sus resultados a otras procedencias. El tipo de modelos asociado a este tipo de ensayo esModelo Tipo I o Modelo de Efectos Fijos y las conclusiones derivadas del estudio slo sonaplicables a los tratamientos empleados en el estudio.

    Ejemplo 2. Consideremos una empresa que posee un gran nmero de sucursales, por ejemplo unacadena de farmacias o supermercados. Se seleccionan al azar cinco de las sucursales y de cada unaellas se extrae una muestra aleatoria de operarios, lo que son encuestados para evaluar la actuacinde los administradores. Las sucursales seleccionadas, pueden ser consideradas como cinco nivelesde un mismo tratamiento. La Gerencia General en este caso, est interesada en el comportamientoglobal de la empresa, lo que incluye a todas las sucursales, de las cuales slo es posible evaluaralgunas dentro de un periodo razonable.

    Ejemplo 3. Otro ejemplo similar es el siguiente: Una empresa pesquera posee 25 embarcaciones.Se desea evaluar la productividad de las naves, para lo cual se seleccionan al azar tres de ellas y surendimiento es evaluado durante un periodo de 30 das. En este caso las tres embarcacionesseleccionadas no son sino una muestra aleatoria de un conjunto mucho mayor de posibles

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    14

    tratamientos en los cuales el dueo de la empresa est interesado. Estos dos ejemplos correspondena lo que llamamos o Modelos de Tipo II Modelos de Efectos Aleatorios.

    2.2. Ideas bsicas referentes al Modelo

    Consideremos un experimento consistente de un slo factor bajo estudio. A cada nivel del factor lecorresponder una distribucin de probabilidades para sus respuestas. As si consideramos objetivode nuestro estudio, la comparacin (y posible inferencia respecto de ellas) de las distribuciones deprobabilidad de cada una de las poblaciones involucradas.

    Respecto de estas distribuciones de probabilidad (de las respuestas), debemos establecer lossiguientes supuestos o restricciones:

    1. Cada una de las distribuciones de probabilidad es normal.2. Cada distribucin de probabilidad tiene la misma varianza.3. Las observaciones correspondientes a cada nivel del factor considerado son observaciones aleatorias provenientes de la distribucin de probabilidades correspondiente y son independientes de las observaciones de cualquier otro nivel.

    En otras palabras, podemos establecer que un modelo completamente aleatorio considera lassiguientes reglas:

    1. Los tratamientos son asignados al azar a las unidades experimentales.

    2. Cada unidad experimental tiene la misma posibilidad de recibir cada tratamiento

    3. La variabilidad intrnseca entre las unidades es mnima.

    Estas condiciones, si bien otorgan mayor flexibilidad al modelo, pueden tambin considerarse,desde el punto de vista prctico, restricciones. Cuando no es posible asegurar que las trescondiciones se cumplen, deberemos buscar otro diseo.

    El diseo ms simple y menos restrictivo que podemos usar puede explicarse como sigue:

    Suponga que tenemos t tratamientos y n>t unidades experimentales en el experimento. Podemosaplicar el primer tratamiento a r unidades aleatoriamente seleccionadas de entre las n unidades,1asignar el segundo tratamiento a r unidades aleatoriamente seleccionada de las restantes n r , y2 1continuar de esta manera hasta que el t-simo tratamiento es asignado a las r unidades restantes. Latnica restriccin que debemos considerar es que antes de asignar los tratamientos, cada unidadexperimental debe tener igual probabilidad de asignarle cualquier tratamiento. Los diseosobtenidos de esta forma son llamados diseos completamente aleatorios .

    Ventajas1.- , cualquier nmero de tratamientos y rplicas pueden ser utilizados. MsFlexibilidad an, el nmero de rplicas en cada tratamiento no necesariamente es el mismo, aunque las comparaciones son ms precisas cuando los tratamientos son igualmente replicados.

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    15

    2.- El an con rplicas desiguales, y no es complicado poranlisis estadstico es simple prdida de los datos u observaciones.3.- Este diseo logra el mximo .grados de libertad para el error4.- El nmero de rplicas puede ser diferente para cada tratamiento.5.- La prdida informacin, en el caso de observaciones perdidas es pequea comparada con otros diseos.

    Desventajas1.- Su precisin es baja si las unidades experimentales no son uniformes. A menudo las unidades pueden ser agrupadas en bloques de unidades homogneas resultando una mayor precisin.2.-Es a menudo ineficiente. En efecto, dado que no se establece ninguna restriccin sobre el proceso de aleatorizacin, el error experimental incluye todas las posibles fuentes de variacin entre las unidades muestrales, excepto aquella debido al efecto del tratamiento.

    Usos1.- Cuando las unidades experimentales son uniformes.2.- Es til cuando una fraccin de las unidades puede no responder o puede estar prdida durante el experimento.3.- Puede ser til para los experimentos en los cuales el total de las unidades es limitado, porque asigna el mximo de grados de libertad al error.

    AleatorizacinEn este diseo los tratamientos son asignados a las unidades experimentales en forma totalmentealeatoria. Hay diversas formas de hacer esto, ya sea numerando las unidades experimentales yponindolas en una caja y extrayendo de sta, en forma aleatoria, los nmeros correspondientes; outilizando nmeros aleatorios.

    2.3 Modelo y supuestos

    2.3.1 Modelo Tipo I o Modelo de Efectos Fijos

    Recordemos que en los modelos tipo I, los resultados son vlidos slo para los tratamientosaplicados a las unidades experimentales. En este tipo de modelos la meta es estimar la media de lostratamientos y las diferencias entre estas medias. En tal situacin el modelo es llamado un modelode efecto fijo y es de la forma

    i=1,...,t j =1,...,rC 34 34

    . &73

    en que j-sima observacin en i-simo tratamiento.C

    34

    es la media de todas las observaciones.. efecto promedio del i-simo tratamiento medido como una desviacin de .7

    3 .

    error aleatorio asociado con la j-sima observacin del i-simo tratamiento.&34

    Los supuestos para este modelo son:

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    16

    1.- son fijos y son medidos como desviaciones respecto de y 0 .7 73

    . !i

    3

    2.- Los pertenecen a una muestra aleatoria de la poblacin que se distribuye normal con media&34

    cero y varianza comn , es decir, N(0, ).5 & 52 234

    2.3.2. Modelo Tipo II o Modelo de Efectos Aleatorios

    Estos modelos se aplican a aquellas situaciones en que los tratamientos se obtienen en base a unamuestra aleatoria de una poblacin de tratamientos similares. Esta forma de seleccionar lostratamientos a aplicar, implica cambios significativos en la forma de interpretar los resultados delanlisis. En efecto, en el caso de los modelos Tipo I, nuestro objetivo es determinar si existendiferencias significativas entre los efectos promedio de estos tratamientos, ello es posible porque elnmero de tratamientos a aplicar es generalmente reducido y adems fijo. .

    El objetivo en este caso es tambin determinar si existen diferencias entre los efectos medios de lostratamientos, pero dado que disponemos de un nmero grande de posibles tratamientos, la hiptesisde igualdad de efectos promedio se puede homologar a la de varianza nula, lo que debe interpretarseconsiderando que si los efectos medios de un nmero cualquiera de tratamientos son iguales, suvarianza debe ser nula. En esta situacin el modelo que tiene la forma

    C 34 3 34

    . 7 &

    donde

    C 34 j-sima observacin en i-simo tratamiento.

    . es la media de todas las observaciones.

    73 es el efecto aleatorio asociado con el i-simo tratamiento.

    error aleatorio asociado con la j-sima observacin del i-simo tratamiento.&34

    Los supuestos para este modelo son

    73, con i = 1,...,t, es una muestra aleatoria de una poblacin de posibles valores de los7

    tratamientos, que se distribuye normal con media cero y varianza comn , esto es,52773 N(0, ).52

    & & 534 34 son errores aleatorios tales que N(0, ). 2

    La diferencia entre los modelos tipo I y tipo II se puede visualizar en los siguientes ejemplosadicionales:

    - Fijo: Un cientfico desarrolla tres nuevos fungicidas. Su inters es solamente en estos tres fungicidas.

    - Aleatorio: El est interesado en la forma de actuar del fungicida. Selecciona al azar tres fungicidas desde un grupo de fungicidas similares para estudiar su accin.

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    17

    - : Medir la tasa de produccin de 5 mquinas en particular.Fijo

    - : Elige 5 mquinas de un grupo de similares caractersticas.Aleatorio

    - : Experimento para obtener informacin acerca de 4 tipos de suelos especficos.Fijo

    - : Seleccionar aleatoriamente 4 tipos de suelo para representar todos los tipos de suelo.Aleatorio

    2.3.3. Notacin Matricial

    Como en el caso de los modelos de regresin lineal, los modelos de diseo experimental, pertenecena la familia de modelos lineales, los que tienen, por tanto, la misma forma bsica que aquellos; esdecir, podemos representar el modelo,

    Y i=1,...,t j =1,...,r34 34 . &7i

    por su forma matricial equivalente

    Y = X + ," %

    Para ilustrar, supongamos un modelo completamente aleatorio de tres tratamientos con cuatrorplicas; es decir,

    Y i=1,...,3 j =1,...,434 3 34 . &7

    por tratamiento, de la siguiente forma:

    = ; X =

    YYYYYYYYYYYY

    ]

    " " !

    11

    12

    13

    14

    21

    22

    23

    24

    31

    32

    33

    34

    !" " ! !" " ! !" " ! !" ! " !" ! " !" ! " !" ! " !" ! ! "" ! ! "" ! ! "" ! ! "

    ; = = " %

    . %

    7

    7

    7

    %

    %

    %

    %

    1

    2

    3

    4

    2

    2

    3

    ""

    "

    "

    "

    "

    "

    %

    %

    %

    %

    %

    %

    %

    22

    23

    24

    3

    32

    33

    34

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    18

    2.3.4. Pruebas de Hiptesis

    De acuerdo a la parametrizacin de nuestro modelo,

    i=1,...,3 j =1,...,4C 34 3 34

    . 7 &

    73, i = 1,...,t, corresponde al efecto promedio del i-simo tratamiento medido como una desviacin

    de . Por lo tanto, una hiptesis razonable a probar en este caso sera que no existen diferencias.entre los efectos medios de los distintos tratamientos aplicados, lo que equivale a establecer que noexisten diferencias significativas entre los valores medios correspondientes las respuestas a los "t"tratamientos.

    Si suponemos, por ejemplo, que t = 3, existe muchas veces la tentacin de responder a la preguntamediante las comparaciones sucesivas

    Ho: = 7 71 2, Ho: = 7 71 3, Ho: = 7 72 3,

    hiptesis que pudieran probarse, simplemente mediante un test T-student o mediante una pruebanoparamtrica. Sin embargo, esta serie de hiptesis no es equivalente a una prueba simultnea deltipo

    Ho: = = 7 7 71 2 3.

    ya que, en el primer caso, si consideramos por ejemplo un error tipo I = para cada una de las!pruebas, el valor resultante despus de aplicadas las tres pruebas involucradas, ser prximo a lasuma de los errores tipo I de cada una de las pruebas. Por este motivo, para probar la hiptesis deigualdad simultnea, que nos asegura un error tipo I = , deberemos desarrollar procedimientos de!prueba diferentes, lo que se logra mediante las Tabla de Anlisis de Varianza.

    El procedimiento a desarrollar aqu, es obtener una particin de la suma de cuadrados de lavariabilidad total de las n*t observaciones, sin considerar el efecto de los tratamientos, y quecorresponde a la suma de los cuadrados de las desviaciones de cada uno de los valores observadosrespecto del promedio general, considerando que,

    Y Y.. ,34 q

    corresponde a la desviacin de cada observacin (independientemente de los tratamientos aplicados)respecto de la media general.

    En la Figura 1, Y.. corresponde efectivamente a la media general y Y corresponde a la observacinq

    21

    1 del tratamiento 2 de un experimento cualquiera, con t tratamientos y r rplicas por tratamiento.

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    19

    Y21

    Y..

    - Y..Yij

    Y22

    Figura 1. Desviaciones totales.

    Y Y corresponde por tanto a la desviacin de la observacin 1 del tratamiento 2, respecto a la12 ..q

    media general de las observaciones medidas o desviacin total.

    La Figura 2, muestra las desviaciones Y Y que corresponden a las desviaciones de los efectosq q

    3. ..promedios de los tratamientos respecto del promedio general. Es claro que un aumento de estasdesviaciones debemos interpretarlo como un mayor efecto diferencial de los tratamientos. En estecaso, las desviaciones del promedio del tratamiento 2 respecto del promedio general.

    Y1.

    Y..

    Y2.

    - Y..Y2.

    Y..

    Figura 2. Desviaciones respecto de los tratamientos.

    Por ltimo, la Figura 3 muestra las desviaciones de cada observacin respecto del promedio de cadatratamiento; esto es, Y Y . Valores mayores de esta diferencia deben interpretarse como un34 3

    q.

    distanciamiento del efecto promedio de los tratamientos y por lo tanto como una indicacin de un"menor efecto" de los tratamientos sobre las unidades experimentales y corresponde a los valoresresiduales del modelo.

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    20

    Y2.- Y2.

    Y..

    Y21

    Yij

    Y21

    Y1.

    Figura 3. Valores residuales

    Ahora bien, tcnicamente tenemos que

    Y Y.. = Y + Y Y Y .34 34 3 3 q q qq

    . . ..

    lo que reordenado queda de la forma

    Y Y.. = Y Y + Y Y .34 343 3 q q qq

    . .. .

    por lo que concluimos que las desviaciones totales corresponden a la suma de las desviacionesrespecto del modelo luego podemos verificar que se cumple que

    De la misma forma, si definimos la suma de cuadrados totales

    SCTO (Y Y.. q!!

    3 434

    2

    que representa la suma de los cuadrados de las desviaciones de cada uno de los valores observadosrespecto del promedio general, independientemente de los tratamientos a los que han sido sometidaslas unidades experimentales, tenemos, de la misma forma. SCTR (Y Y 8

    q q!3

    3 3. ..2

    que representa la suma de los cuadrados de las desviaciones de las respuestas de las unidadesexperimentales sometidas al tratamiento j-simo

    SCE SCTO SCTR (Y Y . q!!

    3 434 3

    2

    se puede verificar que ,

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    21

    SCTO = SCTR + SCE.

    equivalentemente

    (Y Y.. = (Y Y + (Y Y .!! ! !!3 4 3 3 4

    34 3 3 3 3 8 q q q q2 2 2

    . .. j .

    Es claro que esta particin de las sumas de cuadrados es similar a la realizada en el caso de losmodelos de regresin, y similar a la que se realiza para los grados de libertad correspondientes. Sinembargo, a diferencia de los modelos de regresin, en el caso de los modelos de diseoexperimental, es posible y necesario, realizar particiones adicionales.

    De acuerdo con esta particin, tenemos que la SCTR corresponde a la suma de cuadrados de lasdesviaciones respecto de la media de cada tratamiento y que se conoce habitualmente comodesviaciones o error entre tratamientos dentro de, en tanto que la SCE representa las variacioneslos tratamientos, esto es entre rplicas de un mismo tratamiento.

    2.4. Particin de los Grados de Libertad.

    Correspondiente con la suma de cuadrados totales, podemos tambin considerar una particin delos grados de libertad correspondientes. En efecto si tenemos t tratamientos y r rplicas de cada unode ellos, el total de grados de libertad disponible para estimar la suma de cuadrados totales es tr,pero como debemos estimar la media general de las unidades experimentales, perdemos un gradode libertad, por lo que tenemos que la suma de grados de libertad para la suma de cuadrados totalescorresponde a tr "

    La SCTR, tiene un total de t 1 grados de libertad ya que tenemos t tratamientos (o t niveles defactores) y por lo tanto t desviaciones Y Y , pero se pierde un grado de libertad ya que las

    qq

    3. ..

    desviaciones no son totalmente independientes en cuando a que

    n (Y Y = 0.!3

    3 3q

    q

    . ..

    La SCE tiene tr t grados de libertad, ya que depende de Y Y , es decir rt grados de libertad q

    3 3j .

    menos t promedios de tratamientos estimados. Por lo tanto tenemos que

    gl(TO) = gl(TR) + gl(E). tr 1 = t 1 + tr t.

    De acuerdo con estas definiciones, el razonamiento a seguir para probar la hiptesis de igualdad deefecto de los tratamientos, en el caso de modelos tipo I o de efectos fijos; esto es,

    Ho: ...7 7 7" # > Ha: para algn i j; i,j =1,...,t.7 7i j

    es el siguiente:

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    22

    Bajo la hiptesis de igualdad de efectos, los efectos promedio de todos los tratamientos deben sersemejantes entre si y por tanto semejantes al promedio general Y..; luego, una discrepancia entre los

    q

    efectos promedio de los tratamientos debe visualizarse en un mayor valor relativo de la SCTR,comparado con la SCE o suma de cuadrados residuales.

    Luego, para probar la hiptesis de igualdad de efecto promedio entre los tratamientos, contrastamoslos valores de la SCTR y SCE mediante el test F siguiente

    F CMTRCME f t , t(r )" "

    En que CMTR corresponde al promedio de los cuadrados de las desviaciones de los tratamientosrespecto de la media total, considerando sus grados de libertad correspondientes, lo mismo paraCME.La distribucin del estadstico F est garantizada por Teorema de Cochran que establece que si las

    variables aleatorias Y son iid, entonces y son dos variables aleatorias Chi-cuadradoijSCTR SCE5 52 2

    independientes, luego la variable aleatoria

    F = SCTR2 tSCE SCE

    2 tr t

    SCTRt

    tr t

    5

    5

    "

    "

    = f t , t(r )" "

    pues corresponde al cuociente entre dos variables aleatorias Chi-cuadrado divididas por susrespectivos grados de libertad.

    El test F anterior, es particularmente interesante de analizar respecto de su interpretacin prctica.En efecto, si F>>1.0, significa que las diferencias de los promedios de los tratamientos respecto delpromedio general, son en general mayores que las variaciones entre las unidades experimentalessometidas al mismo tratamiento, luego deberamos pensar que la muestra de considerada contieneevidencia en contra de la hiptesis de igualdad de efectos promedio. Por el contrario si F es prximoa 1, deberamos concluir que las diferencias entre los efectos promedios no superan las diferenciasaleatorias de las respuestas de las unidades experimentales dentro de cada tratamiento y deberamosconcluir, por tanto, que la muestra no contiene evidencia en contra de la hiptesis de igualdad deefectos promedio.

    No obstante lo anterior, el mismo argumento puede ser utilizado para aquellos casos en los que, apesar de visualizarse una diferencia muy marcada entre los niveles promedio de los tratamientosutilizados, las pruebas estadsticas utilizadas, en particular el test F antes citado, indican que noexiste diferencia significativa entre los promedios comparados. Ello puede deberse, como hemosvisto, no slo a pequeas diferencias entre los promedios calculados para los tratamientos, sino auna alta variabilidad de las unidades experimentales utilizadas "al interior" (como rplicas) de cadatratamiento. El argumento inverso es tambin vlido.

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    23

    2.5. Anlisis de Varianza

    Los resultados anteriores, se pueden resumir en la siguiente tabla, similar a aquella utilizada para losmodelos de regresin.

    Y rendimiento de la j-sima unidad para el i-simo tratamiento.34

    Y Y total de los rendimientos para el i-simo tratamiento.3 344

    ! Y Y Y gran total de todos los rendimientos. ! !!

    3 3 43 34

    Y Yq q

    3 Y Yr3 ;

    Note que Y es un estimador del rendimiento medio del i-simo tratamiento .q3 .i

    Tabla 1. Tabla de Anlisis de Varianza para un Modelo Completamente Aleatorio, de efectos fijos, con igual nmero de rplicas.

    F.de G. de Suma de Cuadrados S. de C. EsperadosVar. Libertad Cuadrados Medios F

    Trats SCTR= n Y Y CMTR > " q q! 3 3 SCTR n>"

    52! 3 3 . .

    < " q

    >< " q

    !!

    3 34 3

    3 34

    52

    donde

    SCTO (Y Y.. q!!

    3 434

    2

    SCTR (Y Y 8 q q!

    33 3. ..

    2

    SCE (Y Y SCTO SCTR q!

    334 3.

    2

    CMTR CSCTR>"

    CME SCE>

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    24

    con , t( ) g.l. es el estadstico para probar la hiptesisJ > " < "CMTRCME

    ...L9 7 7 7" # > a para algn i j.L 7 7i j

    Esta columna, nos permite tambin visualizar el tipo de test que es apropiado para probar cada unade las hiptesis.

    Ejemplo. Un investigador desea determinar la incidencia de la concentracin de Pb sobre uncriadero de A. Ater. Para este efecto, dispone de 20 estanques donde somete ensayo un nmero fijode individuos de esta especie, asignando cinco estanques por concentracin. Despus de un ciertoperiodo de prueba, se determin el nmero de individuos muertos por estanque, los que se muestranen la tabla siguiente.

    Tabla 2. .Tabla de Resultados de individuos muertos por estanque

    conc. est1 est2 est3 est4 est5 n Y Y_

    1 11 17 16 14 15 5 73 14.62 12 10 15 19 11 5 67 13.43 23 20 18 17 19 5 78 19.54 27 33 22 26 28

    i i. i.

    5 136 27.2

    Veamos ahora lo que se obtiene al utilizar el procedimiento PROC GLM de SAS, para ajustar elmodelo recin visto, con los mismos datos. Este procedimiento requiere, para ejecutarse, de slo doslneas especiales:

    CLASS en la que se especifican los tratamientos o cualquier tipo de agrupacin o clasificacin delas observaciones, y

    MODEL, en la cual se especifican los componentes del modelo, los que se determinan segn laparticin de los grados de libertad que se desee realizar.

    Los comandos correspondientes de SAS son los siguientes.

    data ejemplo1;input trat $ repl resp;cards; cc1 1 11 cc1 2 17 cc1 3 16 cc1 4 14 cc1 5 15 cc2 1 12 cc2 2 10 cc2 3 15 cc2 4 19 cc2 5 11 cc3 1 23 cc3 2 20 cc3 3 18 cc3 4 17 cc5 5 19 cc4 1 27 cc4 2 33 cc4 3 22 cc4 4 26 cc4 5 28 run;

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    25

    options pagesize=4500 linesize=80; proc glm; class trat; model resp=trat; run;

    La tabla de anlisis de varianza correspondiente es la siguiente: The GLM Procedure

    Dependent Variable: RESP Sum of Source DF Squares Mean Square F Value Pr > F Model 3 588.1500 196.0500 19.80 F TRAT 3 588.1500000 196.0500000 19.80

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    26

    2.6 Nmero de Rplicas Diferentes Para Cada Tratamiento

    Si los tratamientos no tienen igual nmero de replicas, ya sea por el diseo o debido a que se hanperdido unidades durante el experimento, para el anlisis deberemos hacer modificaciones menores,las que se indican en el siguiente ejemplo, continuacin del anterior.

    Anlisis de varianzaConsideremos la Tabla 5.2 en la que hemos suprimido dos observaciones.En el ejemplo anterior, supongamos que hemos perdido, por razones desconocidas, dosobservaciones, una en la concentracin 1 y otra en la concentracin 3, para obtener los siguientesresultados.

    Tabla 3. Resultados de individuos muertos por estanque con dos observaciones perdidas.

    conc. est1 est2 est3 est4 est5 n Y Y_

    1 11 17 16 14 ---- 4 58 14.52 12 10 15 19 11 5 67 13.43 23 20 18 17 ---- 4 78 19.54 27 23

    i i. i.

    22 26 28 5 136 27.2

    Los comandos y resultados, utilizando el programa SAS, son los siguientes.

    The GLM Procedure

    Dependent Variable: RESP Sum of Source DF Squares Mean Square F Value Pr > F Model 3 574.5000000 191.5000000 16.97 F TRAT 3 574.5000000 191.5000000 16.97

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    27

    Dependent Variable: RESP Sum of Source DF Squares Mean Square F Value Pr > F Model 3 588.1500000 196.0500000 19.80

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    28

    2.8 Inferencias para la Diferencia entre Efectos Promedio de Dos Tratamientos (factores)

    An cuando el objetivo de estos estudios no es precisamente el comparar dos niveles de factores odos tratamientos especficos, podemos plantearnos hiptesis especficas de la forma, Ho: = 7 7i j, Ha: para algn i j.7 7i j

    En este caso la comparacin se realiza exactamente en la forma que se procede para una prueba t-student, teniendo en consideracin los resguardos antes mencionados respecto de los tamaosmuestrales asociados a la sensibilidad de la prueba. En efecto, es posible realizar esta prueba sinrecurrir directamente al estadstico T, sino que proceder directamente a travs del anlisis devarianza recin estudiado.

    En efecto, revisemos el siguiente ejemplo.

    Ejemplo. Se desea comparar el efecto de dos tipos de aditivos vitamnicos en la dieta de salmonesen un cultivo. Para este efectos se seleccionan, desde dos piscinas separadas donde se mantienenuna gran cantidad de peces, dos muestras aleatorias independientes de tamaos n = 8 para el aditivoAA y n = 10, para el otro aditivo, con los siguientes resultados.B

    n = 766; 797; 769; 748; 748; 724; 757 ; 743 yA n = 762; 783; 763; 749; 806; 783; 831; 784; 790; 750B

    los resultados en gr por individuo respectivamente. Suponiendo que estas observacionescorresponden a dos muestras aleatorias independientes de variables normales con la mismavarianza, deseamos probar la hiptesis de que el efecto de ambos tratamientos es equivalente; estoes,

    H : = vs.! FE. . H : .a . .E F

    De los datos obtenemos:

    x = 756.5 ; x = 780.1; S = 467.14; S = 653.88_ _

    A B2 2A B

    De este modo, la estadstica de prueba (4) queda definida de la forma

    T _ _

    ( )S

    B B12

    #

    : " "" #n n T =

    _ _B B1

    #

    ( ) " "" # " #

    " " ##

    n n n +n 2

    (n S +(n 1) S1 22

    t #n +n1 2

    luego, de los datos tenemos que

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    29

    var( ) _ _B B 1 # ( ) " "

    " 8 10 8+10 2

    (8 467.14+(10 1)653.88 = 0.225*572.18 = 128.74luego,

    T = = 2.080.obs 756.5 780.1128.74

    lo que nos da un valor-p = 2x0.0269 = 0.0539.

    Revisemos ahora estos resultados del anlisis de varianza mediante SAS.

    data disenho;input resp trat;cards;766 1 797 1 769 1 748 1 748 1 724 1757 1 743 1 762 2 783 2 763 2 749 2806 2 783 2 831 2 784 2 790 2 750 2;run;proc glm;class trat;model resp = trat; run;

    Procedimiento GLMVariable dependiente: resp Suma de Cuadrado de Fuente DF cuadrados la media F-Valor Pr > F Modelo 1 2475.37778 2475.37778 4.33 0.0540 Error 16 9154.90000 572.18125 Total correcto 17 11630.27778

    R-cuadrado Coef Var Raiz MSE resp Media 0.212839 3.108104 23.92031 769.6111

    Cuadrado de Fuente DF Tipo I SS la media F-Valor Pr > F trat 1 2475.377778 2475.377778 4.33 0.0540

    Vemos que efectivamente el valor Tobs = 2.080, con v-p = 0.0539 de modo queT 2.080 4.326, valores similares a los recin obtenidos.# #obs

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    30

    2.9 Modelo de Efectos Aleatorios

    Consideremos nuevamente el modelo anterior, para un diseo completamente aleatorio, el que tenala forma Y .

    34 . 7 &

    3 ij

    A diferencia del modelo anterior, en este caso, por tratarse de un modelo de efectos aleatorios,hemos visto que los tratamientos seleccionados son una muestra aleatoria del conjunto de lostratamientos posibles, lo que incorpora una componente de variabilidad adicional que deseamosestimar. Consideremos entonces nuevamente el modelo

    Y i=1,...,t j =1,...,r34 . 7 &

    3 34

    donde

    N( , ) y N(0, )7 5 & 53 !

    indep indep 7 %

    2 234

    Adicionalmente, y son variables aleatorias independientes tales que,73 34

    &

    E Y Var Y ! ij ij 5 5 5#Y

    2 2 7 % .

    Dado que la varianza d Y tiene dos componentes, este modelo recibe tambin el nombre de/ ijModelo de Componentes de Varianza.

    Cuando el modelo para efectos aleatorios es apropiado, no existe realmente inters en probar lasignificatividad de algn valor particular (nivel) del factor asociado a los tratamientos, ni deestablecer que valor del tratamiento tiene el mayor efecto, ni que niveles del factor son los quedifieren entre si, sino ms bien es de inters realizar inferencias sobre la poblacin completa devalores que pueda asumir el factor, particularmente en el valor promedio de los tratamientos y suvarianza.

    Por otra parte , aun cuando es una medida directa de la variabilidad de los tratamientos, el efecto57de dicha variabilidad se mide ms significativamente relativo a la variabilidad total de Y; esto es,

    5

    572

    Y#

    55 5

    7

    7 %

    2

    2

    Esta razn mide la proporcin de la variabilidad total de Y que es explicada por la varianza de572

    los tratamientos y toma el valor 0 cuando = 0 y el valor 1 cuando es muy grande relativa a la5 57 72 2

    variabilidad del error.52%

    De acuerdo con lo anterior, una prueba de hiptesis razonable de probar en esta instancia es

    H : = 0o 2 57 H : > 0a 2 57

    En este caso, si Ho es verdadero, concluimos que la variabilidad de los tratamientos es nula y por lotanto no existen diferencias entre ellos, lo que es equivalente a afirmar que no hay efecto detratamientos en el modelo. Hiptesis que es equivalente, en su interpretacin, a la que se prueba en

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    31

    el caso de los modelos de efectos fijos, mediante el test F habitual. Para estudiar esta prueba,analicemos la forma de la Tabla de Anlisis de Varianza correspondiente al modelo.

    A pesar de las diferencias con el modelo de efectos fijos, el anlisis de varianza para el caso de sloun factor se conduce aqu en la misma forma (lo que no ocurre necesariamente en situaciones mscomplejas), por lo que si = 0 ambos CM tienen el mismo valor esperado, indicando que no57

    2

    existe evidencia en contra de la hiptesis H : = 0, luego, valores ms altos del test F = o 2 57CMTRCME

    indican mayor evidencia en contra de esta hiptesis.

    Tabla 4. Tabla de Anlisis de Varianza para un Modelo Completamente Aleatorio, de efectos aleatorios.

    Fuente de Grados de Suma de Cuadrados C. M. EsperadosVariacin Libertad Cuadrados Medios

    Trats SCTR CMTR

    Error

    J

    > "

    ><

    5 5% 72 2 TR r CMCME

    "

    >< "

    SCE CMETotal SCTO

    5%2

    Estimacin de las componentes de Varianza.Hemos visto que el modelo

    i=1,...,t j =1,...,rC 34 3 34

    . 7 &

    tiene dos componentes de su varianza; esto es,

    Var Y . ij 5 5 5#Y

    2 2 7 %

    Vimos tambin, que el CME nos proporciona una estimacin directa de la varianza del error y52%que por su parte, el CMTR nos proporciona una estimacin de r . Por lo tanto reemplazando,5 5% 7

    2 es posible obtener los estimadores respectivos

    = CME y ^ ^5 52 2% 7 =

    CMTR CMEr .

    Eventualmente, este estimador puede resultar negativo, como eso no es aceptable, en tales casos, seasume que la varianza de los tratamientos es cero.

    Ejemplo. Una empresa pesquera desea evaluar el rendimiento de su flota. Se sospecha que granparte de las variaciones de la captura se deben a las diferentes capacidades de sus capitanes. Paradeterminar si existe un efecto debido a este factor, se seleccionan al azar una muestra de cuatrocapitanes, los que son sometidos a estudio (de sus capturas) durante un periodo determinado. Cadauno realiza un total de cinco salidas de pesca, con lo siguientes resultados.

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    32

    c/s 1 2 3 4 5I 124 135 153 143 158II 144 165 139 167 189III 134 145 154 161 137IV 189 195 202 210 179

    Los comandos SAS correspondientes a un modelo completamente aleatorio, de efectos aleatoriosson los siguientes.data aleat1; input cap repl capt; cards;1 1 124 1 2 135 1 3 153 1 4 143 1 5 1582 1 144 2 2 165 2 3 139 2 4 167 2 5 1893 1 134 3 2 145 3 3 154 3 4 161 3 5 1374 1 189 4 2 195 4 3 202 4 4 210 4 5 179;run; options pagesize = 70;proc glm; class cap repl; model capt=cap; random cap / test;run;

    Obsrvese que a continuacin del comando MODEL, se especifica que el factor CAPITAN (capt),es de naturaleza aleatoria, lo que permite que SAS realice los tests adecuados al modelo, lo que,recordemos, en el caso de modelos de slo un factor (pero slo en este caso), coinciden con los deun modelo de efectos fijos.

    En este caso la salida de SAS correspondiente al modelo solicitado es la siguiente.

    The GLM Procedure Class Levels Values cap 4 1 2 3 4 repl 5 1 2 3 4 5 Number of observations 20

    Dependent Variable: capt Sum of Source DF Squares Mean Square F Value Pr > F Model 3 8567.75000 2855.91667 13.29 0.0001 Error 16 3438.80000 214.92500 Corrected Total 19 12006.55000

    R-Square Coeff Var Root MSE capt Mean 0.713590 9.097313 14.66032 161.1500 Source DF Type I SS Mean Square F Value Pr > F cap 3 8567.750000 2855.916667 13.29 0.0001

    Tests of Hypotheses for Random Model Analysis of Variance

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    33

    Dependent Variable: capt

    Source DF Type III SS Mean Square F Value Pr > F cap 3 8567.750000 2855.916667 13.29 0.0001 Error: MS(Error) 16 3438.800000 214.925000

    De acuerdo con lo anterior, las componentes de varianza de este modelo son

    = CME = 5^2% 214.925

    = 528.198.5^72

    = CMTR CMEr 5 = 2855.9167 214.925

    Luego, como la varianza total estimada es

    Var Y , tenemos ij Y2 25 5 5# 7 %

    214.925 528.158

    = 743.123.

    Este resultado nos indica que el 71.08% de la varianza del modelo depende de las diferencias entrecapitanes. Luego concluimos que el efecto capitn es significativo al momento de evaluar eldesempeo de la flota pesquera.

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    34

    3. Diseo en Bloques Aleatorios Completos

    Recordemos que un diseo completamente aleatorio se caracteriza por la asignacin de lostratamientos al azar en las unidades experimentales sin ningn tipo de restriccin. Esta es siempreuna tcnica vlida aunque rara vez es adecuada, debido a que generalmente resulta poco probableencontrar el nmero necesario de unidades experimentales homogneas, como para que el procesode aleatorizacin irrestricto exigido por el modelo completamente aleatorio, sea realizado a enterasatisfaccin. Si conocemos algo sobre el material que se est usando, o la naturaleza u origen de lasunidades experimentales, es preferible agrupar stas dentro de grupos o bloques, de unidadeshomogneas, y entonces comparar los tratamientos en las unidades dentro de los bloques. De estamanera, diferencias entre bloques pueden ser eliminadas del error experimental con una ganancia enla precisin.

    Esta ltima observacin es de gran importancia, pues resume el objetivo de un diseo en bloques;esto es, eliminar el efecto que ciertas caractersticas de las unidades experimentales, que hacen queellas sean no homogneas, puedan tener sobre las respuestas. Por este motivo resulta inconveniente,utilizar el cuadrado medio asociado a los bloques (CMB), para ser contrastado con el CME y asobtener un test para medir la significatividad de los bloques. La fundamentacin correspondiente, esque slo es posible medir efectos de tratamientos o factores para los cuales se ha realizado algntipo de aleatorizacin, lo que no ocurre en el caso de los bloques, pues estos han sido seleccionadoarbitrariamente, tratando de que las unidades dentro de los bloques sean lo ms homogneas posibley que su vez se maximice la variabilidad entre bloques. Por este mismo motivo, es un errorfrecuente considerar a las rplicas de los tratamientos como bloques, pues en esencia, las rplicas seaplican sobre unidades lo ms homogneas posible, lo que es justo lo opuesto de la definicin debloque. Frecuentemente tambin, y por las razones recin expuestas, se define como factor debloqueo a alguna caracterstica que es propia de las unidades experimentales que influye sobre lavariable respuesta, pero cuyo efecto queremos eliminar del anlisis; es decir, se bloquea el factorque no deseamos que participe en el experimento.

    Existen diferentes formas o criterios para agrupar las unidades dentro de un bloque, por lo queadems debemos considerar las siguientes proposiciones cuando bloqueamos

    1.- La precisin generalmente decrece cuando el tamao; es decir, el nmero de unidades por bloque, crece.2.- En los experimentos agrcolas con un criterio de bloques poco claros, bloques cercanos a los cuadrados han sido ms efectivos que bloques de otra forma.

    3.- Si los gradientes, tales como pendiente, fertilidad, o tendencia en el tiempo, existen en situaciones experimentales, entonces los bloques deberan ser ms largos y estrechos y deberan ubicarse perpendicular al gradiente.

    4.- La clave del xito de los bloques, es que minimizan la varianza entre unidades dentro de los bloques, mientras que maximiza la varianza entre bloques.

    5.- En algunas disciplinas, particularmente en la agricultura, los trminos 'bloques' y 'rplicas' son usados indiferentemente. En el estricto sentido esto no es vlido porque la replicacin es solamente la repeticin de los tratamientos en un experimento, mientras bloquear significa solamente agrupar las unidades.

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    35

    6. Las unidades experimentales que se agrupan en un bloque, no tienen necesariamente prximas unas a otras, en el sentido geogrfico, ya que su similitud no deriva de dicha proximidad sino de la semejanza de las caractersticas que estn relacionadas con la variable respuesta.

    3.1. Caracterizacin del Modelo

    Este es probablemente el modelo ms utilizado en diseo de experimentos, dado que con frecuenciael mayor problema que enfrentamos, es el de encontrar un nmero suficientemente grande deunidades experimentales homogneas, lo que nos fuerza a agruparlas en bloques, a fin de removerposibles diferencias entre ellas y que pudieran estar asociadas con la respuesta. Por lo tanto, estemodelo constituye una solucin al problema de no disponer de un nmero adecuado de unidadesexperimentales equivalentes y por lo tanto estar bajo el peligro de incluir en el anlisis fuentes devariacin que no deseamos estimar.

    Podemos decir entonces, que el objetivo de un diseo en bloques, es el de eliminar el efectos defactores que pueden afectar la respuesta pero que no estn en el marco de la investigacin (no nosinteresan). Esto significa que, enfrentados al problema de la aleatorizacin, estos factores noparticipan de ella y por lo tanto sus efectos no son estimables. Lo anterior no elimina la necesidadde, en cada caso, verificar las condiciones de aditividad, constancia de los efectos de lostratamientos y de no interferencia.

    En cuanto a la aleatorizacin, vimos que en el caso de modelos completamente aleatorios, laaleatorizacin era irrestricta y sujeta slo a la disponibilidad de unidades experimentales. En el casode los diseos en bloques, la aleatorizacin est sujeta slo a la condicin que cada bloque debeincluir a cada uno de los tratamientos bajo estudio. En otras palabras, cada bloque debe sertratado como modelo completamente aleatorio.

    Al igual que en el caso de los test t-pareados, el objetivo del bloqueo es entonces reducir la varianzadel error, agrupando y tratando en forma equivalente, a aquellas unidades que son ms parecidas.

    AleatorizacinPara construir un diseo en bloque aleatorio con tratamientos cada uno replicado veces se> "

    B

    TR

    Donde . J TRCMTRCME t , (t 1)(r ) 0 " "

    Las hiptesis a probar por F dependen de si los tratamientos son fijos o efectos aleatorio. Por loTRgeneral en diseo de experimento los tratamientos son fijos. En este caso F prueba la hiptesisTR

    L9 !7 7 7" # > para algn i.L !" 7i

    Esta es una prueba de significacin de la diferencia entre las medias de los tratamientos.

    La tabla de ANOVA anterior nos permite probar la hiptesis de equivalencia entre los efectos de lostratamientos. Sin embargo, es posible adems extraer algunas conclusiones a partir de la

    construccin de una razn del tipo . Para este efecto analicemos la razn F siguiente CMB

    CME

    FB CMB

    CME r , (t 1)(r ) 0 " "

    En primer lugar debemos notar que la aleatorizacin se realiz slo al interior de los bloques y noentre ellos. Esto significa que en rigor no estamos en condiciones de probar la hiptesis deequivalencia entre los bloques. En efecto, esta hiptesis no ha sido planteada y si queremosconsiderar al factor de bloque como a un factor que debe ser analizado, deberamos considerarlo enel momento de proceder a la aleatorizacin de los tratamientos luego, las siguientes consideracionesdeben ser tenidas en cuenta para el anlisis de la informacin. Por lo tanto, las siguientesconsideraciones no tienen validez desde un punto de vista inferencial sino deben ser consideradasslo referenciales.

    En primer lugar debemos recordar que la definicin de los bloques se bas en el supuesto que ellosagrupaban a unidades reconocidamente semejantes pero diferentes para cada bloque, por lo que seespera que las diferencias entre bloques sean grandes. Esto significa que valores F relativamentegrandes para diferencias entre bloques podran indicar, de acuerdo a lo anterior, una ganancia enprecisin respecto del mismo experimento pero analizado como un MCA. Dicho de otra formavalores altos de la estadstica F asociada con los bloques seran una indicacin que efectivamente elbloqueo fue bien realizado. Sin embargo, dado que este resultado no est basado en unaaleatorizacin, no debera ser posible concluir

    En el diseo de bloques aleatorios controlamos una fuente de variacin agrupando las unidadesexperimentales dentro de bloques de unidades ms o menos homogneas con respecto a la fuente devariacin. Diferencias entre los bloques son sacadas del error experimental. El requisito es que todoslos tratamientos deben estar igualmente en todos los bloques, esto constituye una restriccin en la

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    38

    asignacin de los tratamientos en las unidades experimentales. Sin embargo, este hecho permite quecada bloque sea considerado como una rplica de todos los tratamientos.

    En muchos casos nos gustara tener control de dos o ms fuentes de variacin. No podemos haceresto con los diseos en bloques aleatorios sin usar una fuente como un factor bloqueador y la otrafuente como variable concominante en un anlisis de covarianza.

    Ejemplo. Un agrnomo deseaba comparar el efecto de cinco diferentes fuentes de nitrgeno en elrendimiento de cebada seca destinada a forraje. Las cinco fuentes fueron:

    1. 2. 3. (NH ) SO NH NO CO(NH )4 2 4 4 3 2 2 4. 5. 6. Ca(NO ) NaNO Control (sin N)3 2 3

    Utilizando tambin, un control sin nitrgeno. Debido a que deseaba que sus resultados fueranaplicables a un amplio rango de condiciones, y no contaba adems con un nmero suficiente deunidades experimentales, debi conducir el experimento en cuatro tipos de suelo. Para su diseoexperimental eligi bloques aleatorios en que el tipo de suelo era el factor de bloqueo, por lo que sedefinieron seis parcelas en cada uno de los cuatro tipos de suelo y luego se asignaron aleatoriamentelos tratamientos a la parcelas dentro de cada bloque. Los resultados observados del rendimiento decebada, para este experimento se encuentran en las tablas siguientes.

    Tabla 6. . Rendimiento de cebada por tratamiento y por bloque

    Tipo de SueloTrat. I II III IV Total Media

    1 32.1 35.6 41.9 35.4 145.0 36.252 30.0 31.5 37.1 30.8 129.5 32.383 25.4 27.4 33.8 31.1 117.7 29.424 24.1 33.0 35.6 31.4 124.1 31.025 24.1 33.0 35.6 31.4 124.1 31.026 23.2 24.8 26.7 26.7 101.4 25.35

    Total 161.0 183.3 208.9 187.3 740.5Media 26.83 30.55 34.82 31.22 30.85

    Los comandos SAS para el modelo en bloques, y el output correspondiente, considerando estosmismos datos son los siguientes:

    DATA BLOQUES1; INFILE 'BLOQUES1.PRN'; INPUT BLOQUE $ TRAT RESP;RUN;

    OPTIONS PAGESIZE=4500 LINESIZE=80;

    PROC GLM; CLASS BLOQUE TRAT; MODEL RESP = BLOQUE TRAT;RUN;

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    39

    Class Level Information Class Levels Values BLOQUE 4 A B C D TRAT 6 1 2 3 4 5 6 Number of observations 24

    The GLM ProcedureDependent Variable: RESP Sum ofSource DF Squares Mean Square F Value Pr > FModel 8 478.9883333 59.8735417 16.59 FBLOQUE 3 224.0512500 74.6837500 20.70

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    40

    B = Suma de los valores del bloque donde falta la observacin.T = Suma de los valores para el tratamiento perdido en los otros bloques.G= Gran total, considerando todos los valores observados para todos los bloques y tratamientos.r y t son el nmero de rplicas y tratamientos respectivamente.

    Luego de estimado el valor faltante, se realiza el anlisis de varianza en la forma habitual, slo quedeben disminuirse los grados de libertad del total en un grado de libertad por cada observacinestimada.

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    41

    4. Diseo en cuadrado latino y greco latino

    Los diseos que se muestran a continuacin, son en general de uso limitado, pero su utilidad sedemuestra en presencia de factores adicionales de bloqueo; es decir cuando estamos en presencia dems dos o ms factores que afectan la respuesta, pero que no estamos interesados en que participendel experimento.

    4.1 Cuadrado LatinoEn el caso de los diseos en bloques, vimos que el objetivo principal era eliminar el factor debloqueo, como fuente de variabilidad, desde el error experimental. Sin embargo, existenexperimentos en los cuales es necesario remover simultneamente ms de una fuente de variacin,como puede ser por ejemplo el caso de diseos en los cuales se sobreponen dos o ms gradientesasociados con la respuesta. Un diseo que controla dos fuentes de variacin como las descritas es eldiseo en el que consiste bsicamente en arreglar las unidades experimentales, enCuadrado Latino, filas y columnas de acuerdo con las direcciones de los gradientes indicados.

    Para construir un diseo en cuadrado latino con t tratamientos requerimos t unidades2

    experimentales, ya que es necesario arreglar las unidades en tantas filas y columnas comotratamientos haya. Estas unidades son primero clasificadas dentro de t grupos, de t unidades cadauna, basada en una fuente de variacin. Esta es comnmente llamada la clasificacin .fila o renglnLas unidades son entonces clasificadas dentro de t grupos, tambin de t unidades cada una, base dela segunda fuente de variacin. Esta se llama comnmente la clasificacin . Loscolumnatratamientos entonces son asignados de tal forma que cada tratamiento ocurre una sola vez, y slouna vez, en cada regln y columna.

    El patrn bsico de un cuadrado latino puede ser considerando un diseo, como se muestra en lafigura siguiente, para t = tratamientos y en un cuadrado de x4. Note que en la figura% E F G H %cada rengln y cada columna forman un bloque completo y que cada tratamiento ocurre una solavez, en cada fila y columna. La base del cuadrado latino para cualquier nmero t de tratamientos esfcil de construir. Tomemos a modo de ejemplo un diseo en cuadrado latino de 4x4:

    Diseo bsico de un diseo de Cuadrado Latino 4x4.

    ColumnasRegln 1 2 3 4

    1 A B C D2 B C D A3 C D A B4 D A B C

    Si bien este diseo tiene la forma clsica de un diseo en cuadrado latino, la disposicin fsica nonecesariamente debe ser la mostrada, ya que la misma puede estar dispuesta, por ejemplo, de lasiguiente forma:

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    42

    A B C D C D A B B C D A D A B C

    GRAD. GRAD. GRAD. GRAD.

    BLOQUE I BLOQUE II BLOQUE III BLOQUE IV

    SENTIDO DEL GRADIENTE GENERAL

    En este caso la disposicin de las unidades en bloques de cuatro tratamientos, a lo largo de ladistribucin, permite, por ejemplo, controlar las variaciones, en el sentido de la gradiente pero almismo tiempo, controlar variaciones dentro de cada bloque. Lo anterior significa, al igual que en elcaso de los factores de bloqueo, que la proximidad fsica no es lo que define el proceso dealeatorizacin, sino los criterios que establecen los gradientes que se desea eliminar delexperimento, los que no son necesariamente geogrficos.

    Un procedimiento para asignar los tratamientos a las unidades experimentales es, por ejemplo, elsiguiente:

    1.- Designar los tratamientos por las primeras t letras del alfabeto.2.- Asignar las letras en orden alfabtico empezando con la A para las unidades en el primer rengln.3.- En el segundo y reglones sucesivos, desviar las letras una unidad a la izquierda de cada rengln sucesivo.

    Ventajas1. Es un diseo relativamente simple de instalar, (en cuanto a su aleatorizacin) pues sta se realiza en laboratorio, antes de llevarla a terreno y, en la mayor parte de los casos es posible encontrar la aleatorizacin predefinida en textos.2. Permite al experimentador el control (eliminar del anlisis) de dos fuentes de variacin simultneamente.3. Se puede usar, bajo ciertas condiciones, como una herramienta exploratoria para determinar la existencia de gradientes o de factores que pudieran influir sobre la respuesta.

    Desventajas.1. Requieren de t unidades para estudiar t tratamientos. Este nmero lmite de2

    tratamientos, desde el punto de vista prctico es de 10 o un poco ms.2. En la medida que el nmero de tratamientos aumenta, el error experimental por unidad es probablemente creciente.3.- S t es pequeo los grados de libertad para el error es muy pequeo. En la prctica esto significa que un diseo de tipo 3X3, por ejemplo, tiene muy pocos grados de libertad para estimar el error experimental.4.- El anlisis es complicado si hay datos perdidos o si los tratamientos se extravan.

    En este caso es conveniente utilizar la siguiente expresin para estimar las observaciones faltantes.

    y = ijkl >VGX #K

    >">#

    donde

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    43

    t= nmero de tratamientos R= total de la fila donde falta la observacin C= total de la columna donde falta la observacin T= total del tratamiento donde falta la observacin G= total general.

    5. Si existe algn tipo de interaccin entre los efectos asociados a filas y columnas, el diseo no puede ser utilizado.

    4.2. Modelo y Supuestos

    1.- El modelo que describe una observacin de un diseo en Cuadrado Latino es

    C 3 56 3j . 7 3 # &4 5 3456

    donde rendimiento de la unidad en el j-simo rengln, k-simo columna para el i-C

    3546

    simo tratamiento. una caracterstica del efecto en el i-simo tratamiento.7

    3

    es la media de todas las observaciones.. adiciona el efecto comn en el j-simo rengln.34 adiciona el efecto comn en el k-simo columna.#5 error aleatorio.&

    34 6k

    En el Cuadrado Latino los reglones y las columnas son invariablemente usados para controlar elerror. Aqu estos son efectos aleatorios y hacemos los siguientes supuestos:

    N(0, ), N(0, ).3 5 # 54 5 2 23 #

    2.- En diseo de experimento los tratamientos son generalmente fijos o aleatorios. Para los tratamientos fijos suponemos que los son medidos como desviaciones de y 7 .

    i

    !3

    73 !

    3.- Ocasionalmente los son variables aleatorias, en estos casos se supone que73

    N(0, ).7 53

    27

    4.- son siempre aleatorios, y N(0, ).& & 534 6 34 6k k

    2

    Tabla 7. Tabla de Anlisis de Varianza para el diseo en Cuadrado Latino

    F. de Variacin G. de Libertad S. Cuadrados C. Medios FRengln SCR CMR FColumna SCC CMC F

    Tratamientos SCTR CMTR FError Experim

    > "> "> "

    R

    C

    TR

    ental 2 SCE CMETotal

    > " >

    > "#

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    44

    Donde F CMR CME R > " > "> # 16 F CMC CME C > " > "> # 16 F CMTR CMETR > " > "> # 16

    Las hiptesis a probar por dependen de si los tratamientos son fijos o efectos aleatorio. Por loJ-

    general en diseo de experimento los tratamientos son fijos. En este caso prueba la hiptesisJ-

    L9 !7 7 7" # > para algn L !" 7i i=1, 2,..., t

    Ejemplo. Una investigacin sobre las tallas de choro zapato ( considera quechoromytilus chorus)factores como la profundidad y la latitud de los bancos pudiera influir sobre las tallas de stos, porlo que se decide considerarlas como posibles factores de bloqueo. En este caso los tratamientosfueron la interaccin del choro zapato con cinco especies de mytilidos. Sp1, Sp2, Sp3, Sp4, y Sp5(A, B, C, D y E). Se decidi usar un diseo de cuadrado latino con la latitud como columnas yprofundidad como filas. Despus de un tiempo se midieron los individuos con los siguientesresultados.

    Norte Sur

    Arriba

    A B D C E

    D E B A C

    C D A E B

    E A C B

    33.8 33.7 30.4 32.7 24.4

    37.0 28.8 33.5 26.7 33.4

    35.8 35.6 36.9 26.7 35.1

    33.2 37.1 37.4 38.1 34.1

    34.8 39.1 32.7 32.7 36.4

    D

    B C E D A

    Abajo Rengln x Columna

    Reglones Columnas(Norte Sur)(Arriba, Abajo) 1 2 3 4 5 Total

    1 33.8 33.7 30.4 32.7 24.4 155.0 2 37.0 28.8 33.5 34.6 33.4 167.3 3 35.8 35.6 36.9 26.7 35.1 170.1 4 33.2 37.1 37.4 38.1 34.1 179.9 5 34.8 39.1 32.7 37.4 36.4 180.4

    Total 174.6 174.3 170.9 169.5 163.4 852.7

    Revisemos ahora el procedimiento SAS para los datos anteriores.

    DATA CUADRLAT;INFILE 'D:\CUADRALAT2.PRN';INPUT COL FILA TRAT $ RESP;RUN;

    PROC GLM;CLASS TRAT COL FILA ;MODEL RESP = TRAT COL FILA;

  • - DISEO DE EXPERIMENTOS - L. CID S. - 2014

    45

    RUN; Class Level Information Class Levels Values TRAT 5 A B C D E COL 5 1 2 3 4 5 FILA 5 1 2 3 4 5

    Number of observations 25

    Dependent Variable: RESP Sum ofSource DF Squares Mean Square F Value > FPrModel 12 259.8592000 21.6549333 7.06 0.0010 Error 12 36.7992000 3.0666000 Corrected Total 24 296.6584000

    R-Square Coeff Var Root MSE RESP Mean 0.875954 5.134194 1.751171 34.10800

    Source DF Type I SS Mean Square F Value Pr > F TRAT 4 155.8944000 38.9736000 12.71 0.0003 COL 4 16.5624000 4.1406000 1.35 0.3079 FILA 4 87.4024000 21.8506000 7.13 0.0035

    Observemos que, como en los casos anteriores, SAS nos entrega dos tablas de anlisis de varianza.La primera es slo un resumen global del procedimiento, en tanto que la se