r75906

Embed Size (px)

Citation preview

  • 7/25/2019 r75906

    1/14

    1

    INTRODUCCIN AL DISEO Y ANLISIS DE EXPERIMENTOS (ADE)

    1. OBJETIVOS

    Al final de este laboratorio, el estudiantes ser capaz de analizar un experimento con un diseo factorial

    para dos factores a dos niveles cada uno utilizando EXCEL. La meta es proveer al estudiante con lahabilidad de planear, disear, analizar y concluir vlidamente con bases estadsticas de este tipo particularde experimentos.

    2. MATERIALES

    Excel versin 98 o ms nuevo Notas de clase provistas en la sesin impartida por el instructor

    3. ANTECEDENTES

    El Diseo y Anlisis de Experimentos (ADE) es el rea de la estadstica que tiene como objeto estudiar losefectos de variables de inters dispuestas en varios niveles en una o varias respuestas o medidas dedesempeo. Sir Ronald A. Fisher introdujo ADE por primera vez en la primera mitad de los aos 1930s enel rea de la agricultura. La mayora de los campos de ingeniera y ciencias ahora practican las ideas deFisher junto con las cuantiosas contribuciones de muchos otros investigadores en el rea.

    Los ingenieros usan experimentos en su prctica diaria para alcanzar diversos objetivos. Algunos ejemplosincluyen: encontrar condiciones factibles de operacin paa un proceso o una mquina, optimizar unamedida de desempeo, investigar las causas de defectos de calidad, disear un sistema nuevo o hacer unproceso insensible a la variacin externa (robustez).

    En general, se considera que la experimentacin es una disciplina iterativa, donde se debe prestar debidaatencin a la planeacin, el diseo, y el anlisis del o de los experimentos.

    Los mtodos estadsticos en ADE pueden hacer ms eficiente la ejecucin de experimentos y a menudofortalecen las conclusiones obtenidas de esta manera (Montgomery, 1997). Sin embargo, es siemprerecomendable usar el conocimiento no-estadstico de un proceso o sistema para complementar el procesode experimentacin, as como para mantener el tamao y la concentracin del experimento dentro delmites adecuados.

    4. PROCEDIMIENTO

    Este laboratorio se divide en dos partes:

    La primer parte consiste en reproducir el anlisis mostrado por el instructor en la primera sesin con ayudade EXCEL.En la segunda parte se proveer un conjunto de datos nuevo para que los estudiantes puedan llevar a caboun anlisis similar a aqul de la primera parte.

  • 7/25/2019 r75906

    2/14

    2

    Primera parte

    Se recomienda mantener copias del material de la sesin impartida por el instructor para el material,dado que este manual lo referenciar con frecuencia bajo el nombre de NOTAS.

    En la sesin de clase, se explic que el objetivo de este experimento es especificar el contenido de la cargayla temperatura del molde en un proceso de moldeo de SMC para mejorar la calidad de la superficie descritapor un ndice de calidad. Supongamos que ya hemos planeado el experimento, y que decidimos usar undiseo factorial para dos factores a dos niveles cada uno, sto es un experimento factorial 22.(Ver pginas 10y 11 de las NOTAS). Supongamos tambin que el experimento ya se llev a cabo. Ahora lo que necesitamoshacer es el anlisis estadstico

    1. Abrir Excel.

    2. Introducir los datos experimentales.

    Aqu estn los datos del experimento (Pgina 12 de las NOTAS), cada nmero representa unamedicin del ndice de calidad bajo las condiciones especificadas por el rengln y la columnacorrespondiente:

    Temperatura del Molde (oF)

    Carga (%) 302 327

    40 90 86 98 87 89 107 102 105 94 91

    44 85 104 82 79 84 72 77 78 82 67

    Esta manera de representar los resultados de un experimento es muy conveniente dado que permitevisualizar la variacin a travs de columnas y renglones. Comencemos por introducir esta tabla en Excel

    respetando el formato sealado arriba, y respetando las filas y columnas que se muestran en la ilustracin.

    3. Crear una tabla de operaciones preliminares

    Una vez que se han introducido los datos, podemos calcular la tabla de anlisis de varianza usando lasfrmulas que se detallan en las pginas 12-15 de las NOTAS. Esencialmente, queremos ver al finalla tablaque sigue (de la pgina 16 de las NOTAS).

  • 7/25/2019 r75906

    3/14

    3

    Sin embargo, para llegar a esta tabla final, es necesario hacer algunos clculos preliminares. Para ello, ysiempre siguiendo las frmulas todava de la pgina 12 de las NOTAS, podemos generar la siguiente tabla declculos preliminares.

    Primero introduzca las etiquetas carga, temperatura, sumas de columna, sumas de rengln,cuadrados de suma de rengln y suma de cuadrados as como las etiquetas 40, 44, 302 y 327.

    En la celda D11, se introducirn la suma de las rplicas de los datos tomados bajo un determinado nivel decarga y de temperatura. En este caso en D11 se introduce la frmula =SUMA(C4:G4), donde el rango C4:G4contiene los cinco datos tomados con una carga de 40% y una temperatura de 302 oF. Introducir frmulassimilares para las celdas D12, E11, y E12.

    Las sumas de columna y de rengln contienen las sumas correspondientes de datos. En este caso, la celda parala columna 1, D13, contiene la frmula =SUMA(D11:D12), donde el rango D11:D12 contiene las sumas dedatos a travs de cada condicin experimental especfica (Nivel de carga, Temperatura). Introducir unafrmula similar para la celda E13.

    De manera similar, las sumas de rengln contienen las sumas a travs de las columnas para cada rengln. Parael primer rengln, la celda F11 contiene la suma de D11+E11. Introducir una frmula similar para el segundorengln.

    El gran total, en celda D13 contiene la suma de las celdas F11 y F12, que a su vez contienen sumas derengln.

    Una columna ms de clculos (columna G) se necesita para obtener valores que necesitaremos despus. stosson los cuadrados de las sumas de rengln. Para el primer rengln, por ejemplo, se introduce la frmula:F11^2. Introduzca frmulas similares para el rengln 2, y para cuadrar el gran total.

  • 7/25/2019 r75906

    4/14

    4

    La suma de cuadrados en la celda D15 eleva al cuadrado cada medicin experimental y suma estas cantidades.Para lograrlo se introduce la frmula = SUMA.CUADRADOS (C4:L5), donde el rango C4:L5 contiene todoslos datos experimentales.

    Una vez terminado estos pasos, la tabla de clculos preliminares se deber ver como la tabla siguiente.

    4. Crear la tabla de anlisis de varianza

    Con las frmulas de la pgina 14 y 15 de las NOTAS, procederemos a crear la tabla de anlisis de varianza.

    Hay que recordar que el primer factor se encuentra variado a 2 niveles, asignamos a=2.De la misma manera,el segundo factor se encuentra variado a b= 2niveles. Y en total tenemos n= 5rplicas por combinacin decondiciones experimentales.

    Procederemos entonces a introducir las siguientes frmulas (pginas 14 y 15 de las NOTAS detallan lasfrmulas):

    Una vez que se hayan introducido estas frmulas, se debern observar los nmeros siguientes:

  • 7/25/2019 r75906

    5/14

    5

    Las sumas de cuadrados nos dan una idea un tanto burda de cunta variacin gener cada una de las fuentesen nuestra medida de desempeo.

    Los grados de libertad esencialmente nos indican el nmero de trminos independientes en nuestrassumatorias.

    El cuadrado medio, que es la suma de cuadrados dividida entre los grados de libertad, puede entenderse comola variacin ajustada proveniente de cada fuente. El cuadrado medio del error es precisamente nuestroestimador de la varianza en nuestros datos.

    Los cocientes F0 comparan la variacin generada por cada una de las fuentes (en el numerador), contraaquella que tenemos como variacin aleatoria, expresada por el cuadrado medio del error o varianza. Porsupuesto, cocientes mayores a 1 indican una variacin producida mayor a la variacin considerada aleatoria, yaquellos menores a 1, una variacin menor a aquella considerada aleatoria. Sin embargo, estos cocientesdeben an compararse contra un valor de tablas para establecer bases estadsticas. ste es el valor Falpha,grados de libertad del numerador, grados de libertad del denominador. Alpha () es la probabilidad de un

    error tipo I, que en este contexto se refiere a concluir que hay un efecto significativo de alguna fuente cuandoen realidad no lo hay.

    Con la salvedad de checar algunos supuestos acerca de los residuos (que explicamos ms adelante), paraobtener conclusiones de la tabla de anlisis de varianza se utilizan generalmente los siguientes criterios:

    1) Si F0F, GL num, GL denom para determinada fuente de variacin, entonces concluiremos que esta fuente devariacin afecta significativamente a la medida de desempeo al nivel especificado.

    2) Si valor-ppara determinada fuente de variacin, entonces concluiremos que esta fuente de variacinafecta significativamente a la medida de desempeo al nivel especificado.

    Es conveniente notar en este punto que el nivel escogido para estos ejemplos es de 5% ( = 0.05), y que esevalor se introdujo en EXCEL junto con los grados de libertad para el numerador y el denominador paraobtener la F, GL num, GL denom. Alternativamente se pudo haber encontrado este valor de las tablas de ladistribucin F. Tambin es necesario hacer hincapi que se utilizaron las funciones de EXCEL paradeterminar convenientemente el valor-p, lo cual puede ser un poco trabajoso si se utilizan las tablas. Unainterpretacin general del valor-p es decir que es el mnimo valor de bajo el que an concluiramos quedeterminada fuente de variacin tiene un efecto significativo. Con esta interpretacin no debe sorprender que

  • 7/25/2019 r75906

    6/14

  • 7/25/2019 r75906

    7/14

    7

    Ahora utilizaremos estos nmeros para encontrar los parmetros de nuestro modelo estadstico usando lasfrmulas siguientes (verificar que se obtengan los valores mostrados):

    Usaremos estos trminos para predecir nuestros datos experimentales. Ntese, sin embargo, que solamentetenemos cuatro combinaciones experimentales (ver pgina 11 de NOTAS), as que solamente podremos hacerestas cuatro predicciones. Sin embargo, sabemos que tenemos 5 rplicas por cada combinacin experimental(20 datos experimentales en total), por lo tanto, para cada una de las cinco rplicas nuestra prediccin ser la

    misma y tendremos una discrepancia. Esta discrepancia es un residuo. Evidentemente en nuestro experimentotenemos 20 residuos.

    Introduzcamos primero las frmulas para nuestras predicciones:

    Para corroborar los valores que se deben mostrar en la pantalla son los siguientes:

  • 7/25/2019 r75906

    8/14

    8

    Obtengamos ahora los residuos o errores de nuestro experimento.

    Para corroborar, los valores que se deben tener en los residuos despus de estas frmulas son:

    Estos residuos, tal como lo sealamos anteriormente, deben cumplir con tres supuestos: (1) deben sernormalmente distribudos, (2) deben ser independientes, y (3) deben mantener una desviacin estndarconstante .

    Aunque existen tcnicas estadsticas formales para probar estos tres supuestos, nuestro inters aqu es mostrarla intuicin de un mtodo grfico.

  • 7/25/2019 r75906

    9/14

    9

    Antes de comenzar a graficar, ser necesario crear la siguiente tabla para contar la frecuencia de los datos enintervalos dados (el tamao de los intervalos lo decide uno):

    Por otro lado, necesitaremos la siguiente tabla (esencialmente con clculos anteriores):

  • 7/25/2019 r75906

    10/14

    10

  • 7/25/2019 r75906

    11/14

  • 7/25/2019 r75906

    12/14

    12

    El primero de los grficos, residuos vs. Orden de experimentacin, se realiza para observar que no haya unpatrn reconocible i.e. que los residuos efectivamente se comportan de una manera aleatoria alrededor de 0. Sieste no es el caso, puede estarse violando el supuesto de independencia. En este caso la grfica no muestra unpatrn determinado, aunque nuevamente hay un residuo que sobresale, el cual es el mismo que se detect enel histograma. Decidimos dejar este punto porque no se encontr nada que nos indicara que estuvieraequivocado en nuestro experimento, de tal manera que creemos que es variacin que se puede encontrar ennuestro proceso.

    Los siguientes dos grficos, residuos vs. Carga y residuos vs. Temperatura, proveen una buena manera dechecar que se tenga aproximadamente la misma dispersin alrededor de 0, i.e. que los residuos tengan undesviacin estndar aproximadamente constante. Dejando de lado el residuo grande que decidimos dejar, losgrficos de este caso no acusan algo extremadamente problemtico.

    El ltimo grfico, residuos vs. Predicciones, nos sirve para checar que los residuos no se encuentrencorrelacionados con la magnitud de las predicciones (pues eso violara el supuesto de independencia), ascomo checar que la dispersin sea aproximadamente la misma.

    En resumen, hemos verificado que los supuestos de normalidad, independencia y homogeneidad de varianzano se hayan violado en los experimentos a travs del anlisis de residuos. Checar que efectivamente no hayauna violacin a estos supuestos, transfiere un buen apoyo estadstico y fortaleza a las conclusiones de nuestroexperimento.

  • 7/25/2019 r75906

    13/14

    13

    6. Crear grficas de efectos principales y de interaccin.

    Por ltimo, se pueden crear las grficas de efectos principales y de interaccin a manera de ilustrar nuestrasconclusiones, aunque se debe evitar hacer conclusiones basados en el slo uso de estos grficos.

    Segunda Parte

    En la segunda parte de este laboratorio, se pide al estudiante repetir el procedimiento anterior con un Nuevoconjunto de datos. Aunque los pasos son los mismos, el anlisis del experimento y las conclusiones se debernbasar en el nuevo conjunto de datos.

    Temperatura de Molde (oF)

    Carga (%) 275 302

    40 77 72 75 77 80 90 86 98 87 89

    44 76 75 75 69 62 85 104 82 79 84

  • 7/25/2019 r75906

    14/14

    14

    EJERCICIO ADICIONAL

    El director de operaciones de ComPsitos S.A., compaa que produce partes de resina polister reforzadacon fibra de vidrio (SMC), sabe que el tiempode curado(tc)de las partes que producen en sus prensas

    podra ser reducido ya sea incrementando la temperatura del molde (Tw) o precalentando el preformado deSMC, esto es incrementando la temperatura inicial del material (To). Un tiempo menor de curadoimplicara un potencial aumento de su produccin.

    El director no sabe, sin embargo, si ambas acciones son importantes o no, o si es en realidad necesarioejecutar ambas para mejorar ms. Est dispuesto a asignar parte de su presupuesto para comprar unaunidad de precalentamiento para el material pero solamente si se puede justificar la adquisicin.

    Se ha pedido tu ayuda a tomar esta decisin. T (inteligentemente) sugieres que se lleve a cabo unexperimento factorial 22para investigar los efectos que ambos, Twy To, tienen en el tiempo de curado (tc).Aqu estn los resultados (el tiempo de curado se reporta en segundos y la temperatura en grados kelvin.

    Temperatura del Molde (K)Temperatura inicial

    del material (K) 413 423

    298 74.9 73.4 68.5 76.1 81.3 41.1 39.1 42.3 37.7 35.9

    323 66.9 74.0 75.6 75.0 76.5 40.3 32.4 41.2 45.5 43.3

    Se deber comprar una unidad de precalentamiento de material?

    En su respuesta, provea toda la evidencia estadstica necesaria (tabla de anlisis de varianza, anlisis deresiduos, grficos de efectos principales y de interaccin, etc.) as como una discusin de qu indica elanlisis.