Sesión 10 (clase)

Preview:

Citation preview

Dr. Luis Cuautle Gutiérrez

Dr. Luis Cuautle Gutiérrez

El análisis de varianza (ANOVA) es la técnicacentral en el análisis de datosexperimentales.

La idea general de esta técnica es separar lavariación total en las partes con las quecontribuye cada fuente de variación en elexperimento.

Existen dos esquemas para desarrollar unANOVA:

◦ Esquema de una vía (Diseño de un Factor)

◦ Esquema de dos vías (Diseño de dos Factores)

En este análisis se compara la diferencia entrelos tratamientos con la variación causada porlas repeticiones dentro de cada tratamiento.

Si la fuente de variación ”Entre tratamientos”es significativamente mayor que la fuente“Dentro del tratamiento”, se concluye queexiste una diferencia entre tratamientos.

El objetivo del análisis de varianza de un factores probar la hipótesis de igualdad de lostratamientos con respecto a la media de lacorrespondiente variable de respuesta:

Lo cual se puede escribir en formaequivalente:

Los tratamientos tienen efecto (las mediasson diferentes).

Cuando los tratamientos no dominancontribuyen igual o menos que el error (lasmedias son iguales).

Variabilidad debida a

tratamientos

Variabilidad debida al

error

Variabilidad debida a

tratamientos

Variabilidad debido a

tratamientos

Variabilidad debida al

error.

Variabilidad Total

Variabilidad Total

Sirve para representar sumas y medias que seobtienen a partir de los datos experimentales.

Las cantidades de interés son:

Yi. =Suma de las observaciones del tratamiento

i.

Yi.=Media de las observaciones del i-ésimo

tratamiento.

Y..=Suma total de las N = n1 +n2+…+nk

mediciones.

Y..=Media global o promedio de todas las

observaciones.

Note que el punto indica la suma sobre elcorrespondiente subíndice. De tal formaque:

in

j

ijYYi1

i

n

j

n

Yij

iY

i

1

k

i

n

j

ij

i

YY1 1

kiN

YY ,...,2,1;

k

i

inN1

FV SC GL CM Fo Valor-p

Tratamientos k-1

Error N-k

Total N-1

En la tabla de ANOVA se resume el análisis devarianza de un experimento que sirve para probarlas hipótesis de interés.

N

Y

n

Yk

i i

i

2

1

2

TRATT SCSC

N

YY

k

i

n

j

ij

i 2

1 1

2

1k

SCTRAT

kN

SCE

E

TRAT

CM

CM)( FoFP

El ANOVA supone que la variable de respuesta se distribuye normalmente, con varianza constante y que las mediciones son

independientes entre si.

En la tabla a continuación se muestran losresultados de dureza obtenidos de lasmuestras tomadas durante cada una de lascondiciones de tratamiento seleccionadas.

Empleando Minitab se grafican los datos y seobtiene lo siguiente:

¿Que se puede decir acerca de los tratamientos?

Para determinar si existe una diferenciasignificativa entre tratamientos se realiza unaprueba F.

Un equipo de mejora investiga el efecto de 4métodos de ensamble A, B, C y D, sobre eltiempo de ensamble en minutos. Se hicieron 4observaciones del tiempo de ensamble en cadamétodo. Los valores obtenidos se muestran enla siguiente tabla.

A B C D

6 7 11 10

8 9 16 12

7 10 11 11

8 8 13 9

Método de ensamble

¿Existen diferencias entre los 4 métodos de ensamble?

En el ANOVA de dos factores seconsideran como fuentes probables devariación:◦ Factor A

◦ Factor B

◦ Interacción Factor A x Factor B

◦ Error Experimental (Variación causada porrepeticiones)

En el ejemplo anterior, se plantea un ANOVAde dos factores.

Tiempo de Horno

Temperatura de Salida

700OF 800OF 900OF

30’ 90 87 84

87 85 87

60’ 95 87 79

92 90 78

Captura de Datos

ANOVA

Valor-p < 0.05, existe efecto!

Esta muestra de manera gráfica el resultadopromedio de cada uno de los niveles delfactor.

Esta gráfica señala si dos factores dependenentre ellos en relación al efecto de ellos sobreel resultado.

El diseño de experimentos consiste enplanear y realizar un conjunto de pruebascon el objetivo de generar datos que, al seranalizados estadísticamente, proporcionenevidencias objetivas que permitanresponder las interrogantes planteadas porel experimentador sobre determinadasituación.

El uso de los DOE’s mejora la calidad, en corto tiempo, y reduce el retrabajo y el costo.

Factores estudiados: Son las variables que seinvestigan en el proceso para observar comoafectan o influyen en la variable de respuesta.

Factores controlables: Son variables de procesoy/o características de los materiales y losmétodos experimentales que se pueden fijar enun nivel dado.

Factores no controlables (ruido): Son variablesque no se pueden controlar durante elexperimento o la operación normal del proceso.

Variable de respuesta: A través de esta(s)variable(s) se conoce el efecto o los resultados decada prueba experimental.

Niveles: Los diferentes valores que se asignan acada factor estudiado en un diseño experimental.

Tratamientos o punto de diseño: Unacombinación de niveles de todos los factoresestudiados. Nivel de

velocidadNivel de

temperaturaTratamiento Y

1 1 1

?2 1 2

1 2 3

2 2 4

Aleatorización: Consiste en hacer corridasexperimentales en orden aleatorio(al azar);este principio aumenta la posibilidad de queel supuesto de independencia de los erroresse cumpla.

Repetición: Es correr mas de una vez untratamiento o combinación de factores. Estaspermiten distinguir mejor qué parte de lavariabilidad total de los datos se debe al erroraleatorio y cuál a los factores.

Diseño factorial: Diseño experimental quesirve para estudiar el efecto individual y deinteracción de varios factores sobre una ovarias respuestas.

Factor cualitativo: Sus niveles toman valoresdiscretos o de tipo nominal. Ejemplos:máquinas, lotes, marcas, etcétera.

Factor cuantitativo: Sus niveles de pruebapueden tomar cualquier valor dentro decierto intervalo. La escala es continua, comopor ejemplo: temperatura, velocidad,presión, etc.

El tamaño de la muestra (el numero de valores dedatos en cada combinación de prueba) tambiénafecta la estimación del error experimental.

Generalmente, entre más datos (más grados delibertad), mejor es la estimación.

Sin embargo, las consideraciones prácticas se debensopesar con las consideraciones estadísticas.

Aunque pueden existir excepciones, una buena reglade “pulgar” es recolectar un mínimo de 3 valores dedatos para cada combinación de prueba.

Hoja de Trabajo de Planeación de DOEBlack Belt: ___________________ Depto. / Proceso:____________________________________

Título del Proyecto__Mejora del Proceso de Prototipo_ Fecha: ________

Objetivo del DOE: __Reducir al Mínimo el Tiempo de Ciclo de Prototipo.________________________________________________________________________________________________________________________________________________________________________________________________________________

Antecedentes Relevantes: Actualmente, el tiempo de ciclo de prototipo promedio excede los 9 días___ (13,100 minutos).__________________________________________________________________________________

__________________________________________________________________________________

Características del Resultado

Característica CT Qué / Cómo medir Especificaciones¿Usar como Medidadel Experimento?(s/n)

Tiempo de Ciclo de Prototipo

Del recibo de confirmación del Faxdel Cliente al recibo de confirmaciónsin error del Fax del Proveedor conla Orden de Compra.

Menos de 5400minutos

S

Exactitud de las Ordenesde Compra

Número de erroresNúmero de iteraciones de retrabajo

Sin errores Sin retrabajo

N

Sí. __ ¿Existe una sola medida de resultado que incluya todas (o varias) las características CT?

Si se usa una medida de tiempo de ciclo que incluya el tiempo dedicado al retrabajo, la reducción del__

tiempo de ciclo; también incluye el objetivo de reducir los errores y el retrabajo.

37

Factores Controlables (Proceso de Prototipo)

Si es factor del DOE Si no es factor del DOEFactores

Controlables NivelActual

Nivel (es)

Propuesto (s)

¿Cómo mantener constante? ¿A qué nivel?

Método de Orden de Compra

S Manual Automatizado

Quién Introduce los Datos S

Lanzamiento delCoordinador y del

empleado que introduce Datosambos los introd.

Cualquiera(No ambos)

Método para crearuna "Lista de Selección"

NUsa el método actual(Manual).

Fuerz

a d

el

Impacto

sobre

Y

Fácil d

e c

am

bia

rdura

nte

el

experi

mento

¿Inclu

ir c

om

o

facto

r en e

l experi

mento

Leyenda:

:Impacto fuerte, Fácil de cambiar

:Impacto moderado, Moderadamente fácil de cambiar

:Impacto débil, Difícil de cambiar

38

Factores de Ruido

Si es factor del DOE Si no es factor del DOE

Estrategia

Factores de Ruido

Niveles a establecer

durante elexperimento

¿Cómo mantener

constante?

¿A qué nivel?

Hora en que serecibió la Ordendel cliente

S 3

Mañana (8:00-11:00am)

vsTarde (1:00-4:00)

Fuerz

a d

el

impacto

sobre

Y

Fácil d

e c

am

bia

rdura

nte

el experi

mento

Inclu

ir c

om

o f

acto

r en

el experi

mento

? (s

/n)

Robuste

z/

Red d

e la v

ari

ació

n

Si es f

uert

e,

contr

arr

esta

Leyenda:

:Impacto fuerte, Fácil de cambiar

:Impacto moderado, Moderadamente fácil de cambiar

:Impacto débil, Difícil de cambiar

Este diseño también puede ser estudiado apartir de la técnica de ANOVA, los valores-pmenores a 0.10 implican efectos fuertes.

Factor Niveles Unidad

A: Broca 1/16 1/8 Pulgadas

B: Velocidad 40 90 rps

Los datos obtenidos de las 16 pruebas se muestran acontinuación

A:Broca B:Velocidad A B X1 X2 Vibración

1/16 40 - - -1 -1 18.2 18.9 12.9 14.4

1/8 40 + - +1 -1 27.2 24.0 22.4 22.5

1/16 90 - + -1 +1 15.9 14.5 15.1 14.2

1/8 90 + + +1 +1 41 43.9 36.3 39.9

A:Broca B:Velocidad A B X1 X2 Vibración

1/16 40 - - -1 -1 18.2 18.9 12.9 14.4

1/8 40 + - +1 -1 27.2 24.0 22.4 22.5

1/16 90 - + -1 +1 15.9 14.5 15.1 14.2

1/8 90 + + +1 +1 41 43.9 36.3 39.9

Con α = 0.10, el tipo de broca, la velocidad y la interacción entre ambos factores son

significativos

¿Qué niveles de los factores deberán seleccionarse para minimizar la vibración?

Mejor Tratamiento: A-, B+

Mejor Tratamiento: 1/16”, 90 rps

Los supuestos del modelo de ANOVA: normalidad, varianza constante e independencia de los residuos deben verificarse antes de dar por

válidas las conclusiones.

Nota: La técnica DOE es más eficiente con datos variables

Paso 1: Encuentra los factoresque afectan la variación. Usa estos factores para minimizar la variación.

Paso 2: Encuentra los factores que desplazan el promedio (y NO afectan la variación). Usa estos factores para ajustar la salida promedio con la meta deseada.

Objetivo

En este modelo se estudian 3 factores endos niveles cada uno. Consta de 23 = 8tratamientos diferentes, los cuales sepueden identificar con las mismasnotaciones del Diseño 22.

La región Experimental ahora es un cuboregular centrado en el origen (0,0,0),cuyos vértices son los ocho tratamientos.

La matriz de diseño seconstruye alternando elsigno menos y el signomás en la primeracolumna, dos menos ydos más en la segundacolumna y cuatro menosy cuatro más en latercera; el diseño resultaacomodado en el ordenestándar o de Yates.

A B C

-1 -1 -1

+1 -1 -1

-1 +1 -1

+1 +1 -1

-1 -1 +1

+1 -1 +1

-1 +1 +1

+1 +1 +1

Sean A, B, C los factores que se quieren estudiar y sean(I), a, b, ab, c, ac, bc, y abc, los totales observados encada uno de los 8 tratamientos escritos en su ordenestándar. Los efectos en este diseño se puedencalcular a partir de la tabla de signos siguiente.

Total A B C AB AC BC ABC

(1) - - - + + + -

a + - - - - + +

b - + - - + - +

ab + + - + - - -

c - - + + - - +

ac + - + - + - -

bc - + + - - + -

abc + + + + + + +

Una empresa de dispositivos electrónicosidentificó que las fracturas de las obleas desilicio por choques térmicos era la principalescausa de ruptura de obleas en la etapa de“grabado mesa”. Se identificaron tres factoresprincipales (temperaturas) como las probablescausas del problema. Por ello se utilizo unexperimento factorial 23 con el objetivo delocalizar una combinación de temperaturas enla cual se rompan un mínimo de obleas porefecto térmico.

Los tres factores controlados y sus niveles enunidades originales son:◦ T1: Temperatura de grabado (-3oC, -1oC)

◦ T2: Temperatura de piraña (60oC, 98oC)

◦ T1: Temperatura de agua (20oC, 70oC)

La respuesta medida a cada oblea procesada enel experimento es binaria con valor 1 si la oblease rompe y 0 si no se rompe.

A continuación se da la proporción de obleasrotas por cada 250 procesadas.

T1 T2 T3 P

-1 -1 -1 0.04

1 -1 -1 0.012

-1 1 -1 0.036

1 1 -1 0.00

-1 -1 1 0.02

1 -1 1 0.00

-1 1 1 0.016

1 1 1 0.004

-1 -1 -1 0.032

1 -1 -1 0.008

-1 1 -1 0.028

1 1 -1 0.00

-1 -1 1 0.02

1 -1 1 0.016

-1 1 1 0.008

1 1 1 0.004

FV SC GL CM Fo Valor-p

A 0.001521 1 0.001521 52.45 0.0001

B 0.000169 1 0.000169 5.83 0.0422

C 0.000289 1 0.000289 9.97 0.0135

AB 0.000001 1 0.000001 0.03 0.8573

AC 0.000361 1 0.000361 12.45 0.0078

BC 0.000001 1 0.000001 0.03 0.8573

ABC 0.000025 1 0.000025 0.86 0.3803

Error 0.000232 8 0.000029

Total 0.002599 15

R2 = 91.1 R2

aj= 83.3

De tal forma que los Efectos de A (Temperatura deGrabado), B (Temperatura de Piraña,) C (Temperatura deAgua), la interacción AC están presentes.

Estos efectos pueden graficarse en un diagrama dePareto para visualizar cuáles tienen mayor impacto sobrela variable de respuesta. (Nota: Se grafican los efectosdivididos entre su error estándar) 22

ˆ efectoun deestándar error del Estimaciónk

Eefecto

n

CM

Con la información del Pareto Estandarizado se apreciaque los efectos que tienen un valor-p menor que 0.05son los efectos principales A,B y C; y la interacción AC.

De tal manera, con el objeto de aclarar mejor cualesfuentes de variación son significativas y obtener unmodelo final en el que sólo se incluyan términossignificativos, se construye el Mejor ANOVA.

FV SC GL CM Fo Valor-p

A 0.001521 1 0.001521 64.60 0.0000

B 0.000169 1 0.000169 7.18 0.0214

C 0.000289 1 0.000289 12.27 0.0049

AC 0.000361 1 0.000361 15.33 0.0024

Error 0.000259 11 0.0000235

Total 0.002599 15

R2 = 90.03 R2

aj= 86.4

De esta gráfica el mejor tratamiento sería (1,1,1)

De esta gráfica se observa que si se trabaja con temperatura alta de grabado, da lo mismo cualquiera de

las dos temperaturas de agua.

De esta gráfica se observa que las dos mejores condiciones son: (1,1,1) y (1,1,-1). Es decir (-1oC, 98oC,

70oC) y ((-1oC, 98oC, 20oC) respectivamente.

Se grafican los residuos y bajo la prueba de Anderson Darling se comprueba la normalidad de los datos.

Se grafican los residuos vs cada

uno de los factores y se comprueba la

homogeneidad de las varianzas.

Rath & Strong Management Consultants (2006). Six Sigma Pocket Guide. Rath & Strong.

Schmidt, S. y Launsby, R. (1998). UnderstandingIndustrial Designed Experiments. Air AcademyExpress

Curso de Entrenamiento Seis Sigma: Green Belt(Johnson Controls-UPAEP)