18
03 marzo 2009 InIn 6078Sistemas de Control de Calidad 1 Plan : POBREP Hotelling El talón de Aquiles de los gráficos de control es que ellos dan una señal y luego tenemos que buscar la causa de esa señal. POBREP intenta bajo ciertas condiciones cuando surge una señal ya hay un subsistema o algo del procesos que podemos ir a mirar primero porque no todas las cosas van a causar una rotación o van a causar un encogimiento. Esos son ciertos subprocesos que van a causar ese tipo de problema. Lo que el paper llama la base estándar, recordando que se tomaba una localización donde se tenía un objetivo. Teníamos 8 localizaciones, vamos a mirar 4 esquinas y esas 4 esquinas se van a representar con un vector. Ese vector me va decir de alguna manera lo que está sucediendo.

03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

03 marzo 2009                                               InIn 6078‐ Sistemas de Control de Calidad 

  

1  

Plan:

• POBREP

• Hotelling

• El talón de Aquiles de los gráficos de control es que ellos dan una señal y luego tenemos que buscar la

causa de esa señal. POBREP intenta bajo ciertas condiciones cuando surge una señal ya hay un

subsistema o algo del procesos que podemos ir a mirar primero porque no todas las cosas van a causar

una rotación o van a causar un encogimiento. Esos son ciertos subprocesos que van a causar ese tipo de

problema.

• Lo que el paper llama la base estándar, recordando que se tomaba una localización donde se tenía un

objetivo. Teníamos 8 localizaciones, vamos a mirar 4 esquinas y esas 4 esquinas se van a representar

con un vector. Ese vector me va decir de alguna manera lo que está sucediendo.

Page 2: 03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

03 marzo 2009                                               InIn 6078‐ Sistemas de Control de Calidad 

  

2  

• Como toda herramienta POBREP tiene limitaciones. La limitación de POBREP es que no es genérico

pues para poder aplicar este método se debe de entender el proceso, hay que entender cuantas medidas

se van a realizar, cuales son los patrones sistemáticos que salen de ese proceso.

• En este caso en particular tenemos 8 medidas donde 4 son medidas verticales y 4 son medidas

horizontales de las 4 esquinas del proceso.

• Si yo tengo 8 medidas, lo que se conocería como la base estándar, sería el equivalente a realizar gráficos

invariados, porque se tomaría la esquina que es la horizontal de una medida donde pondría 1 y ceros en

todos los demás, en la vertical tendría 1 y ceros en todos los demás, el tercero seria el componente donde

el horizontal de la localización y luego la vertical de la localización y así sucesivamente. (ver dibujo

anterior)

• Mirar el problema univariado es como el equivalente a decir que mi base es una matriz diagonal de unos

y ceros. Pero eso no me provee una información razonable de lo que está pasando en el proceso, pues

voy a tener muchos gráficos donde en unos gráficos se observe algún tipo de patrón de tendencia, pero

no se a que obedece.

• Hablamos de las bases orientadas al proceso donde decimos que si existe un desplazamiento o un error

uniforme en el eje horizontal, un desplazamiento en eje vertical, rotaciones en X y en Y, estiramientos

en x, estiramiento en y, estiramiento en un lado y encogido en otro tanto en X como en Y.

• Dado ese proceso, en lugar de mirar cada dato de manera individualizada, tomo el vector de medidas y

se lo adjudico a ver cuál es el posible patrón que está en juego en el proceso.

• Hablamos la vez pasada en de la matriz de las bases a cual la llamamos A. La matriz A puede ser

completa o incompleta. En el ejemplo del paper, la base es completa, en el segundo ejemplo es una base

incompleta. La diferencia entre ellos es que el completo tiene (ejemplo del paper) un vector de 8

medidas (4 horizontales y 4 verticales) recogiendo 8 bases.

• Es lo que llamaríamos como un modelo saturado en regresión pues tengo tantas observaciones como

columnas en la matriz de diseño. Si tengo una base completa, tengo una posible solución.

Base completa Base Incompleta

Y = AZ

Z = A-1 Y

Y = AZ + Є

Aplicamos “least squares”

Page 3: 03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

03 marzo 2009                                               InIn 6078‐ Sistemas de Control de Calidad 

  

3  

• Como estamos hablando de gráficos de control tenemos que monitorea algo. “Y” es el vector observado,

pero vamos a monitorear son los coeficientes pues el coeficiente que tenga una magnitud o un valor alto

ese va a ser el coeficiente que está presente, o el patrón que está activo que no dio una señal.

• Eso trae unas repercusiones. En experimentación, lo que se persigue en experimentación cuando realizo

los tratamientos es hacer una inferencia de los factores que estoy variando (en experimentación) pero

que en este caso son los patrones sistemáticos, y quiero saber qué factores influencian significativamente

la variable que estoy observando.

• En experimentación se dan un sinnúmero de experimentos, donde esos experimentos están detrás de una

característica física en la matriz de diseño, la cual se conoce como la ortogonalidad. La ortogonalidad

nos garantiza que cuando yo concluya que un factor es relevante, ese factor es relevante

independientemente de la contribución de otro factor o no. Por lo tanto esa matriz, en experimentación

se conoce como la matriz de diseño.

• Perseguimos que sea ortogonal y se manifiesta (asumiendo que la matriz de diseño es X), sea

una matriz diagonal. En otras palabras, que la covarianza entre los factores sea cero son independientes.

Por lo tanto yo quiero una matriz de diseño de forma tal que sea ortogonal. Eso me garantiza

que yo voy a ver el efecto de la variable 1 aislado por completo del efecto de la variable 2, 3 y si coloco

una interacción, va a estar aislada del efecto de la variable 1, 2 y 3.

• “A” puede ser ortogonal o no ortogonal. Eso crea un problema severo en este sistema. Cuando las

matrices no son ortogonales unos de los efectos es que puede cambiar de signo, y eso me va decir (por

ejemplo) que la rotación ocurrió hacia un lado cuando en realidad roto hacia el otro. Por lo tanto la

corrección que vaya a realizar puede ser contraproducente.

• El objetivo de POBREP no es la predicción de la Y, el objetivo es caracterizar bien la contribución de

una variable la no-ortogonalidad nos trae un problema enorme.

• Con la matriz vamos a visualizar vector tras vector.

• Suponga que conforme con los 8 patrones la matriz de base orientada al proceso donde cada uno tiene

una explicación. Se obtiene el siguiente vector y lo vamos a colocarlo en la base estándar para buscar

que nos dice cada elemento.

• El vector es medido, es lo observado, donde una maquina trata de colocar el componente perfectamente

en la localización y si lo hubiese colocado perfectamente alineado todos hubieran sido ceros, es la

distancia con respecto a lo que quería señalar. 

Page 4: 03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

03 marzo 2009                                               InIn 6078‐ Sistemas de Control de Calidad 

  

4  

• En el primer punto el cual es el eje superior izquierdo, con respecto a la horizontal, quedo

perfectamente, con respecto a la vertical tuvo una unidad por la parte superior y así sucesivamente. (ver

dibujo de arriba).

• Tan pronto pensando en las 8 bases, podemos observar cuales son las que se distinguen. Cuando hago la

representación, parece que existe una rotación en X y en Y y quizás un estiramiento. Eso se ve por la

magnitud que sale de mi coeficiente. Las magnitudes que se acerquen a cero son magnitudes donde esa

base no está presente, mientras más en magnitud sea alto más presente está esa condición.

• Básicamente lo que se hace buscar una solución al sistema y si la base es completa, la solución es única,

y si la base es incompleta, existen múltiples soluciones.

Page 5: 03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

03 marzo 2009                                               InIn 6078‐ Sistemas de Control de Calidad 

  

5  

• Cada fila representa, un vector. Paso un producto, lo mido y me da ese vector. Son las 8 posiciones,

donde es importante entender que la forma en que lo leo es que se crea el vector, tiene que haber una

correspondencia.

• Voy a tomar la matriz y voy a descomponer o representar del vector observado usando la matriz base.

La representación son los coeficientes, que me van a decir si hay alguno que se está distinguiendo.

• La matriz base es una matriz con 8 comportamientos o procesos que se señalaron

Page 6: 03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

03 marzo 2009                                               InIn 6078‐ Sistemas de Control de Calidad 

  

6  

40000000

04000000

00400000

00040000

00004000

00000400

00000040

00000004

• Es una matriz ortogonal, lo que nos indica que A es ortogonal, por lo tanto el estimado del patrón 1 y el

estimado del patrón 3 no van a estar chocando.

• El primer vector seria:

3.091.173.65

1.483.180.295.033.06

• En Matlab, utilizar A\Y = inv(A’*A)*A’*Y me va dar los coeficientes en regresión, con eso puedo ver

quien se destaca. En regresión es .

\

3.73750.7600

0.36751.3550

0.32250.91500.60250.0300

• Podemos notar que en el primer vector se destacan el primero y el cuarto.

• Como es un sistema de control, tengo que ver cuando el sistema está bien, mirar cómo se comportan

esos, sacar unos límites para cada uno de esos coeficientes, y cuando no se comporten va a surgir una

señal. Por ahora solo se destaca el primero y el segundo. Eso lo podría hacer para cada uno de mis

vectores.

• Si se utilizaran todos los vectores de la data cruda (observados) y usáramos la formula de A\cruda me va

a dar una regresión para cada uno de los 75 vectores.

• Tenía 8 observaciones individuales en cada una de los vectores, y ahora lo he convertido en 8 patrones

que están representados por la magnitud de un coeficiente. La magnitud del coeficiente no está en issue,

Page 7: 03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

03 marzo 2009                                               InIn 6078‐ Sistemas de Control de Calidad 

  

7  

un coeficiente no choca con el otro porque son ortogonales. En otras palabras lo que se quiere decir es si

se quita uno de esos patrones, el coeficiente se queda igual. Pero si la matriz no fuera ortogonal y quito

uno de los patrones, todos los coeficientes cambian. Si el coeficiente es lo que yo le estoy dando como

medida de monitoreo más vale que esos coeficientes estén representando y no cambien mucho si yo saco

algún patrón.

• Lo próximo seria transponer la Z = Z’ para graficar por columna pensando a lo largo del tiempo.

• Plot(zeta(:,1) = grafica Zeta no importa la fila pero para la columna 1.

o Esto es un grafico univariado para el patrón 1 pero que ya representa una estructura

multivariada porque escogió los 8 datos. En otras palabras, es univariado para un patrón que

considero las 8 medidas.

• Plot(zeta(:,3)

• Se podría graficar uno por uno y establecer un sistema de control para ver quién es el que sale. Es como

si tuviera 75 datos para un grafico de X-barra.

• No puede fallar las presunciones de regresión las cuales son:

o Residuales son normales

o Independientes

o Con varianza constante

• Si se violan estas presunciones, algún problema existe. Cuando hay una violación a las presunciones

significa que existen bases por ser descubiertas en el método de POBREP. En otras palabras, una vez se

tiene a la mano todos los conocimientos del proceso ya no existe correlación en el residual. Cuando le

rompo la estructura al residual es porque ya tengo el entendimiento del proceso, ya no queda más

correlación que buscar.

• En este caso, como la base es completa, el residual es cero, que es lo que llamamos como un modelo

saturado. Típicamente cuando tenemos muchas observaciones y unas pocas de bases o unos pocos de

patrones entonces queda un residual.

• Observando las graficas del univariado (abajo) podemos observar que

o en X2 es la Y subiendo

o X4 a partir de un momento decrece

o X6 va bajando

• Es lo que sucede para que los patrones se conformen.

Page 8: 03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

03 marzo 2009                                               InIn 6078‐ Sistemas de Control de Calidad 

  

8  

• Observando las graficas de los univariados de los coeficientes:

o Se ve el 3 y el 4, todos los demás están en cero, por lo tanto lo que tiene que ver con la rotación

es lo que está causando problemas.

Page 9: 03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

03 marzo 2009                                               InIn 6078‐ Sistemas de Control de Calidad 

  

9  

• La idea de POBREP sale de un paper escrito en el 1950 por el señor Leonard Seder donde hizo lo que

hace POBREP pero gráficamente en los años 1950, no supo cómo llevarlo a la matemática.

Gráficamente se refiere a utilizando el vector pictórico o “position diamention diagram”. La mejor

forma de analizar el vector de residuales. Esto es, tomar la información que se saca del vector de

residual y dibujárselo a la situación para poder ver las bases. Por lo tanto si tengo un vector de errores

tenemos que dibujarlo para ver qué es lo que nos está diciendo ese vector de error.

• Si lo hacemos usando POBREP o usando Hotelling, funciona, pero si no hay muchas se preferiría

utilizar con los “univariados de los coeficientes” usando los modelos de Bonferroni porque ya hay una

causa asignada.

• Si en algún proceso se puede aplicar este modelo, se acaba el talón de Aquiles de los gráficos de

modelos porque habría un diagnóstico.

Hotelling

• La idea de Hotelling está basado en la distribución T, donde en esta distribución tenemos lo siguiente.

• Estamos hipotetizando si la media es razonable cuando se visualiza lo que paso con una muestra que

tome de tamaño n y veo cuanto distante esta eso de lo hipotetisado. (Cuando estimo S).

• Si σ es conocida (parámetro es conocido) entonces el μ es hipotetizado, no necesito saberlo porque es la

hipótesis que estoy tratando de probar.

• Si cuadramos una Z, tenemos la distribución de Chi-square.

o Esto sucede si conozco σ y si hipotetizo a μ.

o Si trabajamos con los promedios me ampara el teorema del límite central y no hay tantos

problemas porque una Z2 de los promedios es una Chi-squared.

Page 10: 03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

03 marzo 2009                                               InIn 6078‐ Sistemas de Control de Calidad 

  

10  

o Si no estoy trabajando con los promedios, esta cuestionable y la X tendría que ser normal para

que termináramos en Chi-squared.

• Esto es en el concepto univariado, que en teoría es lo que se llama la forma cuadrática.

• Cuando es un concepto multivariado, la x-barra son muchas y se convierten en un vector (el promedio

de la variable 1, el promedio de la variable 2…). En las μ ya no estaría hipotetizando sobre una sola μ

sino sobre un vector de μ.

• En adición, ya no hay una sola varianza sino hay múltiples varianzas y la relación entre las variables se

va a manifestar en la matriz de varianzas-covarianzas.

o Si conozco a la matriz de covarianza y varianza (Σ var-cov) y estoy hipotetizando μ como un

vector y típicamente este hipotetizado es el valor nominal “target” obtenemos lo siguiente.

Σ (Forma cuadrática)

0

Donde: y

• Podríamos decir que esto es la concepción teórica de la forma cuadrática porque típicamente no se

conoce la matriz de varianza-covarianza y la tenemos que estimar. Y típicamente nosotros vamos a

realizar un estimado del vector μ. Pero es menos típico que tener que estimar la matriz de varianza-

covarianza porque la gente lo que quiere ver es si estoy en control con respecto a los valores “target” o

nominales del proceso.

• Todo lo que hace Hotelling es tomar esa diferencia entre la normal y la T y llevarlo al entendimiento de

que ahora en lugar de μ voy a tener a X-doble-barra y en lugar de la matriz conocida como el parámetro

conocido, también la voy a tener que estimar.

• Lo interesante es que como sabemos que es un Chi-squared, no tenemos que estimarla, o sea, sabemos

cuál es la distribución, así que si sabemos esto, el límite de control superior es muy fácil de obtener.

,

Donde p es el número de variables o características.

Page 11: 03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

03 marzo 2009                                               InIn 6078‐ Sistemas de Control de Calidad 

  

11  

• Desde la perspectiva más teórica, tendríamos un grafico de la siguiente manera.

• Hotelling es básicamente lo mismo con el valor estimado.

• Si estimamos Σ usando S o μ usando entonces la estadística es la que conocemos como: (con que

estimemos uno ya estamos en la T)

0

• Esto se utiliza para muchas cosas no solo para control de calidad.

• Ahora voy a tener una estadística (forma cuadrática) donde su valor mínimo es cero, así que recibiré una

señal cuando el valor sea grande, o sea cundo ese valor tenga un límite grande es que tendré una señal.

• Fundamentalmente tenemos un problema grave, pues :

o Si p es grande y se sale un valor, no sabemos a quién atribuirle. Todavía esto es motivo de

investigación.

• Si p = 2 tal vez es mejor ver los dos univariados o ver cuál es la correlación y ver si la correlación se

rompió, o que promedio fue el que se desplazo. Pero los problemas que son sustanciales, donde la p es

relativamente grande (5, 6, 7…). Entonces ahora como yo manejo un fuera de control para discriminar

debido a quien es. Eso es uno de los problemas lo cual es motivo de investigación.

• Recordando que la P es una misma característica en distintas posiciones (como en los problemas que

mencionamos con POBREP), pero puede servir para cuando yo este midiendo el peso de una cosa, el

acido del componente, una impureza. En otras palabras, las p’s características no tienen que estar

midiendo lo mismo. Cuando Hotelling fue concebido fue para que no midieran lo mismo, POBREP es

un caso especial. Por lo tanto puedo tener una pieza donde le estoy midiendo el diámetro, el peso, largo,

% de metal etc. No es necesario que se trabaje con la misma unidad o la misma característica, es

genérico.

Page 12: 03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

03 marzo 2009                                               InIn 6078‐ Sistemas de Control de Calidad 

  

12  

• Recordando que con la T comenzamos a decir que . Básicamente es lo que está haciendo el

gráfico de control intento tras intento. Lo que estamos probando es si mi promedio se mantiene como yo

esperaba y le estoy dando una banda (un intervalo de confianza). La Hotelling se usa con ese mismo

objetivo, de decir el vector .

• Nosotros lo vamos a utilizar como si fuera un grafico de control pero es lo equivalente a lo que haríamos

en una prueba de hipótesis vez tras vez preguntándonos si este vector del promedio, se sostiene o no se

sostiene. Esa es la pregunta que se está haciendo aquí.

• Nota: Aquí no hay límite central porque la distribución que estamos utilizando no es simétrica. Lo

importante son los valores extremos.

• Ejemplo: Digamos que tenemos una situación relativamente básica donde tenemos la variable X1 con

un tamaño de muestra de 4, variable X2 con tamaño de muestra de 4 (observaciones). Son como los

pares ordenados (X11, X21)

• Estoy puede ser univariado sin ningún problema donde n = 1, pero la forma en que se está planteando

aquí es a base de un tamaño de muestra.

• S es mi estimado de la matriz varianza-covarianza

• En otras palabras, voy a tomar la varianza, la voy a medir muestra tras muestra y al final lo promedio.

Eso no es el mismo estimado que si yo buscara la varianza de todos.

• De ninguna manera si tomáramos todos los datos y le pedimos algún programa que nos calcule la matriz

de covarianza no vamos a obtener lo mismo ya que aquí estamos promediando muestra tras muestra.

• Vamos vector por vector, muestra por muestra, obtenemos los promedios, las varianzas y las

covarianzas.

Nota: El comando “covar” en Excel busca la covarianza en la población y no en la muestra por lo tanto hay

que hacerle una corrección. El estimado de la covarianza es entre n-1, hay un grado de libertad que se

pierde. Aquí se tuvo que hacer la corrección de dividir n/(n-1).

• Si vamos a usar la T2 vamos a descartar los datos originales (“raw data”) y sencillamente trabajamos con

X-barra, varianzas y covarianzas, para obtener la T2.

o Vamos a mirar el promedio y buscamos quien se destaca.

Page 13: 03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

03 marzo 2009                                               InIn 6078‐ Sistemas de Control de Calidad 

  

13  

o Fíjense que la covarianza dio -0.35, recordando que la covarianza tiene unidades, no es como

la correlación que con saber un número podemos decir si es alta o baja, pero aquí la

covarianza entra en juego, las unidades entran en juego.

Recuerda que la covarianza es una relación entre las dos variables, cada dato menos

el promedio, el producto de las dos variables (cada dato menos su promedio).

o En la correlación es un índice asi que no tiene unidades pero en la covarianza tiene dos

unidades, por lo tanto no es tan fácil de solamente mirar una magnitud y decir si es bajito o

alto, lo que si sabemos es la dirección. Si dos variables son independientes, su covarianza es

cero, pero si la covarianza es cero no se puede garantizar que las dos variables son

independientes.

o Observamos si existe algún vector que se distingue en distancia con respecto al promedio

final de X-barra. Encontramos el 86.25, el cual es un potencial problemático para sobresalir.

La covarianza es un poco alta pero está en la misma dirección que el promedio. Cuando lo

miramos se obtiene una T2 mas alto. Si eso es significativo o no, depende de la distribución

que le vamos a dar.

Sample  x11  x12  x13  x14  x21  x22  x23  x24 x1‐Barra 

x2‐Barra 

Var‐1 

Var‐2  Covar  Tsquare 

1  80  82  78  85  19  22  20  20  81.25  20.25  8.92 1.58  0.92  0.78 

2  75  78  84  81  24  21  18  21  79.5  21  15  6  ‐9.00  5.24 

3  83  86  84  87  19  24  21  22  85  21.5  3.33 4.33  3.00  5.96 

4  79  84  80  83  18  20  17  16  81.5  17.75  5.67 2.92  1.17  7.97 

5  82  81  78  86  23  21  18  22  81.75  21  10.9 4.67  5.33  1.03 

6  86  84  85  87  21  20  23  21  85.5  21.25  1.67 1.58  0.17  6.72 

7  84  88  82  85  19  23  19  22  84.75  20.75  6.25 4.25  4.58  3.35 

8  76  84  78  82  22  17  19  18  80  19  13.3 4.67  ‐7.33  5.27 

9  85  88  85  87  18  16  20  16  86.25  17.5  2.25 3.67  ‐2.50  15.31 

10  80  78  81  83  18  19  20  18  80.5  18.75  4.33 0.92  ‐0.50  4.87 

11  86  84  85  86  23  20  24  22  85.25  22.25  0.92 2.92  0.92  10.06 

12  81  81  83  82  22  21  23  21  81.75  21.75  0.92 0.92  0.58  3.15 

13  81  86  82  79  16  18  20  19  82  18.25  8.67 2.92  ‐0.33  4.77 

14  75  78  82  80  22  21  23  22  78.75  22  8.92 0.67  1.33  10.65 

15  77  84  78  85  22  19  21  18  81  20  16.7 3.33  ‐7.33  1.21 

16  86  82  84  84  19  23  18  22  84  20.5  2.67 5.67  ‐2.67  1.45 

17  84  85  78  79  17  22  18  19  81.5  19  12.3 4.67  3.00  2.32 

18  82  86  79  83  20  19  23  21  82.5  20.75  8.33 2.92  ‐4.50  0.40 

19  79  88  85  83  21  23  20  18  83.75  20.5  14.3 4.33  3.17  1.06 

20  80  84  82  85  18  22  19  20  82.75  19.75  4.92 2.92  2.92  0.26 

Page 14: 03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

03 marzo 2009                                               InIn 6078‐ Sistemas de Control de Calidad 

  

14  

promedio  82.46  20.18  7.51 3.29  ‐0.35 

% Ejemplo de Gráfico Hotelling - Multivariado % % ********************************************%

Tenemos aqui la información cruda “raw data” tsquare = []; x=[80 82 78 85 19 22 20 20 75 78 84 81 24 21 18 21 83 86 84 87 19 24 21 22 79 84 80 83 18 20 17 16 82 81 78 86 23 21 18 22 86 84 85 87 21 20 23 21 84 88 82 85 19 23 19 22 76 84 78 82 22 17 19 18 85 88 85 87 18 16 20 16 80 78 81 83 18 19 20 18 86 84 85 86 23 20 24 22 81 81 83 82 22 21 23 21 81 86 82 79 16 18 20 19 75 78 82 80 22 21 23 22 77 84 78 85 22 19 21 18 86 82 84 84 19 23 18 22]

Aqui estan los promedios. xbarra = [ 81.25 20.25 79.5 21 85 21.5 81.5 17.75 81.75 21 85.5 21.25 84.75 20.75 80 19 86.25 17.5 80.5 18.75 85.25 22.25 81.75 21.75 82 18.25 78.75 22 81 20 84 20.5 81.5 19 82.5 20.75 83.75 20.5 82.75 19.75]

Aqui esta la X-doble barra. Xdbarra = [82.46 20.18]

Aqui esta la matriz de varianza-covarianza (sacado de Excel)

Page 15: 03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

03 marzo 2009                                               InIn 6078‐ Sistemas de Control de Calidad 

  

15  

s = [7.51 -0.35 -0.35 3.29] for i = 1:length(xbarra)

Formula cuadratica de Hotelling

hotelling = 4*(xbarra(i,:)-xdbarra')*inv(s)*(xbarra(i,:)-xdbarra')' tsquare = [tsquare hotelling] end plot(tsquare)

• El que sobresale es el 15, que es el vector que se observo que sobresalía.

• El planteamiento que mencionamos anteriormente es que la aproximación cuando estamos

estimando es con una F. Cuando estamos aproximando lo único que tenemos que entender para

poder mirar los limites, están asociados con un factor de corrección y una F, o sea, ya no es un Chi-

square porque estamos estimando. La Chi-square es cuando conocemos los parámetros o

hipotetizando los parámetros.

• Lo importante aquí es:

o M es el número de muestra, cuantas muestras hicimos, que en este caso son 25 muestras de

tamaño de 4.

Note que si m es grande (cientos de muestras), va a tender a ser la Chi-square

teórica.

Page 16: 03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

03 marzo 2009                                               InIn 6078‐ Sistemas de Control de Calidad 

  

16  

Para m moderadas (50, 60 muestras) necesitamos calcular los límites de esta forma.

Se habla de fase I y fase II en el caso de los multivariados. En el caso de los

univariados no se habla de esta distinción.

• Fase I es la clave para que funcione y consta en observar el proceso,

monitorearlo, ver cuando el proceso está trabajando de cierta manera estable

y decir que ahora tengo unos buenos estimados. Si yo tengo un proceso que es

altamente ruidos, y utilizo su X-doble barra para trabajar el monitoreo del

proceso, no va a servir para nada. La fase I está asociado con la fase en que yo

estoy observando el proceso para poder decir que el proceso ha estado estable,

que se comporta de manera natural, que no hay nada anormal operando,

entonces en esa fase I estimamos X-doble barra y S. Entonces esos dos

estimados son bien importantes a la hora de establecer los límites. Porque

ahora yo voy a calcular unos límites contra la T2 donde esa T2 usa X-doble

barra y S. Es la fase de monitoreo, de estabilización.

• Fase II entran nuevas observaciones independientes a las observaciones

previas. A las observaciones nuevas le dan un poco mas de incertidumbre. El

límite de control superior para la fase II lo hacen un poco mas grade si m es

pequeño, pero si m es bien grande no se ve la diferencia. Lo que están

pensando es que las nuevas observaciones no fueron utilizadas para estimar

X-doble barra y S, son observaciones independientes de las que use en la fase

I.

o N = tamaño de muestra

o P = el número de parámetros que tenemos

• Ejemplo: Si M = 20, n = 4, P = 2, α = 0.01

o Para fase I:

2 19 320 4 20 2 1 . , ,

38 359 . , ,

1.93 . , ,

1.93 4.98 9.61

Page 17: 03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

03 marzo 2009                                               InIn 6078‐ Sistemas de Control de Calidad 

  

17  

o Para fase II:

42 359 . , ,

2.13 4.98 10.63

• Mirando la T2 que teníamos en este caso si estuviéramos en la fase I, 3 estarían fuera. Si

estuviéramos en la fase II solo dos fuera de control. Depende de la etapa del proceso es que se

determina en qué fase estoy. Típicamente en la fase I hay eliminación de puntos. En otras palabras si

obtengo un punto raro que no se puede probar este punto se elimina y se re-calculan los valores.

• Si el proceso se va a fuera de control de forma lo que comúnmente se haría es realizar gráficos

univariados pero cuando tenemos muchos existe un mecanismo que se conoce como la

descomposición de la T2. En otras palabras, si tengo una señal de fuera de control realizo la

descomposición.

o Donde = t cuadrada evaluada en el instante j

o Donde t cuadrada descartando la variable i.

• En otras palabras va descartando una variable a la vez, pero se podría hacer descartando 2, 3

variables a la vez.

• La básica descomposición que se hace comúnmente es calcular la T2 y luego se re-calcula quitándole

la variable i, por lo que en este caso habría que calcular dos d’s (quitando la variable 1 y quitando la

variable 2).

• grandes implica que esa variable i tiene impacto.

• En este ejemplo se espera que tenga unas dj’s mas o menos iguales porque no se ve mucha la

diferencia entre una y otra, pero va a estar pesado por la varianza de cada uno de ellos.

• Otras de las cosas que se hacen es utilizar el concepto de los componentes principales.

• A partir de la Chi-square podemos dibujar la elipse. Es una elipse teórica. Si un punto se sale fuera

de la elipse puede ser que en el grafico de control de X1 y en el grafico de control X2 este en control

pero esta fuera de la elipse y lo vemos por la correlación que existe.

• Los componentes principales nos dan una ventaja y nos crea un problema.

• X1 y X2 son las variables que estoy midiendo, pero imagínese que se rota el set de eje, donde ahora

son ejes perpendiculares a los datos. En otras palabras si yo miro un eje, ese eje va a ser una

Page 18: 03 2009 InIn 6078 Sistemas Control Calidadacademic.uprm.edu/dgonzalez/6078/07 - Notas clase...03 marzo 2009 InIn 6078‐ Sistemas de Control de Calidad 7 un coeficiente no choca con

03 marzo 2009                                               InIn 6078‐ Sistemas de Control de Calidad 

  

18  

combinación lineal de X1con X2 al igual que el otro eje. La ventaja que tienen es que son

ortogonales.

• El CP1 (componente principal 1) y CP2 (componente principal 2) no están relacionados, son

ortogonales. Se le llamo 1 porque explica más la variabilidad que el componente 2.

• Es una técnica de reducción de dimensiones o “dimention reduction”. Mucha gente lo que hace es no

hacer el Hotelling directo, primero sacan unos componentes principales de las variables y a eso le

aplican el Hotelling, porque ya la estructura de la varianza-covarianza se lo debió de haber quitado.

• La complicación es que se perdieron las unidades originales, tengo combinaciones lineales, y tiene

que venir algún experto a darle la interpretación. La explicación física de lo que es el componente

principal es lo que tiene su complejidad.