View
226
Download
8
Category
Preview:
Citation preview
Programa de certificacin de Black Belts ASQ
VI. Seis Sigma - Anlisis
P. Reyes / Noviembre de 2007
Fase de Anlisis
Propsitos: Establecer hiptesis sobre las posibles Causas RazRefinar, rechazar, o confirmar la Causa RazSeleccionar las Causas Raz ms importantes:Las pocas Xs vitales
Salidas:Causas raz validadasFactores de variabilidad identificados
Llenar columnas del FMEA
Hasta sol. Propuesta y
comprobar causas con
Pruebas de Hiptesis
VI. Anlisis
A. Medicin y modelaje de relacin entre variables
B: Pruebas de hiptesis
C. Anlisis del modo y efecto de falla (AMEF)
D. Mtodos adicionales de anlisis
A. Medicin y modelaje de relacin entre variables
A. Medicin y modelaje de relacin entre variables
1. Coeficiente de correlacin
2. Regresin
3. Herramientas Multivariadas
4. Estudios Multivari
5. Anlisis de datos por atributos
VI.A.1 Coeficiente de correlacin
Definiciones
Correlacin
Regresin
Correlacin
Propsito:Estudiar la posible relacin entre dos variables.
Accidentes laborales
Numero de rdenes urgentes
Correlacin
positiva,
posible
El 1er. paso es realizar una grfica de la informacin.
Graphs are used to visualize relationships or associations between variables. Linear relationships between (primarily) continuous variables can be quantified using the Pearson product moment correlation coefficient (correlation for short) and regression.
When might you use regression and correlation?
To determine if a less expensive (or faster) procedure can be substituted for a procedure currently in use.
As a first step in determining key input variables in a process (correlating input and out put variables).
Coeficiente de correlacin (r )
Mide la fuerza de la relacin lineal entre las variables X y Y en una muestra.
El coeficiente de correlacin muestral de Pearson rx,y con valores entre -1 y +1 es:
Correlacin de la informacin (R ) de las X y las Y
Correlacin Positiva
Evidente
0
5
10
15
20
25
0
5
10
15
20
25
X
Y
Correlacin Negativa
Evidente
0
5
10
15
20
25
0
5
10
15
20
25
X
Y
Correlacin
Positiva
0
5
10
15
20
25
0
5
10
15
20
25
X
Y
Correlacin
Negativa
0
5
10
15
20
25
0
5
10
15
20
25
X
Y
Sin Correlacin
10
15
20
25
5
10
15
20
25
X
Y
0
5
0
R=1
R=>-1
R=-1
R=0
R=>1
Coeficiente de correlacin
El coeficiente de correlacin r asume el mismo signo de la pendiente de la recta 1 siendo cero cuando
1 =0
Un valor positivo de r implica que la pendiente de la lnea es ascendente hacia la derechaUn valor negativo de r implica que la pendiente de la lnea es descendente hacia la derechaSi r=0 no hay correlacin lineal, aunque puede haber correlacin curvilnea
Coeficiente de correlacin
Coeficiente de correlacin
0.8 < r < 1.0
0.3 < r < 0.8
-0.3 < r < 0.3
-0.8 < r < -0.3
-1.0 < r < -0.8
Relacin
Fuerte, positiva
Dbil, positiva
No existe
Dbil, negativa
Fuerte, negativa
Reglas empricas
Tabla de Correlacin mnima
Correlaciones (Pearson)
n 95% 99%
de confianza de confianza
3 1.00 1.00
4 0.95 0.99
5 0.88 0.96
6 0.81 0.92
7 0.75 0.87
8 0.71 0.83
9 0.67 0.80
10 0.63 0.76
11 0.60 0.73
12 0.58 0.71
13 0.53 0.68
14 0.53 0.66
n 95% 99%
de confianza de confianza
15 0.51 0.64
16 0.50 0.61
17 0.48 0.61
18 0.47 0.59
19 0.46 0.58
20 0.44 0.56
22 0.42 0.54
24 0.40 0.52
26 0.39 0.50
28 0.37 0.48
30 0.36 0.46
Para un 95% de confianza, con una muestra de 10,
el coeficiente (r) debe ser al menos .63
La correlacin puede usarse para informacin de atributos, variables normales y variables no normales.
La correlacin puede usarse con un predictor o ms para una respuesta dada.
La correlacin es una prueba fcil y rpida para eliminar factores que no influyen en la prediccin, para una respuesta dada.
Correlacin
Para determinar que tanto se acercan los datos predichos por el modelo a los datos observados aplicando el coeficiente de correlacin de Pearson (ver tabla anterior para identificar la significancia)
Coeficiente de Correlacin
Otra forma para no consultar la tabla de coeficiente de correlacin de Pearson es la r ajustada
Coeficiente de Correlacin ajustado
R2(Adj) = 1 (1 r2)
(n-1)
(n-p)
Donde :
R2(Adj) = Coeficiente de correlacin ajustado
r = Coeficiente de correlacin de Pearson
n = Nmero de datos
p = Nm. trminos en el modelo
(Incluyendo la constante)
Criterios en funcin a la R2(Adj)
> 90% = Correlacin Fuerte
80% - 90% = Buena correlacin
60% - 80% = Correlacin media
40% - 60% = Correlacin dbil
< 40% = No existe correlacin
Coeficiente de Determinacin (R2)
El coeficiente de determinacin es la proporcin de la variacin total explicada por la regresin, R2 se encuentra en el rango de valores de 0 a 1.
Correlacin vs causacin
Tener cuidado de no tener variables colineales, por ejemplo peso de un coche y peso de las personas que transporta, o que no la relacin no tenga sentido, como si lavo mi coche, llueve.
VI.A.2 Regresin
Anlisis de Regresin
El anlisis de regresin es un mtodo estandarizado para localizar la correlacin entre dos grupos de datos, y, quiz ms importante, crear un modelo de prediccin.
Puede ser usado para analizar las relaciones entre:
Una sola X predictora y una sola Y
Mltiples predictores X y una sola Y
Varios predictores X entre s
Supuestos de la regresin lineal
Los principales supuestos que se hacen en el anlisis de regresin lineal son los siguientes:
La relacin entre las variables Y y X es lineal, o al menos bien aproximada por una lnea recta.
El trmino de error tiene media cero.
El trmino de error tiene varianza constante 2.
Los errores no estn correlacionados.
Los errores estn normalmente distribuidos.
Modelo de regresin lineal
Se aume que para cualquier valor de X el valor observado de Y varia en forma aleatoria y tiene una distribucin de probabilidad normal
El modelo general es:
Y = Valor medio de Yi para Xi + error aleatorio
La lnea de regresin se calcula por el mtodo de mnimos cuadrados.
Un residuo es la diferencia entre un punto de referencia en particular (xi, yi) y el modelo de prediccin ( y = a + bx ). El modelo se define de tal manera que la suma de los cuadrados de los residuales es un mnimo. La suma residual de los cuadrados es llamada con frecuencia la suma de los cuadrados de los errores (SSE) acerca de la lnea de regresin
ei
xi
yi
SSE = ei2 = yi - yi2
y = b0 + b1x
Regresin Lineal Simple
a y b son
Estimados de
0 y 1
Grfica de la Lnea de Ajuste
Recta de regresin
Y=-.600.858+5738.89X
R2 = .895
Altura del muelle
Retencin
0.18
0.19
0.20
400
500
600
Interpretacin de los Resultados
El intervalo de prediccin es el grado de certidumbre de la difusin de la Y estimada para puntos individuales X. En general, 95% de los puntos individuales (provenientes de la poblacin sobre la que se basa la lnea de regresin), se encontrarn dentro de la banda [Lneas azules]
La ecuacin de regresin (Y = -600.858 + 5738.89X) describe la relacin entre la variable predictora X y la respuesta de prediccin Y.
R2 (coef. de determinacin) es el porcentaje de variacin explicado por la ecuacin de regresin respecto a la variacin total en el modelo
El intervalo de confianza es una banda con un 95% de confianza de encontrar la Y media estimada para cada valor de X [Lneas rojas]
Interpretacin de los Resultados
Los valores p de la constante (interseccin en Y) y las variables de prediccin, se leen igual que en la prueba de hiptesis.
Ho: El factor no es significativo en la prediccin de la respuesta.
Ha: El factor es significativo en la prediccin de la respuesta.
s es el error estndar de la prediccin = desviacin estndar del
error con respecto a la lnea de regresin.
R2 (ajustada) es el porcentaje de variacin explicado por la regresin, ajustado por el nmero de trminos en el modelo y por
el nmero de puntos de informacin.
El valor p para la regresin se usa para ver si el modelo completo de regresin es significativo.
Ho: El modelo no es significativo en la prediccin de la respuesta.
Ha: El modelo es significativo en la prediccin de la respuesta.
Errores residuales
Los errores se denominan frecuentemente residuales. Podemos observar en la grfica de regresin los errores indicados por segmentos verticales.
Errores residuales
Los residuos pueden ser graficados para:
Checar normalidad.Checar el efecto del tiempo si su orden es conocido en los datos.Checar la constancia de la varianza y la posible necesidad de transformar los datos en Y.Checar la curvatura de ms alto orden que ajusta en las Xs.
A veces es preferible trabajar con residuos estandarizados o estudentizados:
Errores residuales
Anlisis de los errores o residuales
Ejemplo
Considere el problema de predecir las ventas mensuales en funcin del costo de publicidad. Calcular el coeficiente de correlacin, el de determinacin y la recta.
MESPublicidadVentas
11.2101
20.892
31.0110
41.3120
50.790
60.882
71.093
80.675
90.991
101.1105
Clculo manual
Calcular columnas para Suma X, Suma Y, Xi2, XiYi y Yi2
XiYi
MESPublicidadVentas Xi2XiYiYi2
11.21011.44121.210201
20.8920.6473.68464
31.01101.00110.012100
41.31201.6915614400
50.7900.4963.08100
60.8820.6465.66724
71.0931.0093.08649
80.6750.3645.05625
90.9910.8181.98281
101.11051.21115.511025
SUMA9.49599.28924.893,569
Mtodo de mnimos cuadrados
Donde:
Yest = Valor predicho de para un valor particular de x.
b0 =Estimador puntual de .(ordenada al origen)
b1=Estimador puntual de (pendiente)
Para el clculo de b0 y b1 se utilizamos las siguientes frmulas:
Anlisis de varianza en la regresin
La desviacin estndar S corresponde a la raz cuadrada del valor de MSE o cuadrado medio residual.
Los residuos son:
Anlisis de varianza en la regresin
Las conclusiones son como sigue:
Intervalos de confianza para Beta 0 y Beta 1
Anlisis de varianza en la regresin
El intervalo de confianza para la desviacin estndar es:
Intervalos de confianza para la Y estimada promedio
Intervalo de prediccin para un valor particular de Y estimado
Anlisis de varianza en la regresin
Prueba de Hiptesis para Beta 1:
Ho: 1 = 0 contra H1:1 0
Si el coeficiente Beta 1 es significativo
Anlisis de varianza en la regresin
Coeficiente de correlacin r:
Coeficiente de determinacin: r2
R2 mide la proporcin de la variacin total respecto a la media que es explicada por la regresin. Se expresa en porcentaje.
Anlisis de varianza en la regresin
Prueba de hiptesis para el Coeficiente de correlacin r:
H0: = 0 contra H1: 0
Si se rechaza la hiptesis Ho, indicando que existe una correlacin significativa
Riesgos de la regresin
Los modelos de regresin son vlidos como ecuaciones de interpolacin sobre el rango de las variables utilizadas en el modelo. No pueden ser vlidas para extrapolacin fuera de este rango.
Mientras que todos los puntos tienen igual peso en la determinacin de la recta, su pendiente est ms influenciada por los valores extremos de X.
Riesgos de la regresin
Los outliers u observaciones aberrantes pueden distorsionar seriamente el ajuste de mnimos cuadrados.
Si se encuentra que dos variables estn relacionadas fuertemente, no implica que la relacin sea casual, se debe investigar la relacin causa efecto entre ellas. Por ejemplo el nmero de enfermos mentales vs. nmero de licencias recibidas.
Clculo manual (cont..)
Clculo de la recta de regresin lineal:
Sxx = 9.28 - (9.4)^2/10 = 0.444
Sxy = 924.8 - (9.4)(959) / 10 = 23.34
Ymedia = 959 / 10 = 95.9Xmedia = 9.4 / 10 = 0.94
b1 = Sxy / Sxx = 23.34 / 0.444 = 52.57
b0 = Ymedia - b1*Xmedia = 95.9 - (52.5676)(0.94) = 46.49
Yest. = 46.49 + 52.57* X
Ejemplo (cont..)
Clculo de S2 estimador de
S2 = SSE / (n - 2) = Syy - (Sxy)^2/Sxx
Syy = 93,569 - (959)^2 / 10 = 1600.9
SSE = Syy - b1*Sxy = 1600.9 - (52.567)(23.34) = 373.97
S2 = SSE / (n - 2) = 373.97 / 8 = 46.75
S = 6.84
El intervalo de confianza donde caern el 95% de los puntos es el rango de 1.96S = 13.41 o sea a 13.41 de la lnea.
Ejemplo (cont..)
Inferencias respecto a la pendiente de la lnea b1:
Se usa el estadstico t = b1 / (S / Sxx)
El trmino del denominador es el error estndar de la pendiente.
Para probar la hiptesis nula Ho: 1 = 0
En este caso tc = 52.57 / (6.84 / 0.444) = 5.12
El valor crtico tcrit. para alfa/2 = 0.025 con (n-2) = 8 grados de libertad es 2.306.
Como tc > tcrtico se rechaza la hiptesis de que b1 = 0 existiendo la regresin.
Ejemplo (cont..)
Estableciendo un 95% de confianza para la pendiente de la recta b1.
Usando la frmula b1 t0.025 (S / Sxx) se tiene:
52.57 2.306 * 6.84 / 0.444 = 52.57 23.67.
Por tanto una unidad de incremento en publicidad, har que el volumen de ventas se encuentre entre $28.9 a $76.2.
Ejemplo (cont..)
Clculo del coeficiente de Correlacin:
________
r = Sxy / (SxxSyy)
____________
r = 23.34 / 0.444*1600.9 = 0.88
Como r es positivo, la pendiente de la recta apunta hacia arriba y a la derecha.
El coeficiente de determinacin r^2 = 1 - SSE/Syy
r^2 = ( Syy - SSE ) / Syy = 0.774
1. Teclear los datos para Xi y Yi
2. Llamar a TOOLS o HERRAMIENTAS, DATA ANALYSIS o ANALISIS DE DATOS, CORRELATION o CORRELACIN
3. Dar INPUT RANGE (rango de datos), OUTPUT RANGE (para los resultados) y obtener los resultados
Column 1Column 2
Column 11 0.875442
Column 20.8754421
El coeficiente de correlacin r = 0.875442
Anlisis de Regresin
Clculo con Excel)
4. Llamar a TOOLS o HERRAMIENTAS, DATA ANALYSIS o ANALISIS DE DATOS, REGRESION o REGRESIN
3. Dar INPUT RANGE Y (rango de datos Yi), INPUT RANGE X (rango de datos Xi), CONFIDENCE INTERVAL 95%, OUTPUT RANGE (para los resultados), RESIDUAL PLOTS o GRAFICAS DE RESIDUALES y obtener una tabla de resultados como los que se muestran en las pginas siguientes.
NOTAS:
a) La grfica de probabilidad normal debe mostrar puntos fcilmente aproximables por una lnea recta, indicando normalidad.
B) La grfica de residuos estandarizados se deben distribuir en forma aleatoria alrededor de la lnea media igual a cero.
Resultados de Excel
SUMMARY OUTPUT
Regression Statistics
Multiple R0.875442 R Square0.766398
Adjusted R Square0.737198 Standard Error6.83715
Observations10
ANOVA
dfSSMSFSignificance F
Regression1 1226.927 1226.927 26.246330.000904
Residual8 373.973 46.74662
Total9 1600.9
Confidence 95% Coefficients Standard Errort Stat P-value Lower Upper
Intercept46.48649 9.884566 4.702936 0.001536 23.69262 69.28035
X Variable1 52.56757 10.26086 5.123117 0.000904 28.90597 76.22916
La ecuacin de la recta es Yest = 46.48649 + 52.56757 X
Como los valores p para los coeficientes son menores a 0.05, ambos son significativos
Grfica normal de Excel
Chart1
75
82
90
91
92
93
101
105
110
120
Sample Percentile
Y
Normal Probability Plot
Sheet1
11.2101SUMMARY OUTPUT
20.892
31110Regression Statistics
41.3120Multiple R0.8754417701
50.790R Square0.7663982929
60.882Adjusted R Square0.7371980795
7193Standard Error6.8371501096
80.675Observations10
90.991
101.1105ANOVA
dfSSMSFSignificance F
Column 1Column 2Regression11226.9270270271226.92702702726.24632507050.0009037134
Column 11Residual8373.97297297346.7466216216
Column 20.87544177011Total91600.9
CoefficientsStandard Errort StatP-valueLower 95%Upper 95%Lower 95.0%Upper 95.0%
Intercept46.48648648659.88456628274.70293639170.001535622323.692621023669.280351949423.692621023669.2803519494
X Variable 152.567567567610.26085687615.1231167340.000903713428.90597387976.229161256128.90597387976.2291612561
PROBABILITY OUTPUT
PercentileY
575
1582
2590
3591
4592
5593
65101
75105
85110
95120
Sheet1
Sample Percentile
Y
Normal Probability Plot
Sheet2
Sheet3
Grfica de Residuos vs. X de Excel
Chart2
-8.5675675676
3.4594594595
10.9459459459
5.1756756757
6.7162162162
-6.5405405405
-6.0540540541
-3.027027027
-2.7972972973
0.6891891892
X Variable 1
Residuals
X Variable 1 Residual Plot
Sheet1
11.2101SUMMARY OUTPUT
20.892
31110Regression Statistics
41.3120Multiple R0.8754417701
50.790R Square0.7663982929
60.882Adjusted R Square0.7371980795
7193Standard Error6.8371501096
80.675Observations10
90.991
101.1105ANOVA
dfSSMSFSignificance F
Column 1Column 2Regression11226.9270270271226.92702702726.24632507050.0009037134
Column 11Residual8373.97297297346.7466216216
Column 20.87544177011Total91600.9
CoefficientsStandard Errort StatP-valueLower 95%Upper 95%Lower 95.0%Upper 95.0%
Intercept46.48648648659.88456628274.70293639170.001535622323.692621023669.280351949423.692621023669.2803519494
X Variable 152.567567567610.26085687615.1231167340.000903713428.90597387976.229161256128.90597387976.2291612561
RESIDUAL OUTPUTPROBABILITY OUTPUT
ObservationPredicted YResidualsPercentileY
1109.5675675676-8.5675675676575
288.54054054053.45945945951582
399.054054054110.94594594592590
4114.82432432435.17567567573591
583.28378378386.71621621624592
688.5405405405-6.54054054055593
799.0540540541-6.054054054165101
878.027027027-3.02702702775105
993.7972972973-2.797297297385110
10104.31081081080.689189189295120
Sheet1
X Variable 1
Residuals
X Variable 1 Residual Plot
Sheet2
Sample Percentile
Y
Normal Probability Plot
Sheet3
Ejercicio
Calcular la recta de prediccin con sus bandas de confianza, la correlacin y la determinacin para la respuesta de un Taxi, los datos se muestran a continuacin:
DistanciaTiempo
0.8200
2.2400
1.0160
0.6120
1.0360
1.4280
2.2560
0.6320
Relaciones no Lineales
Qu pasa si existe una relacin causal, no lineal?
El siguiente es un conjunto de datos experimentales codificados, sobre resistencia a la compresin de una aleacin especial:
Resistencia a
Concentracin la Compresin
x y
10.025.2 27.3 28.7
15.029.8 31.1 27.8
20.031.2 32.6 29.7
25.031.7 30.1 32.3
30.029.4 30.8 32.8
(ref. Walpole & Myers, 1985)
Y = 19.0333 + 1.00857X - 2.04E-02X**2
R2 = 0.614
Anlisis de Variancia
FUENTE DF SS MS F p
Regresin 2 38.9371 19.4686 9.54490 3.31E-03
Error 12 24.4762 2.0397
Total 14 63.4133
FUENTE DF Seq SS F p
Lineal 1 28.0333 10.3005 6.84E-03
Cuadrtica 1 10.9038 5.34584 3.93E-02
Resultados del Anlisis de Regresin - Modelo Cuadrtico
Regresin cuadrtica
Regresin cuadrtica
Regresin cuadrtica
Los residuos
No son normales
Se deben transformar
Las variables
Otros Patrones No Lineales
A veces es posible transformar una o ambas variables, para mostrar mejor la relacin entre ambas. La meta es identificar la relacin matemtica entre las variables, para que con la variable transformada se obtenga una lnea ms recta. Algunas transformaciones comunes incluyen:
x = 1/x
x = Raz cuadrada de (x)
x = log x
Funciones trigonomtricas: x = Seno
de x
Trasformacin de funciones
Ejemplo: sea se transforma como
Transformacin de variables del ejemplo de regresin cuadrtica
Transformando la variable X = 1/X se tiene, utilizando Minitab
Transformacin de variables del ejemplo de regresin cuadrtica
Transformando la variable X = 1/X se tiene, utilizando Minitab
Transformacin de variables del ejemplo de regresin cuadrtica
Los residuos ahora ya se muestran normales
Transformacin para homoestacidad de la varianza
Algunas transformaciones para estabilizar la varianza
Transformacin para homoestacidad de la varianza
Ejemplo: Se hizo un estudio entre la demanda (Y) y la energa elctrica utilizada (X) durante un cierto periodo de tiempo
Transformacin para homoestacidad de la varianza
Ejemplo: Se hizo un estudio entre la demanda (Y) y la energa elctrica utilizada (X) durante un cierto periodo de tiempo
Transformacin para homoestacidad de la varianza
Se observa que la varianza se incrementa conforme aumenta X
Transformacin para homoestacidad de la varianza
Se observa que la varianza se incrementa conforme aumenta X
Transformacin para homoestacidad de la varianza
Transformando a X por su raz cuadrada se tiene:
Transformacin para homoestacidad de la varianza
Transformando a X por su raz cuadrada se tiene:
Transformacin para homoestacidad de la varianza
Transformando a X por su raz cuadrada se tiene:
Regresin lineal mltiple
Regresin mltiple
Cuando se usa ms de una variable independiente para predecir los valores de una variable dependiente, el proceso se llama anlisis de regresin mltiple, incluye el uso de ecuaciones lineales.
Se asume que los errores u tienen las caractersticas siguientes:
Tienen media cero y varianza comn 2.Son estadsticamente independientes.Estn distribuidos en forma normal.
Regresin mltiple
Estimacin de los parmetros del modelo
Se trata de minimizar los errores cuadrticos en:
El modelo de regresin mltiple en forma matricial es:
Y = X + = [1 : D] +
Y es un vector N x 1.
X es una matriz de orden N x (k + 1), donde la 1. columna es 1s.
es un vector de orden (k + 1) x 1.
es un vector de orden N x 1.
D es la matriz de Xij con i = 1, 2, ..., N; j = 1, 2, ......, k
Regresin mltiple
Estimacin de los parmetros del modelo:
b = (XX)-1 XY
El vector de valores ajustados se puede expresar como:
La varianza del modelo se estima como:
Tamao de muestra
Tomar 5 observaciones para cada una de las variables independientes, si esta razn es menor de5 a 1, se tiene el riesgo de sobreajustar el modelo
Un mejor nivel deseable es tomar 15 a 20 observaciones por cada variable independiente
Ejemplo de regresin mltiple
Un embotellador est analizando las rutas de servicio de mquinas dispensadoras, est interesado en predecir la cantidad de tiempo requerida por el chofer para surtir las mquinas en el local (Y).
La actividad de servicio incluye llenar la mquina con refrescos y un mantenimiento menor.
Se tienen como variables el nmero de envases con que llena la mquina (X1) y la distancia que tiene que caminar (X2).
Ejemplo de regresin mltiple
Ejemplo de regresin mltipleSolucin matricial
Ejemplo de regresin mltipleSolucin matricial
Ejemplo de regresin mltipleSolucin matricial
Ejemplo de regresin mltipleSolucin matricial
Intervalo de confianza para Beta 1
Por tanto el intervalo de confianza para el 95% es:
1.26181 1 1.97001
Ejemplo de regresin mltipleSolucin matricial
El embotellador desea construir un intervalo de confianza sobre el tiempo medio de entrega para un local requiriendo:
X1 = 8 envases y cuya distancia es X2 = 275 pies.
La varianza de la Y0 estimada es (tomando M8=inv(XX) :
Ejemplo de regresin mltipleSolucin matricial
El intervalo de confianza sobre el tiempo medio de entrega para un local requiriendo es para 95% de nivel de confianza:
Que se reduce a: 17.66 Y0 20.78
Ejemplo de regresin mltipleSolucin matricial
El anlisis de varianza es:
Ejemplo de regresin mltipleSolucin matricial
El comportamiento de los residuos es como sigue:
Multicolinealidad
La multicolinealidad implica una dependencia cercana entre regresores (columnas de la matriz X ), de tal forma que si hay una dependencia lineal exacta har que la matriz XX sea singular.
La presencia de dependencias cercanamente lineales impactan dramticamente en la habilidad para estimar los coeficientes de regresin.
La varianza de los coeficientes de la regresin son inflados debido a la multicolinealidad. Es evidente por los valores diferentes de cero que no estn en la diagonal principal de XX. Que son correlaciones simples entre los regresores.
Multicolinealidad
Una prueba fcil de probar si hay multicolinealidad entre dos variables es que su coeficiente de correlacin sea mayor a 0.7
Los elementos de la diagonal principal de la matriz XX se denominan Factores de inflacin de varianza (VIFs) y se usan como un diagnstico importante de multicolinealidad. Para el componente j simo se tiene:
Si es mayor a 10 implica que se tienen serios problemas de multicolinealidad.
Anlisis de los residuos
Los residuos graficados vs la Y estimada, pueden mostrar diferentes patrones indicando adecuacin o no adecuacin del modelo:
Grfica de residuos aleatorios cuya suma es cero (null plot) indica modelo adecuado
Grfica de residuos mostrando una no linealidad curvilnea indica necesidad de transformar las variables
Si los residuos se van abriendo indica que la varianza muestra heteroestacidad y se requiere transformar las variables. Se puede probar con la prueba de Levene de homogeneidad de varianzas
Escalamiento de residuos
En algunos casos es difcil hacer comparaciones directas entre los coeficientes de la regresin debido a que la magnitud de bj refleja las unidades de medicin del regresor Xj. Por ejemplo:
Para facilitarla visualizacin de residuos ante grandes diferencias en los coeficientes, se sugiere estandarizar o estudentizar los residuos
Escalamiento de residuos
Residuos estandarizadosSe obtienen dividiendo cada residuo entre la desviacin estndar de los residuos
Despus de la estandarizacin, los residuos tienen una media de 0 y desviacin estndar de 1
Con ms de 50 datos siguen a la distribucin t, de manera que si exceden a 1.96 (lmite para alfa 0.05) indica significancia estadstica y son outliers
Escalamiento de residuos
Residuos estudentizadosSon similares a los residuos donde se elimina una observacin y se predice su valor, pero adems se elimina la i-sima observacin en el clculo de la desviacin estndar usada para estandarizar la -sima observacin
Puede identificar observaciones que tienen una gran influencia pero que no son detectadas por los residuos estandarizados
H = X (XX)-1X es la matriz sombrero o hat matriz.
Escalamiento de residuos
El estadstico PRESS (Prediction Error Sum of Squares) es una medida similar a la R2 en la regresin. Difiere en que se estiman n-1 modelos de regresin.
En cada modelo se omite una observacin en la estimacin del modelo de regresin y entonces se predice el valor de la observacin omitida con el modelo estimado. El residuo isimo ser:
El residuo PRESS es la suma al cuadrado de los residuos individuales e indica una medida de la capacidad de prediccin
Grficas parciales de regresin
Para mostrar el impacto de casos individuales es ms efectiva la grfica de regresin parcial. Un caso outlier impacta en la pendiente de la ecuacin de regresin (y su coeficiente).
Una comparacin visual de la grfica de regresin parcial con y sin la observacin muestra la influencia de la observacin
El coeficiente de correlacin parcial es la correlacin de la variable independiente Xi la variable dependiente Y cuando se han eliminado de ambos Xi y Y
La correlacin semiparcial refleja la correlacin entre las variables independiente y dependiente removiendo el efecto Xi
Matriz sombrero
Los puntos de influencia son observaciones substancialmente diferentes de las observaciones remanentes en una o ms variables independientes
Contiene valores (sombrero en su diagonal) para cada observacin que representa influencia. Representa los efectos combinados de todos las variables independientes para cada caso
Matriz sombrero
Los valores en la diagonal de la matriz sombrero miden dos aspectos:Para cada observacin miden la distancia de la observacin al centro de la media de todas las observaciones de las variables independientes
Valores altos en la diagonal indica que la observacin tiene mucho peso para la prediccin del valor de la variable dependiente, minimizando su residuoEl rango de valores es de 0 a 1, con media p/n, p es el nmero de predictores y n es el tamao de muestra. Valores lmite se encuentran en 2p/n y 3p/n
Distancia de Mahalanobis
D2 es una medida comparable a los valores sombrero (hat values) que considera slo la distancia de una observacin del valor medio de las variables independientes.
Es otra forma de identificar outliers
La significancia estadstica de la distancia de Malahanobis se puede hacer a partir de tablas del texto:Barnett, V., Outliers in Statistical Data, 2nd. Edition, Nueva York, Wiley, 2984
Influencia en coeficientes individuales
El impacto de eliminar una observacin simple en cada uno de los coeficientes de la regresin mltiple se muestra con la DFBETA y su versin estandarizada SDFBETA.
Se sugiere aplicar como lmites 1.0 o 2 para tamaos de muestra pequeos y n para muestras medias y grandes
La distancia de Cook (Di) captura el impacto de una observacin:La dimensin del cambio en los valores pronosticados cuando se omite la observacin y la distancia de las otras observaciones, el lmite es 1 o 4/(n-k-1)
Influencia en coeficientes individuales
La medida COVRATIO estima el efecto de la observacin en la eficiencia del proceso, en sus errores estndar de los coeficientes de la regresin. Considera a todos los coeficientes colectivamente.
El lmite puede ser establecido en 1 3p/n, los valores mayores al lmite hacen el proceso ms eficiente y los menores ms ineficiente
La medida SDFFIT es el grado en que cambian los valores ajustados o pronosticados cuando el caso se elimina. El valor lmite es 2*raz((k+1)/(n-k-1))
Ejemplo de regresin mltipleSolucin con Excel y Minitab
Ejemplo de Regresin Mltiple
Cat. (US News) GMAT Salario Inicial ($) % Aceptacin
Stanford1711820007.4
Harvard26708000012.8
Penn (Wharton)36627900014.7
MIT (Sloan)46507800015.1
Chicago56806500025.0
Northwestern66607000016.0
Columbia76608300014.8
Dartmouth86707000012.6
Duke96466750020.5
Berkeley106537000013.3
Virginia116606600018.9
Michigan126456500028.0
NYU136467058320.9
Carnegie Mellon146406720030.8
Yale156756500023.5
U.N.C.166306000019.8
UCLA176516500017.5
Texas-Austin186306000027.3
Indiana196306150044.7
Cornell206376400025.4
Rochester216305850036.0
Ohio State226116100023.2
Emory236266000033.0
Purdue246036370020.7
Maryland256405300018.9
Interpretacin de Resultados de Excel- Regresin Multiple
SUMMARY OUTPUT
Regression Statistics
Multiple R0.8749313 R Square0.76550478
Adjusted R Square0.732005463 Standard Error4050.855918 Observations25
ANOVA
dfSS MS F Significance F
Regression31.12E+09 374977790.122.8513558.17E-07
Residual213.45E+08 16409433.67
Total241.47E+09
Coefficients Standard t Stat P-value Lower 95% U pper 95%
Error
Intercept 122481.40 41473.13 2.9532710810.007589 36233.29208729.5
X Variable1 -926.873 198.8104 -4.662094325 0.0001336 -1340.32-513.424
X Variable2 -59.9488 60.44875 -0.991730876 0.3326192 -185.65965.76118
X Variable3 -191.7291 125.6138 -1.526337637 0.1418472 -452.95769.49917
Resultados de Excel- Regresin slo con slo X1
SUMMARY OUTPUT
Regression Statistics
Multiple R0.855974
R Square0.732691
Adjusted R Square0.721069
Standard Error4132.688
Observations25
ANOVA
dfSSMS F Significance F
Regression11.08E+091.08E+09 63.042644.88E-08
Residual233.93E+0817079107
Total241.47E+09
Coefficients Standard Errort StatP-valueLower 95% Upper 95%
Intercept79230.32 1703.95146.498012.98E-2475705.43405 82755.20595
X Variable1 -910.077 114.6201-7.939944.88E-08-1147.186411 -672.9674353
Con slo X1, el Modelo se simplifica enormemente
poca importancia prctica se pierde en R2 (ajustada)
La ecuacin de regresin es:
y = 79230 - 910 x
Predictor Coef Desv. EstndarTp
Constante 792301704 46.500.000
x -910.1114.6-7.940.000
S = 4133 R2 = 73.3% R2 (ajustada) = 72.1%
Anlisis de Variancia
Fuente DFSS MS F p
Regresin11076712008 1076712008 63.04 0.000
Error 23392819470 17079107
Total 241469531477
Reduccin del Modelo
Vuelva a correr la regresin usando la categora
US News, como el nico agente de prediccin (predictor)
El Modelo se simplifica enormemente..poca
importancia prctica se pierde en R2 (ajustada)
Corrida en Minitab
Se introducen los datos en varias columnas C1 a C5 incluyendo la respuesta Y (heatflux) y las variables predictoras Xs (North, South, East)
HeatFluxInsolationEastSouthNorth
271.8783.3533.5340.5516.66
264.0748.4536.5036.1916.46
238.8684.4534.6637.3117.66
230.7827.8033.1332.5217.50
251.6860.4535.7533.7116.40
257.9875.1534.4634.1416.28
Corrida en Minitab
Utilzar el archivo de ejemplo Exh_regr.mtwOpcin: Stat > Regression > RegressionPara regresin lineal indicar la columna de respuesta Y (Score2) y X (Score1)
En Regresin lienal en opciones se puede poner un valor Xo para predecir la respuesta e intervalos. Las grficas se obtienen Stat > Regression > Regression > Fitted line Plots
Para regresin mltiple Y (heatflux) y las columnas de los predictores (north, south, east)
Resultados de la regresin lineal
The regression equation is
Score2 = 1.12 + 0.218 Score1
Predictor Coef SE Coef T P
Constant 1.1177 0.1093 10.23 0.000
Score1 0.21767 0.01740 12.51 0.000
S = 0.1274 R-Sq = 95.7% R-Sq(adj) = 95.1%
Analysis of Variance
Source DF SS MS F P
Regression 1 2.5419 2.5419 156.56 0.000
Residual Error 7 0.1136 0.0162
Total 8 2.6556
Predicted Values for New Observations
New Obs Fit SE Fit 95.0% CI 95.0% PI
1 2.6414 0.0474 ( 2.5292, 2.7536) ( 2.3197, 2.9631)
New Obs Score1
1 7.00
Resultados de la regresin lineal
3044.txt
Fitted Line Plot: Score2 versus Score1NCNFitted Line Plot: Score2 versus Score1;; HMF V1.24 TEXT;; (Microsoft Win32 Intel 386) HOOPS 5.00-17 I.M. 3.00-17(Selectability "windows=off,geometry=on")(Visibility "on")(Color_By_Index "Geometry,Face Contrast" 1)(Color_By_Index "Window" 0)(Window_Frame "off")(Window -1 1 -1 1)(Camera (0 0 -5) (0 0 0) (0 1 0) 2 2 "Stretched")
;; (Driver_Options "no backing storeno borderno control areadisable input,no do;; uble-bufferingno double bufferingno force black-and-whiteno force black and ;; whiteno gamma correctionsubscreen=(-0.999902,-0.476464,-0.99987,-0.301952),n;; o subscreen creatingno subscreen movingno subscreen resizingno subscreen str;; etchingno update interrupts,use window id=1049426")(Edge_Pattern "---")(Edge_Weight 1)(Face_Pattern "solid")(Heuristics "no related selection limit")(Line_Pattern "---")(Line_Weight 1)(Marker_Size 0.421875)(Marker_Symbol ".")(Text_Font "name=arial-gdi-vector,no transforms,rotation=follow path")(User_Options "mtb aspect ratio=0.675953,graphicsversion=6,worksheettitle=\"Exh_regr.MTW\",optiplot=0,builtin=0,statguideid=2151,toplayer=0,angle=0,arrowdir=0,arrowstyle=0,polygon=0,isdata=0,textfollowpath=1,ldfill=0,solidfill=0,3d=0,usebitmap=0,canbrush=0,brushrows=9,light scaling=0.00000,sessionline=-1")(Segment "include" ())(Front ((Segment "figure1" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=0") (Front ((Segment "region" ((Front ((Segment "figure box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Face" 0) (Color_By_Index "Face Contrast,Line,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "solid") (Line_Pattern "---") (Line_Weight 1) (User_Options "solidfill=1") (Segment "" ( (Polygon ((-0.99995 -0.99995 0) (0.99995 -0.99995 0) (0.99995 0.99995 0) (-0.99995 0.99995 0))))))) (Segment "data box" ( (Visibility "faces=off") (Color_By_Index "Polygon,Face Contrast,Line" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "/") (Line_Pattern "---") (Line_Weight 1) (User_Options "ldfill=1,solidfill=1") (Segment "" ( (Polygon ((-0.649967 -0.59997 0) (0.499975 -0.59997 0) (0.499975 0.59997 0) (-0.649967 0.59997 0))))))) (Segment "legend box" ()) (Segment "legend" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=1") (Front ((Segment "symbol1" ()))))))))) (Segment "object" ((Front ((Segment "frame" ( (Window_Pattern "clear") (Window -1 1 -1 1) (Front ((Segment "tick" ((Front ((Segment "set1" ( (Color_By_Index "Face Contrast,Line,Text,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Line_Pattern "---") (Line_Weight 1) (Text_Alignment "^*") (Text_Font "name=arial-gdi-vector,size=0.0237 sru") (Segment "" ( (Text 0.458822 -0.669966 0 "9"))) (Segment "" ( (Text 0.303281 -0.669966 0 "8"))) (Segment "" ( (Text 0.147739 -0.669966 0 "7"))) (Segment "" ( (Text -7.8023e-3 -0.669966 0 "6"))) (Segment "" ( (Text -0.163344 -0.669966 0 "5"))) (Segment "" ( (Text -0.318885 -0.669966 0 "4"))) (Segment "" ( (Text -0.474427 -0.669966 0 "3"))) (Segment "" ( (Text -0.629968 -0.669966 0 "2"))) (Segment "major" ( (Segment "" ((Polyline ((0.458822 -0.59997 0) (0.458822 -0.639968 0) )))) (Segment "" ((Polyline ((0.303281 -0.59997 0) (0.303281 -0.639968 0) )))) (Segment "" ((Polyline ((0.147739 -0.59997 0) (0.147739 -0.639968 0) )))) (Segment "" ((Polyline ((-7.8023e-3 -0.59997 0) (-7.8023e-3 -0.639968 0))))) (Segment "" ((Polyline ((-0.163344 -0.59997 0) (-0.163344 -0.639968 0))))) (Segment "" ((Polyline ((-0.318885 -0.59997 0) (-0.318885 -0.639968 0))))) (Segment "" ((Polyline ((-0.474427 -0.59997 0) (-0.474427 -0.639968 0))))) (Segment "" ((Polyline ((-0.629968 -0.59997 0) (-0.629968 -0.639968 0))))))))) (Segment "set2" ( (Color_By_Index "Face Contrast,Line,Text,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Line_Pattern "---") (Line_Weight 1) (Text_Alignment "*>") (Text_Font "name=arial-gdi-vector,size=0.0237 sru") (Segment "" ( (Text -0.719964 0.579971 0 "3.5"))) (Segment "" ( (Text -0.719964 0.075074 0 "2.5"))) (Segment "" ( (Text -0.719964 -0.429823 0 "1.5"))) (Segment "major" ( (Segment "" ((Polyline ((-0.649967 0.579971 0) (-0.689965 0.579971 0 ))))) (Segment "" ((Polyline ((-0.649967 0.075074 0) (-0.689965 0.075074 0 ))))) (Segment "" ((Polyline ((-0.649967 -0.429823 0) (-0.689965 -0.429823 0))))))))))))) (Segment "grid" ()) (Segment "reference" ()) (Segment "axis" ((Front ((Segment "set1" ( (Color_By_Index "Face Contrast,Line,Text,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Line_Pattern "---") (Line_Weight 1) (Text_Alignment "^*") (Text_Font "name=arial-gdi-vector,size=0.04232 sru") (Segment "" ( (Text -0.0749962 -0.734996 0 "Score1"))) (Segment "" ( (Polyline ((-0.629968 -0.59997 0) (0.479976 -0.59997 0))) )))) (Segment "set2" ( (Color_By_Index "Face Contrast,Line,Text,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Line_Pattern "---") (Line_Weight 1) (Text_Alignment "*>") (Text_Font "name=arial-gdi-vector,size=0.04232 sru") (Text_Path 6.12303e-17 1 0) (Segment "" ( (Selectability "polygons=on!,text=off") (Visibility "polygons=off") (Text_Alignment "v>") (Text_Path 0 1 0) (User_Options "angle=90,polygon=3,linect=1,charct=6") (Polygon ((-0.873407 -0.143496 0) (-0.873407 0.128338 0) (-0.780317 0.128338 0) (-0.780317 -0.143496 0))) (Renumber (Text -0.803589 -0.143496 0 "Score2") 1 "L") (Segment "raw" ((Visibility "off")(Renumber (Text 0 0 0 "Score2") 1 "L"))))) (Segment "" ( (Polyline ((-0.649967 -0.579971 0) (-0.649967 0.579971 0))))))))))))))) (Segment "data" ( (Window_Pattern "clear") (Window -0.63 0.48 -0.58 0.58) (User_Options "isdata=1,viewinfigurecoord=1") (Front ((Segment "symbol1" ((Segment "points" ( (Color_By_Index "Marker" 1) (Marker_Size 0.421875) (Marker_Symbol "@") (User_Options "canbrush=1,brushsetup=0,grouping=0") (Segment "" ( (Marker_Size 0.210938) (Marker_Symbol "@") (User_Value 9) (Marker 0.541453 0.129438 0))) (Segment "" ( (Marker_Size 0.210938) (Marker_Symbol "@") (User_Value 8) (Marker 0.68158 0.390592 0))) (Segment "" ( (Marker_Size 0.210938) (Marker_Symbol "@") (User_Value 7) (Marker 0.961835 0.738796 0))) (Segment "" ( (Marker_Size 0.210938) (Marker_Symbol "@") (User_Value 6) (Marker -0.411414 -0.218767 0))) (Segment "" ( (Marker_Size 0.210938) (Marker_Symbol "@") (User_Value 5) (Marker 0.821708 0.564694 0))) (Segment "" ( (Marker_Size 0.210938) (Marker_Symbol "@") (User_Value 4) (Marker 0.12107 0.129438 0))) (Segment "" ( (Marker_Size 0.210938) (Marker_Symbol "@") (User_Value 3) (Marker -0.803771 -0.566972 0))) (Segment "" ( (Marker_Size 0.210938) (Marker_Symbol "@") (User_Value 2) (Marker -0.943899 -0.741074 0))) (Segment "" ( (Marker_Size 0.210938) (Marker_Symbol "@") (User_Value 1) (Marker -0.411414 -0.218767 0))))))))))))))) (Segment "labels" ((Window_Pattern "clear")(Window -1 1 -1 1))) (Segment "annotation" ((Window_Pattern "clear")(Window -1 1 -1 1)(Front ((Segment "line1" ( (Color_By_Index "Face Contrast,Line,Edge" 1) (Edge_Pattern "---") (Edge_Weight 2) (Line_Pattern "---") (Line_Weight 2) (Segment "" ( (Polyline ((-0.59886 -0.381059 0) (-0.556553 -0.351166 0) (-0.514246 -0.321272 0) (-0.471938 -0.291379 0) (-0.429631 -0.261486 0) (-0.387324 -0.231593 0) (-0.345016 -0.2017 0) (-0.302709 -0.171807 0) (-0.260402 -0.141914 0) (-0.218094 -0.112021 0) (-0.175787 -0.0821275 0) (-0.13348 -0.0522344 0) (-0.0911726 -0.0223413 0) (-0.0488653 7.55185e-3 0) (-6.55797e-3 0.037445 0) (0.0357493 0.0673381 0) (0.0780566 0.0972312 0) (0.120364 0.127124 0) (0.162671 0.157017 0) (0.204979 0.186911 0) (0.247286 0.216804 0) (0.289593 0.246697 0) (0.3319 0.27659 0) (0.374208 0.306483 0) (0.416515 0.336376 0) (0.458822 0.366269 0))))))) (Segment "line2" ( (Color_By_Index "Face Contrast,Line,Edge" 2) (Edge_Pattern "...") (Edge_Weight 2) (Line_Pattern "...") (Line_Weight 2) (Segment "" ( (Polyline ((-0.59886 -0.290846 0) (-0.556553 -0.265568 0) (-0.514246 -0.240158 0) (-0.471938 -0.214594 0) (-0.429631 -0.188847 0) (-0.387324 -0.162886 0) (-0.345016 -0.13667 0) (-0.302709 -0.110154 0) (-0.260402 -0.083287 0) (-0.218094 -0.0560112 0) (-0.175787 -0.0282673 0) (-0.13348 2.67253e-6 0)(-0.0911726 0.0288487 0) (-0.0488653 0.0583064 0) (-6.55797e-3 0.0883915 0) (0.0357493 0.119097 0) (0.0780566 0.150395 0) (0.120364 0.182239 0) (0.162671 0.214574 0) (0.204979 0.247342 0) (0.247286 0.280482 0) (0.289593 0.313941 0) (0.3319 0.347672 0) (0.374208 0.381632 0) (0.416515 0.415787 0) (0.458822 0.450107 0))))))) (Segment "line3" ( (Color_By_Index "Face Contrast,Line,Edge" 2) (Edge_Pattern "...") (Edge_Weight 2) (Line_Pattern "...") (Line_Weight 2) (Segment "" ( (Polyline ((-0.59886 -0.471271 0) (-0.556553 -0.436763 0) (-0.514246 -0.402387 0) (-0.471938 -0.368165 0) (-0.429631 -0.334125 0) (-0.387324 -0.3003 0) (-0.345016 -0.26673 0) (-0.302709 -0.233459 0) (-0.260402 -0.20054 0) (-0.218094 -0.16803 0) (-0.175787 -0.135988 0) (-0.13348 -0.104471 0) (-0.0911726 -0.0735312 0) (-0.0488653 -0.0432027 0) (-6.55797e-3 -0.0135016 0) (0.0357493 0.015579 0) (0.0780566 0.0440677 0) (0.120364 0.0720096 0) (0.162671 0.0994604 0) (0.204979 0.126479 0) (0.247286 0.153125 0) (0.289593 0.179452 0) (0.3319 0.205508 0) (0.374208 0.231333 0) (0.416515 0.256965 0) (0.458822 0.282432 0))))))) (Segment "line4" ( (Color_By_Index "Face Contrast,Line,Edge" 4) (Edge_Pattern "-.-") (Edge_Weight 2) (Line_Pattern "-.-") (Line_Weight 2) (Segment "" ( (Polyline ((-0.59886 -0.204108 0) (-0.556553 -0.176522 0) (-0.514246 -0.148782 0) (-0.471938 -0.120882 0) (-0.429631 -0.0928156 0) (-0.387324 -0.0645779 0) (-0.345016 -0.0361636 0 ) (-0.302709 -7.56797e-3 0) (-0.260402 0.0212134 0) (-0.218094 0.0501842 0) (-0.175787 0.0793478 0) (-0.13348 0.108707 0) (-0.0911726 0.138263 0) (-0.0488653 0.168018 0) (-6.55797e-3 0.197972 0) (0.0357493 0.228125 0) (0.0780566 0.258475 0) (0.120364 0.289022 0) (0.162671 0.319763 0) (0.204979 0.350695 0) (0.247286 0.381814 0) (0.289593 0.413116 0) (0.3319 0.444596 0) (0.374208 0.47625 0) (0.416515 0.508072 0) (0.458822 0.540057 0))))))) (Segment "line5" ( (Color_By_Index "Face Contrast,Line,Edge" 4) (Edge_Pattern "-.-") (Edge_Weight 2) (Line_Pattern "-.-") (Line_Weight 2) (Segment "" ( (Polyline ((-0.59886 -0.55801 0) (-0.556553 -0.525809 0) (-0.514246 -0.493763 0) (-0.471938 -0.461877 0) (-0.429631 -0.430157 0) (-0.387324 -0.398608 0) (-0.345016 -0.367236 0) ( -0.302709 -0.336046 0) (-0.260402 -0.305041 0) (-0.218094 -0.274225 0) (-0.175787 -0.243603 0) (-0.13348 -0.213176 0) (-0.0911726 -0.182946 0) (-0.0488653 -0.152914 0) (-6.55797e-3 -0.123082 0) (0.0357493 -0.0934486 0) (0.0780566 -0.0640131 0)(0.120364 -0.0347738 0) (0.162671 -5.7283e-3 0) (0.204979 0.0231263 0) (0.247286 0.0517937 0) (0.289593 0.080278 0) (0.3319 0.108584 0) (0.374208 0.136716 0) (0.416515 0.16468 0)(0.458822 0.192482 0))))))))))))))) (Segment "figure2" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=0") (Front ((Segment "region" ((Front ((Segment "figure box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Face" 0) (Color_By_Index "Face Contrast,Line,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "solid") (Line_Pattern "---") (Line_Weight 1) (User_Options "solidfill=1") (Segment "" ( (Polygon ((-0.99995 -0.99995 0) (0.99995 -0.99995 0) (0.99995 0.99995 0) (-0.99995 0.99995 0))))))) (Segment "data box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Polygon,Face Contrast,Line" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "/") (Line_Pattern "---") (Line_Weight 1) (User_Options "ldfill=1,solidfill=1") (Segment "" ( (Polygon ((-0.299985 0.559972 0) (0.299985 0.559972 0) (0.299985 0.839958 0) (-0.299985 0.839958 0))))))) (Segment "legend box" ()) (Segment "legend" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=1") (Front ((Segment "symbol1" ()))))))))) (Segment "object" ((Front ((Segment "frame" ( (Window_Pattern "clear") (Window -1 1 -1 1) (Front ((Segment "tick" ()) (Segment "grid" ()) (Segment "reference" ()) (Segment "axis" ()))))) (Segment "data" ( (Window_Pattern "clear") (Window -0.28 0.28 0.58 0.82) (User_Options "isdata=1,viewinfigurecoord=1") (Front ((Segment "symbol1" ((Segment "points" ( (Color_By_Index "Marker" 1) (Marker_Size 0.421875) (Marker_Symbol "@") (Segment "" ()) (Segment "" ()))))))))))))) (Segment "labels" ((Window_Pattern "clear")(Window -1 1 -1 1)(Front ((Segment "symbol1" ( (Text_Alignment "v*") (Text_Font "size=0.02539 sru") (User_Options "isdata=0") (Segment "" ( (Text 0 0.668966 0 "S = 0.127419 R-Sq = 95.7 % R-Sq(adj) = 95.1 %"))) (Segment "" ( (Text 0 0.780961 0 "Score2 = 1.11771 + 0.217670 Score1"))))))))) (Segment "annotation" ((Window_Pattern "clear")(Window -1 1 -1 1))))))) (Segment "figure3" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=0") (Front ((Segment "region" ((Front ((Segment "figure box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Face" 0) (Color_By_Index "Face Contrast,Line,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "solid") (Line_Pattern "---") (Line_Weight 1) (User_Options "solidfill=1") (Segment "" ( (Polygon ((-0.99995 -0.99995 0) (0.99995 -0.99995 0) (0.99995 0.99995 0) (-0.99995 0.99995 0))))))) (Segment "data box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Polygon,Face Contrast,Line" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "/") (Line_Pattern "---") (Line_Weight 1) (User_Options "ldfill=1,solidfill=1") (Segment "" ( (Polygon ((0.499975 -0.79996 0) (0.99995 -0.79996 0) (0.99995 0 0 ) (0.499975 0 0))))))) (Segment "legend box" ()) (Segment "legend" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=1") (Front ((Segment "symbol1" ()))))))))) (Segment "object" ((Front ((Segment "frame" ( (Window_Pattern "clear") (Window -1 1 -1 1) (Front ((Segment "tick" ()) (Segment "grid" ()) (Segment "reference" ()) (Segment "axis" ()))))) (Segment "data" ( (Window_Pattern "clear") (Window 0.52 0.98 -0.78 -0.02) (User_Options "isdata=1,viewinfigurecoord=1") (Front ((Segment "symbol1" ((Segment "points" ( (Color_By_Index "Marker" 1) (Marker_Size 0.421875) (Marker_Symbol "@") (Segment "" ()) (Segment "" ()) (Segment "" ()))))))))))))) (Segment "labels" ((Window_Pattern "clear")(Window -1 1 -1 1)(Front ((Segment "symbol1" ( (Text_Alignment "v*") (Text_Font "size=0.02539 sru") (User_Options "isdata=0") (Segment "" ( (Text 0.80746 -0.564972 0 "95% PI"))) (Segment "" ( (Text 0.80746 -0.469977 0 "95% CI"))) (Segment "" ( (Text 0.813209 -0.374981 0 "Regression"))))))))) (Segment "annotation" ((Window_Pattern "clear")(Window -1 1 -1 1))))))) (Segment "figure4" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=0") (Front ((Segment "region" ((Front ((Segment "figure box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Face" 0) (Color_By_Index "Face Contrast,Line,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "solid") (Line_Pattern "---") (Line_Weight 1) (User_Options "solidfill=1") (Segment "" ( (Polygon ((-0.99995 -0.99995 0) (0.99995 -0.99995 0) (0.99995 0.99995 0) (-0.99995 0.99995 0))))))) (Segment "data box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Polygon,Face Contrast,Line" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "/") (Line_Pattern "---") (Line_Weight 1) (User_Options "ldfill=1,solidfill=1") (Segment "" ( (Polygon ((0.499975 -0.79996 0) (0.99995 -0.79996 0) (0.99995 0 0 ) (0.499975 0 0))))))) (Segment "legend box" ()) (Segment "legend" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=1"))))))) (Segment "object" ((Front ((Segment "frame" ( (Window_Pattern "clear") (Window -1 1 -1 1) (Front ((Segment "tick" ()) (Segment "grid" ()) (Segment "reference" ()) (Segment "axis" ()))))) (Segment "data" ( (Window_Pattern "clear") (Window 0.52 0.98 -0.78 -0.02) (User_Options "isdata=1,viewinfigurecoord=1") (Front ((Segment "symbol1" ((Segment "points" ( (Color_By_Index "Marker" 1) (Marker_Size 0.421875) (Marker_Symbol "@") (Segment "" ()) (Segment "" ()) (Segment "" ()) (Segment "" ()) (Segment "" ()) (Segment "" ()))))) (Segment "connect1" ((Color_By_Index "Face Contrast,Line,Edge" 1)(Edge_Pattern "---")(Edge_Weight 1)(Line_Pattern "---")(Line_Weight 1)(Front ((Segment "group1" ( (Color_By_Index "Face Contrast,Line,Edge" 1) (Edge_Pattern "---") (Edge_Weight 2) (Line_Pattern "---") (Line_Weight 2) (Segment "" ( (Polyline ((-0.79996 0.124994 0) (-0.299985 0.124994 0))) )))) (Segment "group2" ( (Color_By_Index "Face Contrast,Line,Edge" 2) (Edge_Pattern "...") (Edge_Weight 2) (Line_Pattern "...") (Line_Weight 2) (Segment "" ( (Polyline ((-0.79996 -0.124994 0) (-0.299985 -0.124994 0))))))) (Segment "group3" ( (Color_By_Index "Face Contrast,Line,Edge" 4) (Edge_Pattern "-.-") (Edge_Weight 2) (Line_Pattern "-.-") (Line_Weight 2) (Segment "" ( (Polyline ((-0.79996 -0.374981 0) (-0.299985 -0.374981 0))))))))))))))))))) (Segment "labels" ((Window_Pattern "clear")(Window -1 1 -1 1))) (Segment "annotation" ((Window_Pattern "clear")(Window -1 1 -1 1))))))) (Segment "annotation" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "toplayer=1") (Front ((Segment "text1" ((Color_By_Index "Text" 1)(Text_Alignment "^*")(Text_Font "name=arial-gdi-vector,size=0.05078 sru")(Segment "" ( (Text 0 0.979951 0 "Regression Plot")))))))))))w_Pattern "clear")(Window -1 1 -1 1))))))) (Segment "annotation" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "toplayer=1") (Front ((Segment "text1" ((Color_By_Index "Text" 1)(Text_Alignment "^*")(Text_Font "name=arial-gdi-vector,size=0.05078 sru")(Segment "" ( (Text 0 0.979951 0 "Regression Plot")))))))))))
Resultados de la regresin Mltiple
The regression equation is
HeatFlux = 389 - 24.1 North + 5.32 South + 2.12 East
Predictor Coef SE Coef T P
Constant 389.17 66.09 5.89 0.000
North -24.132 1.869 -12.92 0.000
South 5.3185 0.9629 5.52 0.000
East 2.125 1.214 1.75 0.092
S = 8.598 R-Sq = 87.4% R-Sq(adj) = 85.9%
Analysis of Variance
Source DF SS MS F P
Regression 3 12833.9 4278.0 57.87 0.000
Residual Error 25 1848.1 73.9
Total 28 14681.9
Source DF Seq SS
North 1 10578.7
South 1 2028.9
East 1 226.3
Resumen de la Regresin
La regresin slo puede utilizarse con informacin de variables continuas.
Los residuos deben distribuirse normalmente con media cero.
Importancia prctica: (R2). Importancia estadstica: (valores p)
La regresin puede usarse con un predictor X o ms,
para una respuesta dada
Reduzca el modelo de regresin cuando sea posible,
sin perder mucha importancia prctica
VI.A.4 Herramientas multivariadas
Herramientas multivariadas
1. Introduccin
2. Anlisis de componentes principales
3. Anlisis factorial
4. Anlisis discriminante
5. MANOVA
Introduccin
En el anlisis multivariado se incluyen dos o ms variables dependientes Y1, Y2, etc. Consideradas simultneamente para las variables independientes X1, X2, ., Xn
Normalmente se resuelven con herramientas computacionales tales como Minitab y SPSS.
Entre las herramientas principales se encuentran:Componentes principales, anlisis factorial, anlisis discriminante, anlisis de conglomerados, anlisis cannico, MANOVA
Anlisis de componentes principales
El anlisis (PCA) y el anlisis factorial (FA) se usan para encontrar patrones de correlacin entre muchas variables posibles y subconjuntos de datos
Busca reducirlas a un menor nmero de componentes o factores que representen la mayor parte de la varianza.
Normalmente se requieren al menos cinco observaciones por variable
Anlisis de componentes principales
Pasos de anlisis en MinitabSe usa una matriz de correlacin para determinar la relacin entre componentesLas matrices definen cantidades como eigenvalores y eigenvectoresSe suman los eigenvalores y se calculan las proporciones de cada componenteSe identifican los PC1, PC2, que explican la mayor parte de la varianzaSe puede hacer un diagrama de Pareto como apoyo
Ejemplo: Alimentos en Europa
Corrida en Minitab
2Stat > Multivariate > Principal components
3En Variables, X1, X2, X3, X4, X6, X7, X8, X9
4En Number of factors to extract, 3. Seleccionar Correlation Matrix
5Click Graphs y seleccionar Scree Plot, Score plot for first 2 components Loading plot for first 2 components
8 Click Storage e indicar las columnas donde se guarden los coeficientes y los valores Z (scores) Coef1 Coef 2 y Z1 Z2
9. Click OK en cada uno de los cuadros de dilogo
Ejemplo: Alimentos en Europa
Dos componentes exceden
El eigenvalor de ref. de 1
Ejemplo: Alimentos en Europa
Anlisis factorial
Es una tcnica de reduccin de variables para identificar factores que expliquen la variacin, aunque se reiere un juicio subjetivo.
Las variables de salida estn relacionadas linealmente con las variables de entrada.
Las variables deben ser medibles y simtricas. Debe haber cuatro o ms factores de entrada para cada variable independiente
Anlisis factorial
Se especifican un cierto nmero de factores comunes
El anlisis factorial se hace en dos etapas:Extraccin de factores, para identificar los factores principales para un estudio posteriorRotacin de factores, para hacerlos ms significativos
Corrida con Minitab
2Stat > Multivariate > Factor Analysis.
3En Variables, X1, X2, X3, X4, X6, X7, X8, X9
4En Number of factors to extract, 4.
En Method of Extraction, seleccionar Principal components
6En Type of Rotation, seleccionar Varimax.
7Click Graphs y seleccionar Loading plot for first 2 factors y Scree Plot.
Click Results y seleccionar Sort loadings.
Seleccionar Storage e indicar columnas para ponderaciones, coeficientes, Zs, eigenvalores, etc.
Click OK en cada uno de los cuadros de d
Ejemplo
Ejemplo:
Anlisis discriminante
Si se tiene una muestra con grupos conocidos, el anlisis discriminante clasifica las observaciones o atributos en dos o ms grupos
Puede utilizarse como herramienta predictiva o descriptiva
Las variables deben ser multivariadamente normales, con la misma varianza y covarianza poblacional entre variables dependientes, y las muestras exhiben independencia
Ejemplo de actividades en pases
Corrida con Minitab
2Stat > Multivariate > Discriminant Analysis.
3En Groups, poner SalmonOrigin.
4 En Predictors, poner Freshwater Marine. Click OK.
Corrida con Minitab
Anlisis de conglomerados
Anlisis de conglomerados
Se usa para determinar agrupaciones o clasificaciones de un conjunto de datos
Las personas se pueden agrupar por IQ, padres, hbitos de estudio, etc.
Se trata de dar sentido a grandes cantidades de datos de cuestionarios, ecnuestas, etc.
Ejemplo
Suponer que un estudio de mercado trata de determinar segmentos de mercado en base a los patrones de lealtad de marcas (V1) y tiendas (V2), medidas del 0 al 10 en 7 personas (A-G).
VariablesV1V2A32B45C47D27E66F77G64
Corrida en Minitab
Stat > Multivariate Anlisis > Cluster Observations Distance Measured Euclidean Seleccionar Show Dendogram OK
Anlisis de correlacin cannico
Prueba la hiptesis de que los efectos pueden tener causas mltiples y de que las causas pueden tener efectos mltiples (Hotelling 1935)
Es como una regresin mltiple para determinar la correlacin entre dos conjuntos de combinaciones lieneales, cada conjunto puede tener varias variables relacionadas.La relacin de un conjunto de variables dependientes a un conjunto de variables independientes forma combinaciones lineales
Anlisis de correlacin cannico
Se usan los ms altos valores de correlacin para los conjuntos. Los pares de combinaciones lineales se denominan variates cannicas con correlaciones cannicas (Rc con valor mayor a 0.3)
Por ejemplo se quiere determinar si hay una correlacin entre las caractersticas de un ingeniero industrial y las habilidades requeridas en la descripcin de puesto del mismo ingeniero.
MANOVA (Anlisis de varianza mltiple)
Es un modelo para analizar la relacin entre una o ms variables independientes y dos o ms variables dependientes
Prueba si hay diferencias significativas en las medias de grupos de una combinancin de respuestas Y.
Los datos deben ser normales, con covarianza homogenea y observaciones independientes
MANOVA (Anlisis de varianza mltiple)
Diferencias de ANOVA y MANOVA
Ejemplo: Extrusin de pelcula plstica
Se realiza un estudio para determinar las condiciones ptimas para extruir pelcula plstica.
Se miden tres respuestas Tear, gloss y opacity cinco veces en cada combinacin de dos factores tasa de extrusin y cantidad de aditivo cada grupo se pone en niveles bajos y altos.
Se utiliza el MANOVA balanceado para probar la igualdad de las medias.
Ejemplo: Extrusin de pelcula plstica
Ejemplo: Extrusin de pelcula plstica
1Abrir el archivo EXH_MVAR.MTW.
2Seleccionar Stat > ANOVA > Balanced MANOVA.
3En Responses, poner Tear Gloss Opacity.
4En Model, poner Extrusion | Additive.
5Click Results. En Display of Results, seleccionar Matrices (hypothesis, error, partial correlations) y Eigen analysis.
6 Click OK en cada cuadro de dilogo.
Ejemplo
Ejemplo: Extrusin de pelcula plstica
Las matrices SSCP evalan la contribucin a la variabilidad de manera similar a la suma de cuadrados en la ANOVA univariada.
Las correlaciones parciales entre Tear y Gloss son pequeas. Como la estructura de las correlaciones es dbil, se pueden realizar anlisis univariados de ANOVA para cada una de las respuestas.
VI.A.4 Estudios Multivari
Estudios Multivari
La carta multivari permite analizar la variacin dentro de la pieza, de pieza a pieza o de tiempo en tiempo
Permite investigar la estabilidad de un proceso consiste de lneas verticales u otro esquema en funcin del tiempo. La longitud de la lnea o del esquema representa el rango de valores encontrados en cada conjunto de muestras
Estudios Multivari
La variacin dentro de las muestras (cinco puntos en cada lnea). La variacin de muestra a muestra como posicin vertical de las lneas.
E
S
P
E
S
O
R
Nmero de subgrupo
Estudios Multivari
Ejemplo de parte metlica
Centro ms grueso
Estudios Multivari
Procedimiento de muestreo:Seleccionar el proceso y la caracterstica a investigar
Seleccionar tamao de muestra y frecuencia de muestreo
Registrar en una hoja la hora y valores para conjunto de partes
Estudios Multivari
Procedimiento de muestreo:Realizar la carta MultivariUnir los valores observados con una lnea
Analizar la carta para variacin dentro de la parte, de parte a parte y sobre el tiempo
Puede ser necesario realizar estudios adicionales alrededor del rea de mxima variacin aparenteDespus de la accin de mejora comprobar con otro estudio Multivari
Cartas Multivari
Su propsito fundamental es reducir el gran nmero de causas posibles de variacin, a un conjunto pequeo de causas que realmente influyen en la variabilidad.
Sirven para identificar el patrn principal de variacin de entre tres patrones principales:
Temporal: Variacin de hora a hora; turno a turno; da a da; semana a semana; etc.
Cclico: Variacin entre unidades de un mismo proceso; variacin entre grupos de unidades; variacin de lote a lote.
Cartas Multivari
Posicional:
Variaciones dentro de una misma unidad (ejemplo: porosidad en un molde de metal) o a travs de una sola unidad con mltiples partes (circuito impreso).
Variaciones por la localizacin dentro de un proceso que produce mltiples unidades al mismo tiempo. Por ejemplo las diferentes cavidades de un molde
Variaciones de mquina a mquina; operador a operador; planta a planta
Cartas Multivari
Ejemplo: Se toman 3 a 5 unidades consecutivas, repitiendo el proceso tres o ms veces a cierto intervalo de tiempo, hasta que al menos el 80% de la variacin en el proceso se ha capturado.
A
1 2 3 4 5 27 28 29 30 31 55 56 57 58 59
VARIACIN POSICIONAL DENTRO DE LA UNIDAD
Cartas Multivari
Ejemplo: (cont...)
B
1 2 3 4 5 27 28 29 30 31 55 56 57 58 59
VARIACIN CCLICA DE UNIDAD A UNIDAD
Cartas Multivari
Ejemplo: (cont...)
C
1 2 3 4 5 27 28 29 30 31 55 56 57 58 59
VARIACIN TEMPORAL DE TIEMPO A TIEMPO
Cartas Multivari
Ejemplo: Un proceso produce flecha cilndricas, con un dimetro especificado de 0.0250 0.001.
Sin embargo un estudio de capacidad muestra un Cp = 0.8 y una dispersin natural de 0.0025 (6 ) contra la permitida de 0.0002.
Se tiene pensado comprar un torno nuevo de US$70,000 para tolerancia de 0.0008, i.e. Cpk = 1.25. Se sugiri un estudio Multi Vari previo.
Cartas Multivari
Se tomaron cuatro lecturas en cada flecha, dos a cada lado. Estas muestran una disminucin gradual desde el lado izquierdo al lado derecho de las flechas, adems de excentricidad en cada lado de la flecha.
La variacin cclica, de una flecha a la siguiente, se muestra mediante las lneas que concentran las cuatro lecturas de cada flecha.
Tambin se muestra la variacin temporal.
Cartas Multivari
.0.2510
0.2500
0.2490
Mximo
Mnimo
Izquierda
Derecha
8 AM 9 AM 10 AM 11 AM 12 AM
Cartas Multivari
Un anlisis rpido revela que la mayor variacin es temporal con un cambio mayor entre las 10 AM y las 11 AM.
A las 10 AM se para el equipo para el almuerzo y se arranca a las 11 AM, con lecturas similares a las de las 8 AM. Conforme pasa el tiempo las lecturas tienden a decrecer ms y ms, hasta que se invierten a las 10 A.M. en forma drstica.
Se investig y se encontr que la temperatura tena influencia en la variacin.
La variacin en temperatura era causada por que la cantidad de refrigerante no era la adecuada, lo cual se notaba ms cuando se paraba el equipo y se volva a arrancar. Se adicion, reduciendo la variacin en 50% aproximadamente..
Cartas Multivari
Tambin se encontr que el acabado cnico era causado por que la herramienta de corte estaba mal alineada. Se ajust, contribuyendo a otra reduccin del 10% de la variabilidad.
La excentricidad de las flechas se corrigi al cambiar un rodamiento excntrico por desgaste en el torno. Se instal un nuevo rodamiento eliminndose otro 30% de la variabilidad.
La tabla siguiente muestra un resumen de los resultados.
Cartas Multivari
Tipo de % var.Causas deAccin % de variacin
VariacinTotalVariacinCorrectivaReducida
Temporal50Bajo nivel de Adicionar Casi 50
Tiempo a tiempoRefrigeranterefrigerante
Dentro de10Ajuste no Ajuste de laCasi 10
la flechano paraleloherramienta de
corte
Dentro de30 RodamientoNuevo Casi 30
la flechagastadorodamiento
Flecha a 5-???--
flecha
Cartas Multivari
Resultados: La variacin total en la siguiente corrida de produccin se redujo de 0.0025 a 0.0004
El nuevo Cp fue de 0.002 / 0.0004 = 5.0
Como beneficios se redujo a cero el desperdicio y no hubo necesidad de adquirir una nueva mquina.
Se observa que antes de cambiar equipo o mquinas, es conveniente realizar un estudio de variabilidad para identificar las fuentes de variacin y tratar de eliminarlas.
Dimetro de Flecha
(0.150" +/- .002)
Programa
Mquina
Accesorios
Operador a operador
Ejemplo: Bsqueda de fuentes de variacin con el diagrama sistemtico.
Cartas Multivari
Ejemplo (cont..):
Al realizar la prueba de homogeneidad de varianza F, se encontr que haba una diferencia significante entre los operadores.
Se Rechaza Ho: Oper1 = Oper2 = Oper3
Para probar si existe diferencia significativa entre medias de operadores se hacen las siguientes comparaciones
Ho: Oper1 = Oper2Ho: Oper1 = Oper3
Ho: Oper2 = Oper3 Ha: Oper1 Oper2 Oper3
Cartas Multivari
Corrida en Minitab
Se introducen los datos en varias columnas C1 a C3 incluyendo la respuesta (strenght) y los factores (time y Metal)
SinterTimeMetalTypeStrength
0.51523
0.51520
0.51521
0.51822
0.51819
0.51820
0.52119
0.52118
Corrida en Minitab
Utilizar el achivo de ejemplo Sinter.mtw
Opcin: Stat > Quality Tools > Multivari charts
Indicar la columna de respuesta y las columnas de los factores
En opciones se puede poner un ttulo y conectar las lneas
Resultados
3046.txt
Multi-Vari Chart for Strength by SinterTime - MetalType6KJMulti-Vari Chart for Strength by SinterTime - MetalType;; HMF V1.24 TEXT;; (Microsoft Win32 Intel 386) HOOPS 5.00-17 I.M. 3.00-17(Selectability "windows=off,geometry=on")(Visibility "on")(Color_By_Index "Geometry,Face Contrast" 1)(Color_By_Index "Window" 0)(Window_Frame "off")(Window -1 1 -1 1)(Camera (0 0 -5) (0 0 0) (0 1 0) 2 2 "Stretched")
;; (Driver_Options "no backing storeno borderno control areadisable input,no do;; uble-bufferingno double bufferingno force black-and-whiteno force black and ;; whiteno gamma correctionsubscreen=(-0.999902,-0.476464,-0.99987,-0.301952),n;; o subscreen creatingno subscreen movingno subscreen resizingno subscreen str;; etchingno update interrupts,use window id=197438")(Edge_Pattern "---")(Edge_Weight 1)(Face_Pattern "solid")(Heuristics "no related selection limit")(Line_Pattern "---")(Line_Weight 1)(Marker_Size 0.421875)(Marker_Symbol ".")(Text_Font "name=arial-gdi-vector,no transforms,rotation=follow path")(User_Options "mtb aspect ratio=0.675953,graphicsversion=6,worksheettitle=\"Sinter.MTW\",optiplot=0,builtin=0,statguideid=10151,toplayer=0,angle=0,arrowdir=0,arrowstyle=0,polygon=0,isdata=0,textfollowpath=1,ldfill=0,solidfill=0,3d=0,usebitmap=0,canbrush=0,brushrows=27,light scaling=0.00000,sessionline=-1")(Segment "include" ())(Front ((Segment "figure1" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=0") (Front ((Segment "region" ((Front ((Segment "figure box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Face" 0) (Color_By_Index "Face Contrast,Line,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "solid") (Line_Pattern "---") (Line_Weight 1) (User_Options "solidfill=1") (Segment "" ( (Polygon ((-0.99995 -0.99995 0) (0.99995 -0.99995 0) (0.99995 0.99995 0) (-0.99995 0.99995 0))))))) (Segment "data box" ( (Visibility "faces=off") (Color_By_Index "Polygon,Face Contrast,Line" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "/") (Line_Pattern "---") (Line_Weight 1) (User_Options "ldfill=1,solidfill=1") (Segment "" ( (Polygon ((-0.699965 -0.699965 0) (0.59997 -0.699965 0) (0.59997 0.59997 0) (-0.699965 0.59997 0))))))) (Segment "legend box" ()) (Segment "legend" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=1"))))))) (Segment "object" ((Front ((Segment "frame" ( (Window_Pattern "clear") (Window -1 1 -1 1) (Front ((Segment "tick" ((Front ((Segment "set1" ( (Color_By_Index "Face Contrast,Line,Text,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Line_Pattern "---") (Line_Weight 1) (Text_Alignment "^*") (Text_Font "name=arial-gdi-vector,size=0.0237 sru") (Segment "" ( (Text 0.427251 -0.729963 0 "21"))) (Segment "" ( (Text -0.0499975 -0.729963 0 "18"))) (Segment "" ( (Text -0.527246 -0.729963 0 "15"))) (Segment "major" ( (Segment "" ((Polyline ((0.427251 -0.699965 0) (0.427251 -0.699965 0 ))))) (Segment "" ((Polyline ((-0.0499975 -0.699965 0) (-0.0499975 -0.699965 0))))) (Segment "" ((Polyline ((-0.527246 -0.699965 0) (-0.527246 -0.699965 0))))))))) (Segment "set2" ( (Color_By_Index "Face Contrast,Line,Text,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Line_Pattern "---") (Line_Weight 1) (Text_Alignment "*>") (Text_Font "name=arial-gdi-vector,size=0.0237 sru") (Segment "" ( (Text -0.769961 0.492559 0 "23.5"))) (Segment "" ( (Text -0.769961 0.311707 0 "22.5"))) (Segment "" ( (Text -0.769961 0.130855 0 "21.5"))) (Segment "" ( (Text -0.769961 -0.0499975 0 "20.5"))) (Segment "" ( (Text -0.769961 -0.23085 0 "19.5"))) (Segment "" ( (Text -0.769961 -0.411702 0 "18.5"))) (Segment "" ( (Text -0.769961 -0.592554 0 "17.5"))) (Segment "major" ( (Segment "" ((Polyline ((-0.699965 0.492559 0) (-0.739963 0.492559 0 ))))) (Segment "" ((Polyline ((-0.699965 0.311707 0) (-0.739963 0.311707 0 ))))) (Segment "" ((Polyline ((-0.699965 0.130855 0) (-0.739963 0.130855 0 ))))) (Segment "" ((Polyline ((-0.699965 -0.0499975 0) (-0.739963 -0.0499975 0))))) (Segment "" ((Polyline ((-0.699965 -0.23085 0) (-0.739963 -0.23085 0 ))))) (Segment "" ((Polyline ((-0.699965 -0.411702 0) (-0.739963 -0.411702 0))))) (Segment "" ((Polyline ((-0.699965 -0.592554 0) (-0.739963 -0.592554 0))))))))))))) (Segment "grid" ()) (Segment "reference" ()) (Segment "axis" ((Front ((Segment "set1" ( (Color_By_Index "Face Contrast,Line,Text,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Line_Pattern "---") (Line_Weight 1) (Text_Alignment "^*") (Text_Font "name=arial-gdi-vector,size=0.04232 sru") (Segment "" ( (Text -0.0499975 -0.794993 0 "MetalType"))) (Segment "" ( (Polyline ((-0.679966 -0.699965 0) (0.579971 -0.699965 0))))))) (Segment "set2" ( (Color_By_Index "Face Contrast,Line,Text,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Line_Pattern "---") (Line_Weight 1) (Text_Alignment "*>") (Text_Font "name=arial-gdi-vector,size=0.03385 sru") (Text_Path 6.12303e-17 1 0) (Segment "" ( (Selectability "polygons=on!,text=off") (Visibility "polygons=off") (Text_Alignment "v>") (Text_Path 0 1 0) (User_Options "angle=90,polygon=3,linect=1,charct=8") (Polygon ((-0.924467 -0.176635 0) (-0.924467 0.0646314 0)(-0.850721 0.0646314 0) (-0.850721 -0.176635 0))) (Renumber (Text -0.869157 -0.176635 0 "Strength") 1 "L") (Segment "raw" ((Visibility "off")(Renumber (Text 0 0 0 "Strength") 1 "L"))))) (Segment "" ( (Polyline ((-0.699965 -0.679966 0) (-0.699965 0.579971 0))))))))))))))) (Segment "data" ( (Window_Pattern "clear") (Window -0.68 0.58 -0.68 0.58) (User_Options "isdata=1,viewinfigurecoord=1") (Front ((Segment "symbol1" ((Segment "points" ( (Color_By_Index "Marker" 1) (Marker_Size 0.421875) (Marker_Symbol "@") (User_Options "canbrush=1,brushsetup=0,grouping=1") (Front ((Segment "group1" ( (Color_By_Index "Marker" 0) (Marker_Size 0.210938) (Marker_Symbol "o") (Segment "" ((User_Value 9)(Marker 0.60603 0.143534 0))) (Segment "" ((User_Value 8)(Marker 0.60603 -0.717667 0))) (Segment "" ((User_Value 7)(Marker 0.60603 -0.4306 0))) (Segment "" ((User_Value 6)(Marker -0.151508 -0.143534 0))) (Segment "" ((User_Value 5)(Marker -0.151508 -0.4306 0))) (Segment "" ((User_Value 4)(Marker -0.151508 0.4306 0))) (Segment "" ((User_Value 3)(Marker -0.909045 0.143534 0))) (Segment "" ((User_Value 2)(Marker -0.909045 -0.143534 0))) (Segment "" ((User_Value 1)(Marker -0.909045 0.717667 0))))) (Segment "group2" ( (Color_By_Index "Marker" 0) (Marker_Size 0.210938) (Marker_Symbol "(+)") (Segment "" ((User_Value 18)(Marker 0.757538 0.4306 0))) (Segment "" ((User_Value 17)(Marker 0.757538 -0.4306 0))) (Segment "" ((User_Value 16)(Marker 0.757538 -0.143534 0))) (Segment "" ((User_Value 15)(Marker -2.22033e-16 0.4306 0))) (Segment "" ((User_Value 12)(Marker -0.757538 -0.4306 0))) (Segment "" ((User_Value 11)(Marker -0.757538 -0.143534 0))) (Segment "" ((User_Value 10)(Marker -0.757538 0.4306 0))))) (Segment "group3" ( (Color_By_Index "Marker" 0) (Marker_Size 0.210938) (Marker_Symbol "(x)") (Segment "" ((User_Value 26)(Marker 0.909045 0.4306 0))) (Segment "" ((User_Value 25)(Marker 0.909045 -0.143534 0))) (Segment "" ((User_Value 24)(Marker 0.151508 -0.143534 0))) (Segment "" ((User_Value 23)(Marker 0.151508 0.717667 0))) (Segment "" ((User_Value 22)(Marker 0.151508 0.143534 0))) (Segment "" ((User_Value 20)(Marker -0.60603 -0.717667 0))) (Segment "" ((User_Value 19)(Marker -0.60603 -0.717667 0))))))))))))))))))) (Segment "labels" ((Window_Pattern "clear")(Window -1 1 -1 1))) (Segment "annotation" ((Window_Pattern "clear")(Window -1 1 -1 1))))))) (Segment "figure2" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=0") (Front ((Segment "region" ((Front ((Segment "figure box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Face" 0) (Color_By_Index "Face Contrast,Line,Edge" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "solid") (Line_Pattern "---") (Line_Weight 1) (User_Options "solidfill=1") (Segment "" ( (Polygon ((-0.99995 -0.99995 0) (0.99995 -0.99995 0) (0.99995 0.99995 0) (-0.99995 0.99995 0))))))) (Segment "data box" ( (Visibility "faces=off") (Color_By_Index "Polygon,Face Contrast,Line" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "/") (Line_Pattern "---") (Line_Weight 1) (User_Options "ldfill=1,solidfill=1") (Segment "" ( (Polygon ((-0.699965 -0.699965 0) (0.59997 -0.699965 0) (0.59997 0.59997 0) (-0.699965 0.59997 0))))))) (Segment "legend box" ( (Visibility "polygons=off,lines=off") (Color_By_Index "Polygon,Face Contrast,Line" 1) (Edge_Pattern "---") (Edge_Weight 1) (Face_Pattern "/") (Line_Pattern "---") (Line_Weight 1) (User_Options "ldfill=1,solidfill=1") (Segment "" ( (Polygon ((0.639968 0.59997 0) (0.859942 0.59997 0) (0.859942 0.314351 0) (0.639968 0.314351 0))))))) (Segment "legend" ( (Window_Pattern "clear") (Window -1 1 -1 1) (User_Options "viewinfigurecoord=1") (Front ((Segment "symbol1" ((Front ((Segment "group1" ( (Color_By_Index "Text" 1) (Color_By_Index "Marker" 2) (Marker_Size 0.527344) (Marker_Symbol "o") (Text_Font "name=arial-gdi-vector,size=0.03385 sru") (Marker 0.689965 0.549034 0) (Front ((Segment "text1" ((Color_By_Index "Text" 1)(Text_Alignment "*
VI.A.5 Anlisis de datos por atributos
Anlisis de datos por atributos
Si los CTQs son variables continuas, se usa la regresin, dependiendo de la naturaleza de la caracterstica crtica para el cliente (CTSs) como ste la expresa:
CTS HERRAMIENTA
Nominal (Verde, Rojo, azul) Regresin Logstica Nominal
Atributo (Pasa/No pasa) Regresin Logstica Binaria
Ordinal (1, 2, 3, 4, 5) Regresin Logstica Ordinal
Anlisis de datos por atributos
El anlisis de datos por atributos se organiza en valores, categoras o grupos dicotmicos
Las decisiones incluyen: si / no, pasa / no pasa, bueno / malo, pobre/justo/bueno/superior/excelente, etc.
Entre los modelos no lineales de regresin usados se tienen: regresin logstica, regresin logit y regresin probit
Anlisis de datos por atributos
Regresin logsticaRelaciona variables independientes categricas a una variable dependiente (Y). Minitab incluye los modelos binario, ordinal y nominal
Regresin logitEs subconjunto del modelo log-lineal. Tiene solo una variable dependiente, usa determinaciones de probabilidad o tasa de probabilidad
Anlisis de datos por atributos
Regresin probitEs similar a la prueba de vida acelerada, la unidad se somete a esfuerzo con la respuesta pasa/falla, bueno o malo. Es una respuesta binaria en un tiempo de falla futuro
Regresin logstica o binaria
En caso de informacin cualitativa es necesario traducir las preferencias del cliente expresadas como atributos a un intervalo de valores aceptables de variables (Especificaciones).
Regresin logstica o binaria
Es similar a la regresin mltiple excepto que la respuesta es binaria (si/no, bueno/malo, etc.) Sus coeficientes se determinan por el mtodo de mxima verosimilitud
Su funcin tiene forma de S, con valores mximos de Cero y Uno.
Yi = 0, 1
Regresin logstica o binaria
La probabilidad de que el resultado est en cierta categora es:
El mtodo de clculo del coeficiente b es diferente que en la regresin lineal
Los coeficientes se determinan con la relacin sig.:
Regresin logstica
Condiciones:Hay solo dos resultados posiblesHay solo un resultado por eventoLos resultados son independientes estadsticamenteTodos los predictores relevantes estn en el modeloEs mutuamente exclusivo y colectivamente exhaustivoLos tamaos de muestra son mayores que para la regresin mltiple
Los efectos positivos se obtienen con b1>1 y los negativos con b1 e 0 a 1
Regresin logstica
Relacin con ajuste pobre
Relacin con buen ajuste
Regresin logstica - Procedimiento
Definir el atributo a traducir (y)Definir la variable apropiada para el atributo (x)Definir el modelo matemtico a probarDeterminar los defectos que est dispuesto a aceptarRecolecte informacin de x vs y. Asigne 1 si falla y 0 si es aceptable.Analice la informacin mediante Regresin Logstica Binaria
Regresin logstica- Procedimiento
Regresin logstica - Procedimiento
Observe el P-Value de Deviance en la Sesin, debe de ser grande (P >0.10)Obtenga los coeficientes del modelo (De la Sesin)
Regresin logstica - Procedimiento
Construya el modelo de regresin para la probabilidad de falla estar dado por :
Identifique el(los) valor(es) de x que le generarn como mximo la cantidad de defectos que usted est dispuesto a aceptar [4]
Ejemplo de riesgo de paro cardiaco
Para Fuma, el coeficiente negativo de -1.193 y la tasa de posibilidades de 0.30, indica que quien fuma, tiende a tener una tasa de pulso ms alta que los sujetos que no fuman. Si los sujetos tienen el mismo peso, las posibilidades de que los fumadores tengan un pulso bajo sea slo del 30% de las posibilidades de que los no fumadores tengan un pulso bajo.
Regresin logstica ordinal
Cuando la respuesta CTS es de tipo ordinal (Varias categoras de respuesta como totalmente de acuerdo, de acuerdo, en desacuerdo y totalmente en desacuerdo) y el Factor CTQ es de naturaleza continua, entonces, para definir Especificaciones, la herramienta a utilizar es la Regresin Logstica Ordinal.
Regresin logstica ordinal - Procedimiento
Defina la variable de respuesta a traducir (y CTS)Defina el CTQ (x) variable a relacionar con el CTS Defina el modelo matemtico a probarDetermine los defectos que est dispuesto a aceptar en la categora de intersRecolecte informacin de x vs yAnalice la informacin mediante Regresin Logstica Ordinal
Regresin logstica ordinal - Procedimiento
Stat > Regression > Ordinal Logistic RegressionSeleccione la respuesta (y)Seleccione los trminos que estima tiene el modelo [3]
Regresin logstica ordinal - Procedimiento
Observe el P-Value de Deviance en la Sesin, debe de ser grande (P >0.10)
Obtenga las constantes y coeficientes del modelo (De la Sesin)
Construya los modelos de regresin para la probabilidad acumulada por categora
Regresin logstica ordinal - Procedimiento
Identifique el(los) valor(es) de x que le generarn como mximo la
cantidad de defectos que usted est dispuesto a aceptar en la
categora de inters [4]
Regresin logstica ordinal - Procedimiento
Una vez que se tienen establecidos los CTQs con los que se medir el desempeo del producto, es necesario indicar las Especificaciones de los mismos
Recommended