240
David R. González-Barreto Estadísticas Industriales Marzo 2010 1 Prin EDA Dist Estim Hyp Cont Cap R&R Mues Estadísticas Industriales Presentado en: Stryker, Puerto Rico

No Slide Titleacademic.uprm.edu/dgonzalez/adiestramientos/Estadisticas... · Prin EDA Estim Dist Mues Hyp Cont Cap R&R Variabilidad • ¿Por qué ocurre la variabilidad? ... –Datos

  • Upload
    lytram

  • View
    221

  • Download
    0

Embed Size (px)

Citation preview

David R. González-Barreto Estadísticas Industriales Marzo 2010 1

Prin EDA DistEstim Hyp Cont Cap R&RMues

Estadísticas Industriales

Presentado en:

Stryker, Puerto Rico

David R. González-Barreto Estadísticas Industriales Marzo 2010 2

Prin EDA DistEstim Hyp Cont Cap R&RMues

Variabilidad

• Virtualmente, todos los procesos y sistemas del mundo real exhiben

variabilidad. Las estadísticas son fundamentales en el mejoramiento de la

calidad debido a que las técnicas estadísticas se utilizan para describir y

entender la variabilidad. En efecto estas técnicas se han utilizado para

reducir: el re-trabajo, los desperdicios, la necesidad de inspección y los

costos de garantía.

David R. González-Barreto Estadísticas Industriales Marzo 2010 3

Prin EDA DistEstim Hyp Cont Cap R&RMues

Variabilidad

• ¿Por qué ocurre la variabilidad?

– En términos generales, la variabilidad es el resultado de cambios en las condiciones de los procesos y/o sistemas en donde las medidas se efectúan. En manufactura estos cambios se pueden deber a cambios en las propiedades de los materiales, diferencias en la manera en que las personas realizan su trabajo, diferencias en los parámetros del proceso y finalmente también puede deberse al sistema de medida.

– El campo de las probabilidades y estadísticas consiste de métodos para describir y modelar la variabilidad y para tomar

decisiones cuando ésta está presente.

David R. González-Barreto Estadísticas Industriales Marzo 2010 4

Prin EDA DistEstim Hyp Cont Cap R&RMues

Clasificación de los datos

• Los datos tienen dos clasificaciones: datos contínuos o por variable

y datos categóricos o por atributo.

– Datos por variable - decimos que la escala podría ser

infinitamente subdivisible y que está determinada por el

instrumento de medida.

– Datos por atributo - decimos que la escala es meramente

un conteo, ejemplo de esto sería la clasificación del número de

artículos defectuosos encontrados en una muestra.

David R. González-Barreto Estadísticas Industriales Marzo 2010 5

Prin EDA DistEstim Hyp Cont Cap R&RMues

Definiciones

• Estadísticas - Es la ciencia y el arte de recopilar, mostrar e interpretar

datos con el propósito de probar teorías y hacer inferencias acerca de todo

tipo de fenómenos.

• Análisis Exploratorio de Datos (Exploratory Data Analysis –

EDA) – Es el arte de mostrar los datos con un formato atractivo, que a su

vez proporcione información de interés para el ingeniero o científico.

David R. González-Barreto Estadísticas Industriales Marzo 2010 6

Prin EDA DistEstim Hyp Cont Cap R&RMues

Definiciones

• Entre las herramientas más utilizadas encontramos:

Diagrama de Punto (Dot Diagram)

Histograma de Frecuencia

Diagrama de Pareto

Gráficos de Caja (Boxplots)

Sencillo

Múltiple

Diagrama de Dispersión (Scatter Diagram)

David R. González-Barreto Estadísticas Industriales Marzo 2010 7

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Punto

• El diagrama de punto es un gráfico muy útil para mostrar conjuntos

pequeños de datos, regularmente hasta alrededor de veinte observaciones.

El mismo permite observar fácilmente la localización o la tendencia central

así como la dispersión o variabilidad en los datos. Estos diagramas, con

frecuencia, nos ayudan a comparar dos o más conjuntos de datos.

David R. González-Barreto Estadísticas Industriales Marzo 2010 8

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Punto - Ejemplo

Considere los siguientes datos que se refieren al esfuerzo en

tensión de un tipo de cemento cuando se le añade un polímero (P).

16.85 16.40 17.21 16.35 16.52

17.04 16.96 17.15 16.59 16.57

El siguiente sería el diagrama de punto correspondiente a estos

valores. Dot Diagram

P

Fre

que

ncy

16.3 16.5 16.7 16.9 17.1 17.3 17.5

0

1

David R. González-Barreto Estadísticas Industriales Marzo 2010 9

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Punto - Ejemplo

Suponga que los siguientes diez valores corresponden al esfuerzo

en tensión de muestras de cemento sin el polímero.

17.50 17.63 18.25 18.00 17.86

17.75 18.22 17.90 17.96 18.15

. . ... . . . . .

---+---------+---------+---------+---------+---------+---P

. . . .. .. . :

---+---------+---------+---------+---------+---------+---SP

16.45 16.80 17.15 17.50 17.85 18.20

David R. González-Barreto Estadísticas Industriales Marzo 2010 10

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Punto - Ejemplo

• En el diagrama de punto anterior puede notarse que el cemento al que se le añade el polímero (P) resulta en un esfuerzo en tensión menor al cemento (SP) común considerado. No obstante, podríamos decir que la variabilidad inherente dentro de cada grupo

es fundamentalmente la misma.

• Cuando el número de datos disponibles es relativamente grande,construir un diagrama de punto no es muy eficiente. Otras técnicasque se discutirán a continuación resultarán ser mucho másefectivas.

David R. González-Barreto Estadísticas Industriales Marzo 2010 11

Prin EDA DistEstim Hyp Cont Cap R&RMues

Histograma

• Una distribución de frecuencia es una forma compacta de resumir los

datos. Se obtiene de dividir el rango de los datos en intervalos comúnmente

llamados celdas. El número de celdas dependerá del número de

observaciones así como de la dispersión encontrada.

• A la representación gráfica de una distribución de frecuencia es a lo que

llamamos histograma.

David R. González-Barreto Estadísticas Industriales Marzo 2010 12

Prin EDA DistEstim Hyp Cont Cap R&RMues

Histograma - Ejemplo

La siguiente tabla muestra el octanaje de varias marcas de

gasolina. 88.5 87.7 83.4 86.7 87.5 91.5 88.6 100.3 96.5 93.3

94.7 91.1 91.0 94.2 87.8 89.9 88.3 87.6 84.3 86.7

84.3 86.7 88.2 90.8 88.3 98.8 94.2 92.7 93.2 91.0

90.1 93.4 88.5 90.1 89.2 88.3 85.3 87.9 88.6 90.9

89.0 96.1 93.3 91.8 92.3 90.4 90.1 93.0 88.7 89.9

89.8 89.6 87.4 88.4 88.9 91.2 89.3 84.4 92.7 91.8

91.6 90.4 91.1 92.6 89.8 90.6 91.1 90.4 89.3 89.7

90.3 91.6 90.5 93.7 92.7 92.2 92.2 91.2 91.0 92.2

90.0 90.7

David R. González-Barreto Estadísticas Industriales Marzo 2010 13

Prin EDA DistEstim Hyp Cont Cap R&RMues

Histograma - Ejemplo

Histogram for Octanaje

82 86 90 94 98 102

Octanaje

0

10

20

30

40

freq

uen

cy

David R. González-Barreto Estadísticas Industriales Marzo 2010 14

Prin EDA DistEstim Hyp Cont Cap R&RMues

Histograma - Ejemplo

• La siguiente gráfica presenta la distribución acumulativa de los datos

nuevamente para el ejemplo del octanaje.

Histogram for Octanaje

Octanaje

freq

uen

cy

82 86 90 94 98 102

0

20

40

60

80

100

David R. González-Barreto Estadísticas Industriales Marzo 2010 15

Prin EDA DistEstim Hyp Cont Cap R&RMues

Histograma

• En la práctica se ha encontrado que utilizar entre cinco y veinte celdas

produce resultados satisfactorios. A medida que el número de

observaciones aumenta, el número de celdas también debe aumentar.

Algunos analistas (e.g. Montgomery) sugieren que este número debe ser

aproximado a la raíz cuadrada del número de observaciones.

David R. González-Barreto Estadísticas Industriales Marzo 2010 16

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Pareto

• Una variación importante al histograma cuando se utilizan datos

categóricos lo es el diagrama de Pareto. Este gráfico es altamente utilizado

en los esfuerzos de mejoramiento continuo de la calidad en donde las

categorías representan, por ejemplo, tipos de defectos, modos de falla y

problemas del proceso. Las categorías son ordenadas en forma

descendente.

• El nombre de este diagrama se debe a un economista italiano cuya ley (Ley

de Pareto) puede interpretarse dentro del ambiente industrial de la

siguiente forma: “la mayoría de los defectos se debe a sólo un puñado de

las categorías”.

David R. González-Barreto Estadísticas Industriales Marzo 2010 17

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Pareto - Ejemplo

La siguiente tabla muestra defectos estructurales en las puertas de

un tipo de automóvil.

Categoría Frecuencia

Abolladuras 4

Fallos en pintura 6

Fallos en lubricación 5

Fallos de contorno 30

Fuera de secuencia 8

Fallos en terminación 3

David R. González-Barreto Estadísticas Industriales Marzo 2010 18

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Pareto - Ejemplo

Pareto Chart for Frecuencia

freq

uen

cy

0

10

20

30

40

50

60

Fallos de contornoFuera de secuencia

Fallos en pinturaFallos en lubricació

AbolladurasFallos en terminació

53.57

67.86

78.5787.50

94.64100.00

David R. González-Barreto Estadísticas Industriales Marzo 2010 19

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Pareto - Ejemplo

• En el Diagrama de Pareto anterior podemos observar que las primeras tres

categorías ordenadas resultan en alrededor del 79% de las fallas totales.

• Variaciones al Diagrama de Pareto incluyen:

• “Diagramas de Pareto Pesados”

• “Diagramas de Pareto Anidados”

David R. González-Barreto Estadísticas Industriales Marzo 2010 20

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Caja (Boxplot)

• Un gráfico de caja es una representación esquemática de la mediana muestral, de las cuartilas inferior y superior, y de la observación máxima y mínima de un conjunto de datos. Como muestra la figura en la página siguiente, se construye una caja cuyos extremos corresponden a las cuartilas inferior y superior y unas líneas verticales que salen de los extremos de la caja para representar la observación máxima y mínima respectivamente. Finalmente, una línea corta la caja y representa la mediana muestral.

David R. González-Barreto Estadísticas Industriales Marzo 2010 21

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Caja (Boxplot)

Cuartila – 75%

Cuartila – 25%

Observación Mínima

Observación Máxima

Mediana

David R. González-Barreto Estadísticas Industriales Marzo 2010 22

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Caja (Boxplot)

• Un gráfico de caja provee una representación gráfica simple de la forma del

conjunto de datos. Note que la mitad de las observaciones están

contenidas en la caja y la otra mitad fuera de ella. Si un histograma

muestra simetría, entonces las líneas del “boxplot” deben ser de un largo

similar y la mediana debe estar localizada en la vecindad del centro de la

caja. Si los datos están sesgados, las líneas no serán de igual largo y la

mediana no se localizará cerca del centro de la caja. Muchos paquetes

estadísticos representan valores espúreos (“outliers”) con asteriscos fuera

de las líneas de los valores máximos.

David R. González-Barreto Estadísticas Industriales Marzo 2010 23

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Caja - Ejemplo

Los datos para la radiación emitida por 42 hornos de microondas

se presentan en la siguiente tabla.

0.15 0.09 0.18 0.10 0.05 0.12 0.08

0.05 0.08 0.10 0.07 0.02 0.01 0.10

0.10 0.10 0.02 0.10 0.01 0.40 0.10

0.05 0.03 0.05 0.15 0.10 0.15 0.09

0.08 0.18 0.10 0.20 0.11 0.30 0.02

0.20 0.20 0.30 0.30 0.40 0.30 0.05

David R. González-Barreto Estadísticas Industriales Marzo 2010 24

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Caja - Ejemplo

Box-and-Whisker Plot

Radiacion

0 0.1 0.2 0.3 0.4

David R. González-Barreto Estadísticas Industriales Marzo 2010 25

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Caja - Ejemplo

• Como puede observarse, las radiaciones emitidas con valor igual a 0.4 son

identificadas por este gráfico como valores espúreos. También se puede

notar del gráfico que la distribución de las radiaciones parece sesgarse

hacia los valores altos.

• Los diagramas de caja son muy útiles para hacer comparaciones entre

conjuntos o poblaciones de datos. En el siguiente ejemplo se muestra este

uso al comparar dos poblaciones de bombillas.

David R. González-Barreto Estadísticas Industriales Marzo 2010 26

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Caja - Ejemplo

Un estudio se realiza para comparar el efecto de dos distintos

filamentos (Tipo A, Tipo B) en el número de horas de servicio de unas bombillas. Diez observaciones para cada tipo de filamento

aparecen en la siguiente tabla.

A B

1293 1643 1061 1138

1380 1466 1065 1143

1614 1627 1092 1094

1497 1383 1017 1270

1340 1711 1021 1028

David R. González-Barreto Estadísticas Industriales Marzo 2010 27

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Caja - Ejemplo

Este boxplot muestra claramente cómo el filamento Tipo A

redunda en largos de vida mucho mayores que el Tipo B, pero a su vez induce una mayor variabilidad.

A

B

Box-and-Whisker Plot

1000 1200 1400 1600 1800

Horas

Tip

o

David R. González-Barreto Estadísticas Industriales Marzo 2010 28

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Dispersión

• Los gráficos estudiados hasta el momento nos ayudan a entender la

distribución de una variable. Los diagramas de dispersión son útiles para

estudiar la relación entre dos variables. Esta gráfica presenta simplemente

pares ordenados (xi , yi), con el propósito de detectar alguna relación entre

las variables.

David R. González-Barreto Estadísticas Industriales Marzo 2010 29

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Dispersión

David R. González-Barreto Estadísticas Industriales Marzo 2010 30

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Dispersión

Relación positiva - los puntos en el diagrama siguen una trayectorialineal ascendente.

Relación negativa - los puntos en el diagrama siguen una trayectorialineal descendente, o sea, mientras una de las variables disminuye la otraaumenta.

Relación no lineal – los puntos en el diagrama siguen una trayectoriacurvilínea.

• Relación no sistemática – los puntos en el diagrama muestran un patrón aleatorio que no sigue ninguna de las relaciones antes indicadas. Esto puede ser interpretado como la independencia entre ambas variables.

David R. González-Barreto Estadísticas Industriales Marzo 2010 31

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Dispersión

Ejemplo• En la tabla que se presenta a continuación y representa la pureza del

oxígeno producida por un proceso químico mientras que x es el porcentaje

de hidrocarbonos presentes en el condensador de la unidad de destilación.

David R. González-Barreto Estadísticas Industriales Marzo 2010 32

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Dispersión

Ejemplo

Observación x y

1 0.99 90.01

2 1.02 89.05

3 1.15 91.43

4 1.29 93.74

5 1.46 96.73

6 1.36 94.45

7 0.87 87.59

8 1.23 91.77

9 1.55 99.42

10 1.40 93.65

11 1.19 93.54

12 1.15 92.52

13 0.98 90.56

14 1.01 89.54

15 1.11 89.85

16 1.20 90.39

17 1.26 93.25

18 1.32 93.41

19 1.43 94.98

20 0.95 87.33

David R. González-Barreto Estadísticas Industriales Marzo 2010 33

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Dispersión

Ejemplo

Plot of Y vs X

0.87 1.07 1.27 1.47 1.67

X

87

90

93

96

99

102

Y

David R. González-Barreto Estadísticas Industriales Marzo 2010 34

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diagrama de Dispersión

Ejemplo• La inspección de este diagrama indica que aunque ninguna curva

contendría exactamente todos los puntos, una relación lineal positiva

parece existir entre estas dos variables.

• Nota de cautela: El que este diagrama muestre una relación aparente

entre las variables no puede tomarse como que existe una causalidad entre

éstas.

David R. González-Barreto Estadísticas Industriales Marzo 2010 35

Prin EDA DistEstim Hyp Cont Cap R&RMues

Población Muestra

x1

x2

Parámetros Estadísticas

x3

x4

xn

:

.

Muestra vs. Población

,.......,,, 2 rSSx

David R. González-Barreto Estadísticas Industriales Marzo 2010 36

Prin EDA DistEstim Hyp Cont Cap R&RMues

Medidas de Tendencia Central

• Promedio muestral

– El valor del promedio muestral tiene mayor precisión que cada

observación individual. Por lo tanto, en la mayoría de los casos

éste será representado con un dígito más que los utilizados para

las observaciones individuales.

n

n

ii

x

x 1

David R. González-Barreto Estadísticas Industriales Marzo 2010 37

Prin EDA DistEstim Hyp Cont Cap R&RMues

Medidas de Tendencia Central

• Mediana

– La mediana es el punto en el cual la muestra es dividida en dos

mitades. Si x(1) , x(2) , …, x(n) representa una muestra ordenada

en forma ascendente, entonces la mediana se define como la

observación del medio o la observación ([n + 1] / 2) cuando n es

impar y el promedio de las dos observaciones del medio si n es

par.

David R. González-Barreto Estadísticas Industriales Marzo 2010 38

Prin EDA DistEstim Hyp Cont Cap R&RMues

Medidas de Tendencia Central

En términos matemáticos,

• La ventaja fundamental de la mediana es que ésta no es influenciada por

valores extremos.

, n parxx

, n imparx

x n/n/

/n

2

~122

21

David R. González-Barreto Estadísticas Industriales Marzo 2010 39

Prin EDA DistEstim Hyp Cont Cap R&RMues

Medidas de Tendencia Central

• Moda

– La moda es la observación que ocurre con mayor frecuencia en

la muestra. Cuando los dos valores más frecuentes ocurren

igual número de veces, decimos que los datos siguen una

distribución bimodal.

David R. González-Barreto Estadísticas Industriales Marzo 2010 40

Prin EDA DistEstim Hyp Cont Cap R&RMues

Cuartilas y Percentilas

• La mediana de una muestra o una población divide los datos en dos

mitades iguales. Los datos también pueden dividirse en más de dos partes.

Cuando un conjunto de datos ordenados se divide en cuatro partes iguales,

los puntos en los cuales ocurre esa división son llamados cuartilas.

David R. González-Barreto Estadísticas Industriales Marzo 2010 41

Prin EDA DistEstim Hyp Cont Cap R&RMues

Cuartilas y Percentilas

• La primera cuartila o cuartila inferior, q1, corresponde al valor que

tiene aproximadamente una cuarta parte (25%) de las observaciones bajoel mismo y aproximadamente 75% de las observaciones por encima de él.La segunda cuartila q

2, tiene aproximadamente el 50% de las

observaciones bajo su valor y corresponde a la mediana. Finalmente, la

tercera cuartila o cuartila superior, q3, tiene aproximadamente tres

cuartas partes (75%) de las observaciones bajo su valor. Como en el casode la mediana, las cuartilas pueden no ser únicas. Cuando esto ocurre,una forma simple de manejarlo es tomar el promedio como la cuartila

cuando más de una observación satisface la definición.

David R. González-Barreto Estadísticas Industriales Marzo 2010 42

Prin EDA DistEstim Hyp Cont Cap R&RMues

Cuartilas y Percentilas

Ejemplo

Las siguientes observaciones representan el tiempo en horas hasta

falla de un material eléctrico de insulación. 204 228 252 300 324 444 624 720 816 912

1176 1296 1392 1488 1512 2520 2856 3192 3528 3710

David R. González-Barreto Estadísticas Industriales Marzo 2010 43

Prin EDA DistEstim Hyp Cont Cap R&RMues

Cuartilas y Percentilas

Ejemplo

La mediana sería:

~x q2

912 1176

21044

La primera cuartila:

q1

324 444

2384

La cuartila superior:

q3

1512 2520

22016

David R. González-Barreto Estadísticas Industriales Marzo 2010 44

Prin EDA DistEstim Hyp Cont Cap R&RMues

Cuartilas y Percentilas

Ejemplo

Note que los valores de la mediana, cuartila inferior y cuartila

superior corresponden a los extremos y la línea cortante de la

caja en este gráfico.

Box-and-Whisker Plot

0 1 2 3 4(X 1000)

Tiempo

David R. González-Barreto Estadísticas Industriales Marzo 2010 45

Prin EDA DistEstim Hyp Cont Cap R&RMues

Cuartilas y Percentilas

• Cuando un conjunto ordenado de datos es subdividido en cien partes

iguales, los puntos en los cuales ocurre esa división son llamados

percentilas (pk).

David R. González-Barreto Estadísticas Industriales Marzo 2010 46

Prin EDA DistEstim Hyp Cont Cap R&RMues

Medidas de Variabilidad

• Rango

– Una medida muy simple de la variabilidad es el rango muestral,

que se define como la diferencia entre la observación mayor y la

menor en la muestra.

r = max (xi) – min (xi)

David R. González-Barreto Estadísticas Industriales Marzo 2010 47

Prin EDA DistEstim Hyp Cont Cap R&RMues

Medidas de Variabilidad

• Rango

– El rango muestral es fácil de obtener, pero ignora toda la

información existente en la muestra no contenida en las dos

observaciones consideradas. Cuando el tamaño de muestra es

pequeño, digamos n < 10, la información perdida al calcular el

rango no es tan significativa. En general, se prefiere una

medida de variabilidad que considere todas las observaciones

en lugar de una que considere solo unas pocas.

David R. González-Barreto Estadísticas Industriales Marzo 2010 48

Prin EDA DistEstim Hyp Cont Cap R&RMues

Medidas de Variabilidad

• El rango entre cuartilas (“interquartile range” – IQR) se define como la

diferencia entre las cuartilas superior e inferior. El IQR es menos sensitivo

a valores extremos en la muestra que el rango muestral ordinario.

IQR = q3 – q1

David R. González-Barreto Estadísticas Industriales Marzo 2010 49

Prin EDA DistEstim Hyp Cont Cap R&RMues

Medidas de Variabilidad

• Varianza muestral y desviación estándar muestral

– Las más importantes medidas de variabilidad lo son: la varianza

muestral y la desviación estándar muestral. Si x1 , x2 , …, xn es

una muestra de n observaciones, entonces la varianza muestral

estará dada por:

n

i

i

n

xxs

1

22

1

)(

David R. González-Barreto Estadísticas Industriales Marzo 2010 50

Prin EDA DistEstim Hyp Cont Cap R&RMues

Medidas de Variabilidad

• La desviación estándar muestral, s, es la raíz cuadrada positiva de

la varianza muestral.

• Las unidades de la varianza muestral son el cuadrado de las unidades de la

variable original. La desviación estándar tiene la propiedad deseable de

medir la variabilidad en las unidades originales de la variable de interés x.

David R. González-Barreto Estadísticas Industriales Marzo 2010 51

Prin EDA DistEstim Hyp Cont Cap R&RMues

Medidas de Variabilidad

• Coeficiente de variación

– En ocasiones es deseable expresar la variación como una

fracción del promedio. Una medida no dimensional llamada el

coeficiente muestral de variación se usa con este propósito.

– Este coeficiente es útil cuando comparamos dos o más

conjuntos de datos que difieren considerablemente en la

magnitud de las observaciones.

x

scv

David R. González-Barreto Estadísticas Industriales Marzo 2010 52

Prin EDA DistEstim Hyp Cont Cap R&RMues

Distribuciones

• La distribución de probabilidad o simplemente la distribución de una variable aleatoria X, es una descripción del comportamiento de los posibles valores de X y sus respectivas probabilidades. En muchas ocasiones la distribución de probabilidad de la variable de interés es el resumen más útil para el analista del experimento o proceso bajo estudio.

• Las distribuciones también son clasificadas de acuerdo a los datos considerados. Es decir, tenemos distribuciones discretas o por

atributo y distribuciones continuas o por variable.

David R. González-Barreto Estadísticas Industriales Marzo 2010 53

Prin EDA DistEstim Hyp Cont Cap R&RMues

Distribución Binomial

• Un experimento de n intentos donde

los intentos son independientes,

cada intento tiene solamente dos posibles

resultados llamados: éxito o fracaso y

la probabilidad de éxito en cada intento,

denominada p, permanece constante

– El número de éxitos, x, tiene una distribución binomial con

parámetros p y n.

David R. González-Barreto Estadísticas Industriales Marzo 2010 54

Prin EDA DistEstim Hyp Cont Cap R&RMues

Distribución Binomial

• La función de probabilidad de x es:

• Si x es una variable aleatoria binomial con parámetros p y n, entonces:

nxppx

nnpxf

xnxx ,...,1,0,1,;

pnpXV

npXE

x

x

1)(

)(

2

David R. González-Barreto Estadísticas Industriales Marzo 2010 55

Prin EDA DistEstim Hyp Cont Cap R&RMues

Distribución Geométrica

• En una serie de pruebas Bernoulli, con probabilidad de éxito constante, p,

la variable aleatoria x representa el número de intentos hasta que ocurra elprimer éxito. Entonces x sigue una distribución geométrica con

parámetro p

,...2,1,1;1

xpppxfx

x

David R. González-Barreto Estadísticas Industriales Marzo 2010 56

Prin EDA DistEstim Hyp Cont Cap R&RMues

Distribución Geométrica

• Si x es una variable aleatoria con parámetro p, entonces el promedio y la

varianza de x son:

22 /1)(

/1)(

ppXV

pXE

x

x

David R. González-Barreto Estadísticas Industriales Marzo 2010 57

Prin EDA DistEstim Hyp Cont Cap R&RMues

Distribución Poisson

• Dado un intervalo de números reales, asuma que el conteo ocurre

aleatoriamente a lo largo del intervalo. Si el intervalo se dividiera en sub-

intervalos de tamaño pequeño de modo que:

la propabilidad de más de un conteo en un sub-intervalo es cero,

la probabilidad de un conteo en un sub-intervalo es igual para

todos los sub-intervalos y proporcional al largo del sub-intervalo

el conteo en cada sub-intervalo es independiente de otros sub-

intervalos

David R. González-Barreto Estadísticas Industriales Marzo 2010 58

Prin EDA DistEstim Hyp Cont Cap R&RMues

Distribución Poisson

• Si un número promedio de conteos en el intervalo es > 0, la variable

aleatoria x que representa el número de conteos en el intervalo sigue una

distribución Poisson con parámetro y la función de probabilidad de x es

,...2,1,0,!

; xx

exf

x

x

David R. González-Barreto Estadísticas Industriales Marzo 2010 59

Prin EDA DistEstim Hyp Cont Cap R&RMues

Distribución Poisson

• Si x es una variable aleatoria de distribución Poisson con parámetro ,

entonces el promedio y la varianza de x son

)(

)(

2 XV

XE

x

x

David R. González-Barreto Estadísticas Industriales Marzo 2010 60

Prin EDA DistEstim Hyp Cont Cap R&RMues

Distribución Normal

• La distribución más utilizada para el modelaje de experimentos aleatorioses la distribución normal. Esto es así porque muchos fenómenos de lanaturaleza y de procesos de manufactura tienen un “comportamientonormal”.

• Puede demostrarse además, que cuando un experimento consiste de unaserie de intentos independientes (n) y cada uno de ellos resulta en un valorobservado de una variable aleatoria proveniente de una distribuciónparticular, entonces, la variable aleatoria que representa el promedio o eltotal de los n intentos se aproximará a comportarse normalmente. Esteconcepto se conoce como el Teorema de Límite Central.

David R. González-Barreto Estadísticas Industriales Marzo 2010 61

Prin EDA DistEstim Hyp Cont Cap R&RMues

Distribución Normal

• La distribución normal consta de dos parámetros. El de tendencia central,

conocido como y el de dispersión, en este caso representado por la

desviación estándar .

• La función de probabilidad para la distribución normal está dada por:

0 y parámetroscon

2

1,;

2

2

2 xexf

x

x

David R. González-Barreto Estadísticas Industriales Marzo 2010 62

Prin EDA DistEstim Hyp Cont Cap R&RMues

Distribución Normal

• Una variable aleatoria con = 0 y 2 = 1 se le conoce como una normal estandarizada y se denota como z. Donde, z = (x - ) / para el caso de las observaciones individuales. Cuando trabajamos con promedios,

• Interpretamos z como el número de desviaciones estándar a que se encuentra x del promedio . Magnitudes altas de z corresponden a valores de x no típicos.

n

xz

David R. González-Barreto Estadísticas Industriales Marzo 2010 63

Prin EDA DistEstim Hyp Cont Cap R&RMues

Distribución Normal

68%

95.5%

99.73%

David R. González-Barreto Estadísticas Industriales Marzo 2010 64

Prin EDA DistEstim Hyp Cont Cap R&RMues

Distribución Normal

x

2 = 1

2 = 9

2 = 1fx(x)

5 15

David R. González-Barreto Estadísticas Industriales Marzo 2010 65

Prin EDA DistEstim Hyp Cont Cap R&RMues

Pruebas para Determinar

Normalidad• En ocasiones se quiere determinar o corroborar si una muestra de interés

proviene de una población con cierta distribución probabilística. Para esto

existen varias pruebas tanto numéricas como gráficas. Una de las pruebas

más más utilizadas para determinar si los datos provienen de una

distribución normal es la Kolmogorov-Smirnov.

David R. González-Barreto Estadísticas Industriales Marzo 2010 66

Prin EDA DistEstim Hyp Cont Cap R&RMues

Prueba para Determinar Normalidad

EJEMPLOAnalice la siguiente muestra de 60 pesos de tabletas y determine si sería correcto

inferir que la distribución que mejor representa los pesos individuales de las tabletas

es la distribución normal.

0.563 0.548 0.55 0.554 0.55 0.556

0.556 0.547 0.55 0.55 0.552 0.552

0.556 0.556 0.544 0.547 0.55 0.55

0.559 0.552 0.549 0.547 0.549 0.554

0.552 0.552 0.551 0.549 0.551 0.544

0.555 0.555 0.55 0.554 0.557 0.546

0.558 0.554 0.554 0.555 0.556 0.551

0.558 0.549 0.55 0.552 0.559 0.556

0.559 0.545 0.548 0.55 0.562 0.55

0.551 0.556 0.551 0.559 0.554 0.556

Ho: Los pesos de las tabletas siguen una distribución Normal.

Hi: Los pesos de las tabletas no siguen una distribución Normal.

David R. González-Barreto Estadísticas Industriales Marzo 2010 67

Prin EDA DistEstim Hyp Cont Cap R&RMues

Pruebas para Determinar

Normalidad• La prueba Kolmogorov-Smirnov utiliza la diferencia vertical máxima (Max. Diff.)

entre la distribución empírica y la teórica para determinar la bondad de ajuste

de la muestra observada. La prueba Kolmogorov-Smirnov es preferida sobre

la de Chi Cuadrada especialmente cuando el tamaño de la muestra es pequeño.

}Max. Diff.Empirical Dist.

Theoretical Dist.

David R. González-Barreto Estadísticas Industriales Marzo 2010 68

Prin EDA DistEstim Hyp Cont Cap R&RMues

Pruebas para Determinar

Normalidad• En todas las pruebas la forma de decidir si la hipótesis bajo consideración,

datos provienen de una distribución normal, es idéntica. El “software”

reportará un valor p, que de ser bajo (i.e. < .05) indicaría que la hipótesis se

rechaza o que los datos no provienen de una distribución normal.

David R. González-Barreto Estadísticas Industriales Marzo 2010 69

Prin EDA DistEstim Hyp Cont Cap R&RMues

Pruebas para Determinar

Normalidad• Un método gráfico para determinar si la distribución de los datos bajo

consideración es normal, es el trazo de cuantilas normales (normal

probability plot).

• Este trazo debe mostrar un comportamiento lineal para decidir

afirmativamente que los datos son normales.

David R. González-Barreto Estadísticas Industriales Marzo 2010 70

Prin EDA DistEstim Hyp Cont Cap R&RMues

Pruebas para Determinar

Normalidad• Otra herramienta gráfica para evaluar la normalidad de unos datos es el

trazo de probabilidad normal.

• En esta herramienta se trazan los datos de interés contra su respectiva

frecuencia acumulada observada (pares ordenados) en un papel que tiene

su escala vertical diseñada de tal forma que si las observaciones trazadas

tienen un comportamiento lineal entonces decidimos que los datos

provienen de un fenómeno con distribución normal.

David R. González-Barreto Estadísticas Industriales Marzo 2010 71

Prin EDA DistEstim Hyp Cont Cap R&RMues

Pruebas para Determinar

Normalidad• Para determinar los pares de coordenadas a trazarse en el papel:

– Ordene de menor a mayor las observaciones x(j),

– Calcule la frecuencia acumulada observada para cada x(j), y

= [(j – 0.5)/tamaño de muestra].

David R. González-Barreto Estadísticas Industriales Marzo 2010 72

Prin EDA DistEstim Hyp Cont Cap R&RMues

Pruebas para Determinar

Normalidad - Ejemplo

• Se analizaron 60 pesos de tabletas. Los resultados fueron los siguientes:

David R. González-Barreto Estadísticas Industriales Marzo 2010 73

Prin EDA DistEstim Hyp Cont Cap R&RMues

Planes de Muestreo

David R. González-Barreto Estadísticas Industriales Marzo 2010 74

Prin EDA DistEstim Hyp Cont Cap R&RMues

Planes de Muestreo

• Indice

Definiciones

Relación Productor – Consumidor

Curva O.C.

Planes de Muestreo Sencillo

Riesgo del Consumidor

Riesgo del Productor

Estándar Militar 105 E

Muestreo Secuencial

David R. González-Barreto Estadísticas Industriales Marzo 2010 75

Prin EDA DistEstim Hyp Cont Cap R&RMues

Definición

• Definición de planes de muestreo – Herramienta estadística en la que se

llevan a cabo los siguientes pasos:

Una muestra aleatoria se toma de un lote.

Una o más características de calidad de las

unidades en la muestra son inspeccionadas.

A base del resultado de lo inspeccionado se dicta

la sentencia sobre aceptar o rechazar el lote.

David R. González-Barreto Estadísticas Industriales Marzo 2010 76

Prin EDA DistEstim Hyp Cont Cap R&RMues

Aspectos Importantes

• Aspectos importantes sobre los planes de muestreo:

• No estiman la calidad del lote, sólo lo sentencian.

• No proveen ninguna forma directa de control de lacalidad.

• Su uso más efectivo es como una herramientapara asegurarse de que lo producido por elproceso cumple con los requerimientos.

• Tipos de planes de muestreo

• Variables (cuantitativa)

• Por atributo (cualitativa)

David R. González-Barreto Estadísticas Industriales Marzo 2010 77

Prin EDA DistEstim Hyp Cont Cap R&RMues

Planes de Muestreo Sencillos

• Planes de muestreo sencillos

• Seleccione una muestra de n unidades de un lote

tamaño N.

• Si encuentra c o menos unidades defectuosas en

la muestra, acepte el lote.

• Si encuentra más de c unidades defectuosas (d)

en la muestra, rechace el lote.

David R. González-Barreto Estadísticas Industriales Marzo 2010 78

Prin EDA DistEstim Hyp Cont Cap R&RMues

Ventajas y Desventajas

• Ventajas de los planes de muestreo

Consume menos tiempo y dinero que la inspección del 100%

de los lotes.

Menos daños al producto debido a la reducción del manejo.

Reduce errores de inspección por concepto de fatiga humana

(dependiendo del plan de muestreo).

• Desventajas de los planes de muestreo

• Riesgo de rechazar lotes buenos y/o aceptar los que se

debieron rechazar.

• Se obtiene información reducida sobre las características de

calidad del proceso.

• No contribuyen a reducir la variabilidad del proceso.

David R. González-Barreto Estadísticas Industriales Marzo 2010 79

Prin EDA DistEstim Hyp Cont Cap R&RMues

Relación Productor-Consumidor

RELACION PRODUCTOR-CONSUMIDOR

• Cuando usamos planes de muestreo existe un conflicto de interés entre el productor y el consumidor. Por un lado el productor quiere que todos los lotes buenos (que no excedan cierta proporción de piezas defectuosas predeterminada p0) sean aceptados. Por otro lado, el consumidor quiere que todos los lotes malos (que excedan p0) sean rechazados. Este conflicto sólo puede ser resuelto con un plan de muestreo cuya curva característica operacional (OC) sea ideal según discutiremos más adelante.

David R. González-Barreto Estadísticas Industriales Marzo 2010 80

Prin EDA DistEstim Hyp Cont Cap R&RMues

Curva Característica Operacional (OC)

Curva Característica Operacional (OC)

• Las curvas OC miden la ejecutoria de los planes de muestreo. En éstas, se

traza la probabilidad de aceptar (pa) un lote contra la proporción de

defectuosos (p) del mismo. Es por esto que las curvas OC son utilizadas

para determinar el poder de discernir o discriminar lotes con distintos

niveles de unidades defectuosas que tienen los planes de muestreo.

David R. González-Barreto Estadísticas Industriales Marzo 2010 81

Prin EDA DistEstim Hyp Cont Cap R&RMues

Curva Característica Operacional (OC)

Curva OC Plan de Muestreo Sencillo

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 0.02 0.04 0.06 0.08 0.1 0.12

Fracción de defectuosos

Pro

ba

bil

ida

d d

e A

ce

pta

r

David R. González-Barreto Estadísticas Industriales Marzo 2010 82

Prin EDA DistEstim Hyp Cont Cap R&RMues

Curva Característica Operacional (OC)

• Una curva OC ideal es aquella donde la probabilidad de aceptar lotes

buenos (p p0) es 1 y la probabilidad de aceptar lotes malos (p > p0) es 0.

En la práctica, obtener una Curva OC ideal para un plan de muestreo no es

común. Lo más cercano que un plan de muestreo estará de obtener una

curva OC ideal será al aumentar significativamente el tamaño de muestra

del mismo.

David R. González-Barreto Estadísticas Industriales Marzo 2010 83

Prin EDA DistEstim Hyp Cont Cap R&RMues

Curva Característica Operacional (OC)

Proporción de defectuosos (p)P0

1

(Pa)

0

David R. González-Barreto Estadísticas Industriales Marzo 2010 84

Prin EDA DistEstim Hyp Cont Cap R&RMues

Curva Característica Operacional (OC)

• Existen dos tipos de Curvas OC:

– Tipo A – usadas para lotes finitos (pequeños) en cuyo caso (p) está

dada por la distribución probabilística Hipergeométrica.

– Tipo B – usadas para lotes infinitos (grandes) en cuyo caso (p) está

dado por la distribución probabilística Binomial.

• Si ambas curvas son similares.

• La curva OC tipo B tiende a caer por encima de la tipo A.

• El poder de discriminación del plan de muestreo aumentará a

medida que aumente el tamaño de la muestra (n).

10.0N

n

David R. González-Barreto Estadísticas Industriales Marzo 2010 85

Prin EDA DistEstim Hyp Cont Cap R&RMues

Curva Característica Operacional (OC) Ejemplo

Se desea construir la curva OC para el siguiente plan de muestreo:

N = 10,000 n = 89 c= 2 p = 0.01

Como el lote es grande (infinito) y 10.0N

n uso la distribución Binomial para calcular

los puntos de la Curva OC tipo B.

Pa {d defectuosos} = dnd p1p

!dn!d

!n

Pa {d < c} = d89d

c

0d

99.001.0!d89!d

!89

Pa (d < 2 / p = 0.01)

=9397.099.001.0

!87!2

!8999.001.0

!88!1

!8999.001.0

!89!0

!89 872881890

David R. González-Barreto Estadísticas Industriales Marzo 2010 86

Prin EDA DistEstim Hyp Cont Cap R&RMues

Curva Característica Operacional (OC) Ejemplo

Plan de Muestreo: N = 10,000 n = 89 c = 2

Fracción de Defectuosos (p) Probabilidad de Aceptar el Lote (Pa)

0.005 0.9897

0.010 0.9397

0.020 0.7366

0.030 0.4985

0.040 0.3042

0.050 0.1721

0.060 0.0919

0.070 0.0468

0.080 0.0230

0.090 0.0109

David R. González-Barreto Estadísticas Industriales Marzo 2010 87

Prin EDA DistEstim Hyp Cont Cap R&RMues

Curva Característica Operacional (OC) Ejemplo

Curva OC Plan de Muestreo Sencillo

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 0.02 0.04 0.06 0.08 0.1 0.12

Proporción defectuosos en Lote (p)

Pro

bab

ilid

ad

de A

cep

tar

David R. González-Barreto Estadísticas Industriales Marzo 2010 88

Prin EDA DistEstim Hyp Cont Cap R&RMues

Curva Característica Operacional (OC) Ejemplo

• Si variamos el tamaño de muestra (n), la curva OC del plan de muestreo de interés

sería como se presenta a continuación:

Dos Planes de Muestreo Sencillo

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 0.02 0.04 0.06 0.08 0.1 0.12

Proporción defectuosos del Lote (p)

Pro

bab

ilit

idad

de A

cep

tar

Plan 1

Plan 2

n = 50, c =1

n=200, c=4

David R. González-Barreto Estadísticas Industriales Marzo 2010 89

Prin EDA DistEstim Hyp Cont Cap R&RMues

Curva Característica Operacional (OC) Ejemplo

• Para distintos valores de c, la curva OC del plan de muestreo de interés sería como

se presenta a continuación:

Dos Planes de Muestreo Sencillo

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 0.02 0.04 0.06 0.08 0.1 0.12

Proporción defectuosos del Lote (p)

Pro

ba

bil

itid

ad

de

Ac

ep

tar

Plan 1

Plan 2

n = 89, c =2

n=89, c=0

David R. González-Barreto Estadísticas Industriales Marzo 2010 90

Prin EDA DistEstim Hyp Cont Cap R&RMues

Puntos de Interés

• En todo plan de muestreo estarán presentes los siguientes puntos deinterés tanto para el productor como para el consumidor:

– Riesgo del productor ( ) = la probabilidad de rechazar un lote que debióhaber sido aceptado.

– AQL (Acceptable Quality Level) = nivel más pobre de calidad, o lamáxima fracción defectuosa del proceso del productor que elconsumidor consideraría aceptable como el promedio del proceso.

– Riesgo del consumidor ( ) = probabilidad de aceptar un lote que debióhaber sido rechazado.

– LTPD (Lost Tolerance Percent Defective) = un nivel de calidad del lotetan pobre que el consumidor solo lo podría aceptar por error.

David R. González-Barreto Estadísticas Industriales Marzo 2010 91

Prin EDA DistEstim Hyp Cont Cap R&RMues

Puntos de Interés

• Se debe siempre recordar que es a AQL como es a LTPD. El nivel de

protección que un plan de muestreo ofrezca a cada una de las partes en la

relación Productor-Consumidor dependerá de los dos puntos antes

mencionados (AQL, 1 - ), (LTPD, ). Estos puntos de interés pueden ser

vistos en la Curva OC del plan de muestreo diseñado.

David R. González-Barreto Estadísticas Industriales Marzo 2010 92

Prin EDA DistEstim Hyp Cont Cap R&RMues

Puntos de Interés

Curva OC Plan de Muestreo Sencillo

Fracción de defectuosos

Pro

babilid

ad d

e A

cepta

r

AQL LTPD

(AQL, 1 - )

(LTPD, )

David R. González-Barreto Estadísticas Industriales Marzo 2010 93

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diseño e Implantación

Diseño e Implantación de Planes de Muestreo

• El objetivo principal de diseñar un plan de muestreo es el determinar

tamaño de muestras (n) y límite de aceptación (c), para dictar sentencia

sobre un lote, que cumpla el nivel de riesgo estipulado por el productor, el

consumidor o ambos.

David R. González-Barreto Estadísticas Industriales Marzo 2010 94

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diseño e Implantación

Plan de Muestreo Sencillo

Plan de Muestreo Sencillo

• Suponga que se toma una muestra aleatoria de

tamaño n de un lote de tamaño N. Al inspeccionar

la muestra, si hay más de c unidades defectuosas

rechazo el lote, de lo contrario lo acepto. Existen

varias formas de diseñar un plan de forma tal que

el interés del consumidor o del productor sea

protegida.

David R. González-Barreto Estadísticas Industriales Marzo 2010 95

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diseño e Implantación

Planes de muestreo basados en el riesgo del productor• Cuando el riesgo del productor ( ) y el nivel de calidad aceptable (AQL)

asociado con éste son estipulados como la base del plan de muestreo sedesea diseñar un plan de muestreo sencillo cuya Curva OC pase por lacoordenada (AQL, 1 - ). Para diseñar dicho plan siga los siguientespasos:

Seleccione el límite de aceptación (c).

Utilice la distribución probabilística Poisson (presumiendo Curva OC tipo B,p < 0.10) para determinar la cantidad promedio de unidades defectuosaspor muestra ( ).

Determine el tamaño de la muestra (n).

AQLnn p

AQLn

David R. González-Barreto Estadísticas Industriales Marzo 2010 96

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diseño e Implantación - Ejemplo

Diseñe un plan de muestreo sencillo que satisfaga el riesgo del productor de 5% para

lotes que tienen una fracción de defectuoso de 1.5%.

= 0.05 AQL = 0.015

Para c = 1 obtenemos de la distribución Poisson un = 0.355

2467.23015.0

355.0

AQL

355.0n

El plan diseñado indica que se debe tomar una muestra aleatoria de 24 unidades y aceptar

el lote como bueno si no encuentra más de 1 unidad defectuosa.

Para c = 3

9207.91015.0

366.1n

Para c = 6

n

Note que todas las Curvas OC para los planes de muestreo diseñados satisfacen el riesgo

estipulado del productor ( = 5%, AQL = 1.5%)

David R. González-Barreto Estadísticas Industriales Marzo 2010 97

Prin EDA DistEstim Hyp Cont Cap R&RMues

Diseño e Implantación - Ejemplo

Comparación Planes de Muestreo

0

0.2

0.4

0.6

0.8

1

0 0.05 0.1 0.15

Fracción de defectuosos (p)

Pro

bab

ilid

ad

de

Acep

tar

Plan 1

Plan 2

David R. González-Barreto Estadísticas Industriales Marzo 2010 98

Prin EDA DistEstim Hyp Cont Cap R&RMues

Riesgo del Consumidor

Planes de muestreo basados en el riesgo del consumidor

• Cuando el riesgo del consumidor ( ) y el nivel de calidad aceptable (LTPD) asociada con éste,

son estipulados como la base del plan de muestreo, se desea diseñar un plan de muestreo

sencillo cuya Curva OC pase por la coordenada (LTPD, ). Para diseñar dicho plan siga los

siguientes pasos:

Seleccione el límite de aceptación (c).

Utilice la distribución probabilística Poisson para determinar la cantidad promedio de unidades

defectuosas por muestra ( ).

Determine el tamaño de la muestra (n).LTPDnn p

LTPDn

David R. González-Barreto Estadísticas Industriales Marzo 2010 99

Prin EDA DistEstim Hyp Cont Cap R&RMues

Riesgo del Consumidor - Ejemplo

Diseñe un plan de muestreo sencillo que satisfaga el riesgo del consumidor de 10% para

lotes que tienen una fracción de defectuoso de 8%.

= 0.10 LTPD = 0.08

Para c = 1 obtenemos de la distribución Poisson un = 3.890

4962.4808.0

890.3

LTPD

890.3n

Para c = 3

8451.8308.0

681.6n

Para c = 6

n

Note que todas las Curvas OC para los planes de muestreo diseñados satisfacen el riesgo

estipulado del consumidor ( = 10%, LTPD = 8%).

David R. González-Barreto Estadísticas Industriales Marzo 2010 100

Prin EDA DistEstim Hyp Cont Cap R&RMues

Riesgo del Consumidor - Ejemplo

Comparación Planes de Muestreo

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 0.05 0.1 0.15

Fracción de defectuosos (p)

Pro

ba

bil

ida

d d

e A

ce

pta

r

Plan 1

Plan 2

David R. González-Barreto Estadísticas Industriales Marzo 2010 101

Prin EDA DistEstim Hyp Cont Cap R&RMues

Riesgos del Productor y el Consumidor

Planes de muestreo basados en los riesgos del productor y elconsumidor

• Diseñar un plan de muestreo que satisfaga exactamente ambas partes, el productory el consumidor; es prácticamente imposible. Una alternativa es satisfacerexactamente una de las partes (Productor o Consumidor) y tratar de satisfacer lomás cercano posible a lo estipulado por la otra parte (por tanteo). Otra alternativamás fácil pero menos exacta es utilizar una herramienta gráfica llamadaNomograma. Para obtener un plan de muestreo que cumpla con lo estipulado porambas partes mediante el uso del Nomograma siga los siguientes pasos:

– Trace una línea que conecte AQL con (1 - ) y otra línea conectandoLTPD con .

– Identifique el plan de muestreo dado por la intersección de las doslíneas dentro del Nomograma.

David R. González-Barreto Estadísticas Industriales Marzo 2010 102

Prin EDA DistEstim Hyp Cont Cap R&RMues

Riesgos del Productor y el Consumidor -

Ejemplo

Diseñe un plan de muestreo sencillo que satisfaga tanto el riesgo del productor de 5%

para lotes que tienen una fracción de defectuoso de 2% como el riesgo del consumidor de

10% para lotes que tienen una fracción de defectuoso de 8%.

= 0.05, AQL = 0.02, = 0.10, LTPD = 0.08

En base al punto de intersección de las dos líneas (desde 0.95 hasta 0.02 y desde 0.10

hasta 0.08) se obtiene el siguiente plan de muestreo sencillo:

n = 98 c = 4

David R. González-Barreto Estadísticas Industriales Marzo 2010 103

Prin EDA DistEstim Hyp Cont Cap R&RMues

Riesgos del Productor y el Consumidor -

Ejemplo

David R. González-Barreto Estadísticas Industriales Marzo 2010 104

Prin EDA DistEstim Hyp Cont Cap R&RMues

Estándar Militar 105E (ANSI/ASQC Z1.4)

• Están basados en el AQL, en el tamaño del lote y en el nivel de inspección.

• El nivel de inspección I requiere aproximadamente la mitad de la inspección que el nivel II y se utiliza cuando se requiere menor discriminación.

• El nivel de inspección III requiere aproximadamente el doble de la inspección del nivel II y se utiliza cuando se necesita mayor discriminación.

• Existen cuatro niveles de inspección especial: S-1, S-2, S-3 y S-4. Estos niveles producirán tamaños de muestra muy pequeños y sólo deben ser utilizados cuando se puedan o se necesite aceptar riesgos grandes.

David R. González-Barreto Estadísticas Industriales Marzo 2010 105

Prin EDA DistEstim Hyp Cont Cap R&RMues

Estándar Militar 105E

• Sus curvas O. C. son del tipo B.

• Debido a que estos planes están orientados al AQL, se

enfocan en el riesgo del productor. Por lo tanto, el poder

discriminatorio del plan de muestreo (la forma de la

curva O. C.) se obtiene mediante la selección del nivel

de inspección.

David R. González-Barreto Estadísticas Industriales Marzo 2010 106

Prin EDA DistEstim Hyp Cont Cap R&RMues

Estándar Militar 105E - Reglas de

intercambio

David R. González-Barreto Estadísticas Industriales Marzo 2010 107

Prin EDA DistEstim Hyp Cont Cap R&RMues

Estándar Militar 105E

• Procedimiento

– Escoga el AQL

– Escoga el nivel de inspección

– Determine el tamaño del lote

– De acuerdo a la tabla que sigue, encuentre la letra para buscar

el tamaño de la muestra

– Determine el tipo de plan de muestreo apropiado (sencillo,

doble, múltiple)

– Busque en la tabla correcta para encontrar el tipo de plan a

utilizarse

David R. González-Barreto Estadísticas Industriales Marzo 2010 108

Prin EDA DistEstim Hyp Cont Cap R&RMues

Estándar Militar 105E – Tabla de letras

David R. González-Barreto Estadísticas Industriales Marzo 2010 109

Prin EDA DistEstim Hyp Cont Cap R&RMues

Estándar Militar 105E – Inspección Normal

David R. González-Barreto Estadísticas Industriales Marzo 2010 110

Prin EDA DistEstim Hyp Cont Cap R&RMues

Estándar Militar 105E – Inspección ajustada

David R. González-Barreto Estadísticas Industriales Marzo 2010 111

Prin EDA DistEstim Hyp Cont Cap R&RMues

Estándar Militar 105E – Inspección reducida

David R. González-Barreto Estadísticas Industriales Marzo 2010 112

Prin EDA DistEstim Hyp Cont Cap R&RMues

Estándar Militar 105E - Ejemplo

• N = 2000

• AQL = 0.65%

• Nivel de inspección general II

– Solución

• De la tabla de las letras: letra K

• De la tabla de inspección normal: n = 125, c = 2

• De la tabla de inspección ajustada: n = 125, c = 1

• De la tabla de inspección reducida: n = 50, c = 1, r

= 3

David R. González-Barreto Estadísticas Industriales Marzo 2010 113

Prin EDA DistEstim Hyp Cont Cap R&RMues

Muestreo Secuencial

• El muestreo secuencial está basado en el “sequential

probability ratio test” (SPRT) desarrollado por Wald.

• Para cada punto en la gráfica del muestreo el eje de x

corresponde al número de artículos inspeccionados

hasta el momento, mientras que el eje de y representa el

número total de defectuosos encontrados hasta ese

momento.

David R. González-Barreto Estadísticas Industriales Marzo 2010 114

Prin EDA DistEstim Hyp Cont Cap R&RMues

Muestro secuencial

• Si el punto trazado se mantiene dentro de las líneas de

aceptación y rechazo, otro artículo debe ser

inspeccionado.

• Tan pronto como un punto esté sobre o por encima de la

línea de rechazo, el lote se rechaza.

• Por otro lado, si un punto cae sobre o por debajo de la

línea de aceptación, el lote se acepta.

David R. González-Barreto Estadísticas Industriales Marzo 2010 115

Prin EDA DistEstim Hyp Cont Cap R&RMues

Muestreo secuencial

• Para diseñar un plan de muestreo secuencial es

necesario especificar las siguientes dos coordenadas:

(p1, 1 - ) , (p2, 1 - ).

David R. González-Barreto Estadísticas Industriales Marzo 2010 116

Prin EDA DistEstim Hyp Cont Cap R&RMues

Muestreo secuencial

• Las ecuaciones para las dos líneas basadas en las dos

coordenadas están dadas por:

kpps

pp

ppk

kh

kh

snh

snhXA

/1/1log

1

1log

1log

1log

donde

line) (rejection X

line) e(acceptanc

21

21

12

2

1

2R

1

David R. González-Barreto Estadísticas Industriales Marzo 2010 117

Prin EDA DistEstim Hyp Cont Cap R&RMues

Muestreo secuencial

David R. González-Barreto Estadísticas Industriales Marzo 2010 118

Prin EDA DistEstim Hyp Cont Cap R&RMues

Muestreo Secuencial - Ejemplo

• Supongamos que queremos encontrar un plan de

muestreo secuencial en el que:

p1 = 0.01, = 0.05, p2 = 0.06, y = 0.10

Entonces:

80066.0

)94.0)(01.0(

)99.0)(06.0(log

1

1log

21

12

pp

ppk

David R. González-Barreto Estadísticas Industriales Marzo 2010 119

Prin EDA DistEstim Hyp Cont Cap R&RMues

Muestreo Secuencial - Ejemplo

57.1

80066.0/05.0

90.0log

/1

log

22.1

80066.0/10.0

95.0log

/1

log

2

1

kh

kh

David R. González-Barreto Estadísticas Industriales Marzo 2010 120

Prin EDA DistEstim Hyp Cont Cap R&RMues

Muestreo Secuencial - Ejemplo

028.0

80066.0/94.0/99.0log

/1/1log21

kpps

Entonces, las líneas de aceptación y rechazo son:

(rechazo) 028.057.1X

n)(aceptació 028.022.1

Rn

nXA

David R. González-Barreto Estadísticas Industriales Marzo 2010 121

Prin EDA DistEstim Hyp Cont Cap R&RMues

Muestreo Secuencial – Ejemplo

• En lugar de trazar un gráfico para determinar la disposición del lote, en el

muestreo secuencial utilizamos una tabla en la que los datos se obtienen

sustituyendo los valores de n en las ecuaciones para las líneas de

aceptación y rechazo y calculando los números de aceptación y rechazo.

Por ejemplo, el cálculo para n = 45 es:

(rechazo) 83.2)45(028.057.1

028.057.1X

n)(aceptació 0.040.028(45)-1.22

028.022.1

Rn

nXA

David R. González-Barreto Estadísticas Industriales Marzo 2010 122

Prin EDA DistEstim Hyp Cont Cap R&RMues

Muestreo Secuencial - Ejemplo

InspeccionadosNúmero de

aceptación

Número de

rechazoInspeccionados

Número de

aceptación

Número de

rechazo

1 a b 24 a 3

2 a 2 25 a 3

3 a 2 26 a 3

4 a 2 27 a 3

5 a 2 28 a 3

6 a 2 29 a 3

7 a 2 30 a 3

8 a 2 31 a 3

9 a 2 32 a 3

10 a 2 33 a 3

11 a 2 34 a 3

12 a 2 35 a 3

13 a 2 36 a 3

14 a 2 37 a 3

15 a 2 38 a 3

16 a 3 39 a 3

17 a 3 40 a 3

18 a 3 41 a 3

19 a 3 42 a 3

20 a 3 43 a 3

21 a 3 44 0 3

22 a 3 45 0 3

23 a 3 46 0 3

"a" - aceptación no es posible

"b" - rechazo no es posible

David R. González-Barreto Estadísticas Industriales Marzo 2010 123

Prin EDA DistEstim Hyp Cont Cap R&RMues

Hipótesis Estadística

• Supuestos o conjeturas acerca de una o más poblaciones de interés. Prueba para verificar si el reclamo sobre cierto parámetro de la población de interés es igual al establecido de la hipótesis nula (Ho).

• “El aceptar la hipótesis nula sólo implica que la muestra analizada no da suficiente evidencia para refutarla. Sin embargo, rechazar la hipótesis nula implica que la muestra analizada da evidencia para rechazarla. Este rechazo da paso a la aceptación de la hipótesis alterna (H1).”

David R. González-Barreto Estadísticas Industriales Marzo 2010 124

Prin EDA DistEstim Hyp Cont Cap R&RMues

Hipótesis Estadística

• Estadística de prueba- Función de la muestra aleatoria que se utiliza para

tomar una decisión en la prueba de hipótesis.

• Valor crítico - Valor que marca el límite entre aceptación o rechazo de la

Ho.

• Región de aceptación - Rango marcado por el valor o valores críticos que

de contener el valor de la Ho daría paso a la aceptación de la misma.

• Región de rechazo - Rango marcado por el valor o valores críticos que de

contener el valor de la Ho daría paso al rechazo de la misma.

David R. González-Barreto Estadísticas Industriales Marzo 2010 125

Prin EDA DistEstim Hyp Cont Cap R&RMues

Hipótesis Estadística

Rechazo

Región de Aceptación

Rechazo

/2 /2

David R. González-Barreto Estadísticas Industriales Marzo 2010 126

Prin EDA DistEstim Hyp Cont Cap R&RMues

Hipótesis Estadística

acepto Ho

rechazo Ho

decisión correcta error

tipo II

error

tipo I

decisión

correcta

Ho es cierto Ho es falso

David R. González-Barreto Estadísticas Industriales Marzo 2010 127

Prin EDA DistEstim Hyp Cont Cap R&RMues

Hipótesis Estadística

• Error tipo I - Rechazar la Ho cuando se debió aceptar.

• Error tipo II - Aceptar la Ho cuando se debió rechazar.

• Nivel de significancia - Probabilidad de cometer error tipo I.

• - Probabilidad de cometer error tipo II.

• Potencia de la prueba (1 - ) - Probabilidad de rechazar la Ho cuando se debió rechazar.

• Valor P - Nivel de significancia mínima al cual el valor observado de la estadística de prueba es significativo.

David R. González-Barreto Estadísticas Industriales Marzo 2010 128

Prin EDA DistEstim Hyp Cont Cap R&RMues

Hipótesis Estadística

• Pasos a seguir en las Pruebas de Hipótesis

1. Establezca la Ho

2. Escoja la H1 apropiada

3. Escoja el nivel de significancia

4. Seleccione la estadística de prueba y establezca la región crítica

5. Compute el valor de la estadística de prueba para la muestra analizada

6. Decida si acepta o rechaza la Ho

7. Tome la acción pertinente dada la decisión

David R. González-Barreto Estadísticas Industriales Marzo 2010 129

Prin EDA DistEstim Hyp Cont Cap R&RMues

Hipótesis Estadística

1 POBLACION

2

POBLACIONES>2

POBLACIONES

CONTINUOS

O POR

VARIABLE

DISCRETOS

ANOVACONTINUOS

O POR

VARIABLEDISCRETOS

2

D

.

p= proporción

defectuosos

( 1 - 2) = diferencia de

promedios

2/ 2 = razón de varianzas.

(p1 – p2) = diferencia de proporciones

.

David R. González-Barreto Estadísticas Industriales Marzo 2010 130

Prin EDA DistEstim Hyp Cont Cap R&RMues

Concepto del valor P

• El valor p se define como el nivel mínimo de significancia al cual la hipótesis nula Ho sería

rechazada. En el caso de la distribución F que usamos en nuestro ANOVA si:

calculada > crítica

• entonces uno rechaza la hipótesis nula Ho en favor de la hipótesis alterna H1. Este concepto se

ilustra en la siguiente Figura.

F

Crítica

F

Calculada

valor p

Como puede notarse en este caso la hipótesis nula Ho no puede ser rechazada

ya que la Fcalculada < Fcrítica, de igual manera el valor p nos daría la misma

decisión bajo la condición:

valor p >

David R. González-Barreto Estadísticas Industriales Marzo 2010 131

Prin EDA DistEstim Hyp Cont Cap R&RMues

Concepto del valor P

• Por lo tanto, el valor p puede ser interpretado como la posibilidad de que la hipótesis nula no sea rechazada. Magnitudes altas del valor p estarán asociadas con no poder rechazar la hipótesis nula mientras que magnitudes bajas del valor p estarán asociadas con el rechazo de la hipótesis nula. Regularmente el valor p es comparado con el nivel establecido para la prueba.

• Usando el valor p como criterio de aceptación o rechazo de una hipótesis es como comúnmente los programas de análisis estadístico le permiten al usuario tomar una decisión. Así que en general, si el valor p es menor que el establecido rechazamos la hipótesis nula de lo contrario no podemos rechazar.

David R. González-Barreto Estadísticas Industriales Marzo 2010 132

Prin EDA DistEstim Hyp Cont Cap R&RMues

Prueba Pareada

• Estas pruebas ocurren cuando se estudia la respuesta de una unidad experimental a dos distintos tratamientos. Por ejemplo, suponga que se conduce un estudio para determinar el efecto de una droga que ayuda en la reducción de la presión arterial. Para medir su efectividad (o su inefectividad), se le provee la droga a una muestra aleatoria de n pacientes. El conjunto de datos consiste de n pares ordenados (xi , yi), donde la xi correspondería a la presión arterial del paciente i, antes del tratamiento mientras que la yi denotaría la presión arterial luego de la droga para el mismo paciente.

David R. González-Barreto Estadísticas Industriales Marzo 2010 133

Prin EDA DistEstim Hyp Cont Cap R&RMues

Prueba Pareada

• La variable di = xi - yi, representa la diferencia en la presión arterial producida por la droga en determinado paciente. Esto es un ejemplo de lo que se conoce como “auto-pareo”, en el cual a una unidad experimental singular se le administran los dos tratamientos.

• En otros casos esos pares son seleccionados. Por ejemplo, en experimentos de sicología gemelos idénticos son utilizados para estas pruebas pareadas. Una vez el par ha sido seleccionado, a una de las dos unidades se le asigna aleatoriamente el tratamiento 1 correspondiendo el tratamiento 2 a la otra unidad. Las ventajas del pareo son intuitivamente claras: reduce la variabilidad en los datos que se debe a otras causas distintas al tratamiento bajo consideración.

David R. González-Barreto Estadísticas Industriales Marzo 2010 134

Prin EDA DistEstim Hyp Cont Cap R&RMues

Prueba Pareada - Ejemplo

• Un estudio se realiza con el objetivo de comparar dos configuraciones de un procesador de computadora. Se midieron los tiempos de ejecución para seis tareas distintas (w1, …, w6).

Las dos configuraciones evaluadas fueron el procesador con y sin “cache”. Los resultados obtenidos se presentan en la siguiente tabla.

Tarea Cache No cache di = xi - yi

W1 69 75 -6

W2 53 83 -30

W3 61 89 -28

W4 54 77 -23

W5 49 83 -34

W6 50 83 -33

David R. González-Barreto Estadísticas Industriales Marzo 2010 135

Prin EDA DistEstim Hyp Cont Cap R&RMues

Prueba Pareada - Ejemplo

Como se puede observar de

los resultados obtenidos de

STATGRAPHICS®, tanto el

valor p como el intervalo de

confianza indican el efecto

significativo que tiene el

cambio de configuración en el

procesador. La configuración

que incluye el “cache” resultó

en una ejecución mucho más

rápida.

Hypothesis Tests for Cache-No_Cache

Sample mean = -25.6667

Sample median = -29.0

t-test

------

Null hypothesis: mean = 0.0

Alternative: not equal

Computed t statistic = -6.04224

P-Value = 0.00178906

Reject the null hypothesis for alpha = 0.05.

T-Test of the Mean

Confidence Intervals

Confidence Intervals for Cache-No_Cache

95.0% confidence interval for mean: -25.6667 +/- 10.9195 [-36.5862,-14.7471]

David R. González-Barreto Estadísticas Industriales Marzo 2010 136

Prin EDA DistEstim Hyp Cont Cap R&RMues

Inferencias sobre los promedios

• Regularmente, la calidad de un producto se mide por una variable cuantitativa xdefinida en cierta población. Se conoce que esta variable estará sujeta a cierto nivel de variación aleatoria, por lo tanto, estudiar el comportamiento de ésta y los parámetros que la describen resulta de vital importancia.

• El reclamo de que > 0 es un ejemplo de una hipótesis estadística que intenta describir o entender dicho comportamiento.

• Cuando el reclamo incluye dos comportamientos el objetivo del estudio podría ser el de medir la diferencia entre los dos promedios ( 1 - 2 > ). De igual forma se podrían hacer reclamos sobre el parámetro de dispersión de la variable de interés. Estos casos se discutirán más adelante.

David R. González-Barreto Estadísticas Industriales Marzo 2010 137

Prin EDA DistEstim Hyp Cont Cap R&RMues

Inferencias sobre los promedios

Ejemplo

• Una empresa manufacturera de lentes de contacto compró una máquina para el llenado de frascos de solución alkalina. Esta máquina fue ajustada para llenar frascos cuya etiqueta indicaba un contenido de 12 onzas. Diez muestras se tomaron para validar que el proceso cumplía con este requisito. Estas observaciones se muestran en la siguiente tabla.

Onzas

11.52 12.54

12.3 12.01

11.1 10.47

10.8 11.02

11.64 12.41

David R. González-Barreto Estadísticas Industriales Marzo 2010 138

Prin EDA DistEstim Hyp Cont Cap R&RMues

Inferencias sobre los promedios

Ejemplo

Hypothesis Tests for Onzas

Sample mean = 11.581

Sample median = 11.58

t-test

------

Null hypothesis: mean = 12.0

Alternative: less than

Computed t statistic = -1.83245

P-Value = 0.0500525

T-Test of the Mean (“Una cola”) T-Test of the Mean (“Dos colas”)

Hypothesis Tests for Onzas

Sample mean = 11.581

Sample median = 11.58

t-test

------

Null hypothesis: mean = 12.0

Alternative: not equal

Computed t statistic = -1.83245

P-Value = 0.100105

Do not reject the null hypothesis for alpha = 0.05.

David R. González-Barreto Estadísticas Industriales Marzo 2010 139

Prin EDA DistEstim Hyp Cont Cap R&RMues

Inferencias sobre los promedios

Ejemplo• Dos catalíticos son analizados para determinar su efecto en el rendimiento de un

proceso químico. El catalítico 1 es el que se utiliza en la actualidad. El catalítico 2tiene menor costo y se adoptaría si el mismo no afecta adversamente elrendimiento del proceso. Un estudio piloto se efectuó resultando en lo siguiente:

Observación Catalítico 1 Catalítico 2

1 91.5 89.19

2 94.18 90.95

3 92.18 90.46

4 95.39 93.21

5 91.79 97.19

6 89.07 97.04

7 94.72 91.07

8 89.21 92.75

David R. González-Barreto Estadísticas Industriales Marzo 2010 140

Prin EDA DistEstim Hyp Cont Cap R&RMues

Inferencias sobre los promedios

Ejemplo

Two Sample T-Test and Confidence Interval

Comparison of Means

-------------------

95.0% confidence interval for mean of Cat1: 92.255 +/- 1.99393

95.0% confidence interval for mean of Cat2: 92.7325 +/- 2.49424

95.0% confidence intervals for the difference between the means:

assuming equal variances: -0.4775 +/- 2.89639

not assuming equal variances: -0.4775 +/- 2.90962

t tests to compare means

Null hypothesis: mean1 = mean2

(1) Alt. hypothesis: mean1 NE mean2

assuming equal variances: t = -0.353591 P-value = 0.728914

not assuming equal variances: t = -0.353591 P-value = 0.729166

(2) Alt. hypothesis: mean1 > mean2

assuming equal variances: t = -0.353591 P-value = 0.635543

not assuming equal variances: t = -0.353591 P-value = 0.635417

(3) Alt. hypothesis: mean1 < mean2

assuming equal variances: t = -0.353591 P-value = 0.364457

not assuming equal variances: t = -0.353591 P-value = 0.364583

David R. González-Barreto Estadísticas Industriales Marzo 2010 141

Prin EDA DistEstim Hyp Cont Cap R&RMues

Inferencias sobre los promedios

Ejemplo

Como se puede observar, tanto de la gráfica

como de ambas pruebas efectuadas, los

promedios no difieren significativamente.

El catalítico 2 podría adoptarse sin el

riesgo de que afecte negativamente el

rendimiento de este proceso.

Cat1

Cat2

Box-and-Whisker Plot

89 91 93 95 97 99

Rendimient

Cata

liti

co

David R. González-Barreto Estadísticas Industriales Marzo 2010 142

Prin EDA DistEstim Hyp Cont Cap R&RMues

Estimado de intervalos

• En muchas ocasiones, un estimado de punto no provee la información suficiente con respecto a un parámetro. Por ejemplo, si nos interesa medir el esfuerzo promedio en tensión de un componente crítico, un valor o estimado de punto no será tan relevante como un intervalo en el cual se espera se encuentre el verdadero valor del parámetro. A estos intervalos los conocemos como intervalos de confianza.

• Un estimado de intervalo de un parámetro desconocido q es un intervalo con formato: l < q < u, donde los puntos extremos l y u dependen del valor numérico del estimado de q para una muestra particular de la distribución muestral de este parámetro. Dado que diferentes muestras producirán diferentes estimados, los puntos extremos del intervalo de cada muestra son variables aleatorias como muestra la siguiente figura.

David R. González-Barreto Estadísticas Industriales Marzo 2010 143

Prin EDA DistEstim Hyp Cont Cap R&RMues

Estimado de intervalos

David R. González-Barreto Estadísticas Industriales Marzo 2010 144

Prin EDA DistEstim Hyp Cont Cap R&RMues

Estimado de intervalos

• Suponga que una población tiene un promedio desconocido y unavarianza conocida . Una muestra de tamaño n de esta población sedenominaría x1, x2, … xn. Un estimador de punto razonable para elpromedio desconocido sería el promedio muestral . La distribución deeste promedio será normal si la población es normal y aproximadamentenormal si las condiciones del teorema de límite central se cumplen. Porlo tanto, la distribución de la estadística

Zx

n/es una distribución normal

estándar

David R. González-Barreto Estadísticas Industriales Marzo 2010 145

Prin EDA DistEstim Hyp Cont Cap R&RMues

Estimado de intervalos

/

2

/

2Distribución de Z

P z Z z/ /2 2

1

P zx

nz

/ /

/2 2

1

P x z n x z n/ /

/ /2 2

1

David R. González-Barreto Estadísticas Industriales Marzo 2010 146

Prin EDA DistEstim Hyp Cont Cap R&RMues

Estimado de intervalos

• De este desarrollo se puede concluir que el intervalo

para el (1- ) % de confianza del promedio m cuando se

tiene una muestra aleatoria de tamaño n y varianza

conocida está dado por:

x z n x z n/ /

/ /2 2

David R. González-Barreto Estadísticas Industriales Marzo 2010 147

Prin EDA DistEstim Hyp Cont Cap R&RMues

Analisis de Varianza (ANOVA)

• Las pruebas de hipótesis estudiadas son métodos que comparan dos tratamientos. Sin embargo, muchos experimentos requieren comparaciones de más de dos tratamientos simultáneamente. Se puede demostrar que si intentamos hacer pruebas para cada pareja de medias o promedios, el error tipo I incrementaría sustancialmente.

• Por ejemplo, un factor con 5 niveles o tratamientos necesitará 10 pruebas si se toman por parejas. Si establece .05 como su error Tipo I, entonces su nivel de confianza para cada prueba individual es 1 - .05 = 0.95.

• Si decimos que las pruebas son independientes, la probabilidad de aceptar la hipótesis nula correctamente en las 10 pruebas será de (0.95)10 = 0.60.

David R. González-Barreto Estadísticas Industriales Marzo 2010 148

Prin EDA DistEstim Hyp Cont Cap R&RMues

ANOVA

• El procedimiento apropiado para probar la igualdad de varias medias o

promedios se conoce como análisis de varianza o ANOVA.

• ANOVA - metodología estadística para probar la igualdad de promedios

cuando existen más de dos promedios. Probablemente es la técnica más

útil en el campo de la estadística inferencial.

David R. González-Barreto Estadísticas Industriales Marzo 2010 149

Prin EDA DistEstim Hyp Cont Cap R&RMues

ANOVA

• PRESUNCIONES DE ANOVA

– Errores o residuales siguen una distribución normal con

promedio cero y varianza constante.

– Errores son independientes.

• El nombre de análisis de varianza (ANOVA) se deriva de la partición

de la variabilidad total encontrada en sus componentes. Para entender

esa partición primero tenemos que definir unos términos.

David R. González-Barreto Estadísticas Industriales Marzo 2010 150

Prin EDA DistEstim Hyp Cont Cap R&RMues

ANOVA

.1y .2y .ay ..y

y..ya.y2.y1.

ya1

ya2

.

.

.

yan

y21

y22

.

.

.

y2n

y11

y12

.

.

.

y1n

a….21

= promedio de las observaciones en el nivel i

yi

yi

y

y

N

= suma de las observaciones en el nivel i

= suma total de las observaciones

= promedio de todas las observaciones

= an = número total de observaciones

2

1 1

..a

i

n

j

ijTOTAL yySS

David R. González-Barreto Estadísticas Industriales Marzo 2010 151

Prin EDA DistEstim Hyp Cont Cap R&RMues

ANOVA

2

1 1

.. ..a

i

n

j

iijiTOTAL yyyySS

.

1 1

.

2

1 1

.

2

1

.

..2

..

iij

a

i

n

j

i

a

i

n

j

iij

a

i

iTOTAL

yyyy

yyyynSS

0....

1

.n

ynyynyyy i

iii

n

j

iij

2

.

2

1

.

2

1 1

.... iij

a

i

i

a

i

n

j

ij yyyynyy

Ecuación fundamental de la descomposición de la suma de cuadrados

David R. González-Barreto Estadísticas Industriales Marzo 2010 152

Prin EDA DistEstim Hyp Cont Cap R&RMues

ANOVA

• En palabras podemos expresar la ecuación previa de la siguiente manera:

ERROROSTRATAMIENTTOTAL SSSSSS

Puede demostrarse que con los grados de libertad sucede lo

mismo.

ERROROSTRATAMIENTTOTALglglgl

N-1 = a-1 + N-a

David R. González-Barreto Estadísticas Industriales Marzo 2010 153

Prin EDA DistEstim Hyp Cont Cap R&RMues

ANOVA

• Ya teniendo los componentes de la suma de cuadrados con sus

correspondientes grados de libertad podemos construir la ANOVA.

ERROR

TRAT

MS

MS .

Fuentes Suma de

Cuadrados

gl Promedio de Cuadrados Fc

Tratamientos SSTRAT. a-1 MSTRAT.=SSTRAT./(a-1)

Error SSERROR N-a MSERROR=SSERROR/(N-a)

Total SSTOTAL N-1

David R. González-Barreto Estadísticas Industriales Marzo 2010 154

Prin EDA DistEstim Hyp Cont Cap R&RMues

ANOVA

• Entonces la hipótesis que tratará de probar Anova será la siguiente:

a210...:H

j i,i1 una menos al para ...:H

j

• Una forma equivalente para establecer la hipótesis sería:

0T...TT:Ha210

ii1 una menos al para 0T:H

David R. González-Barreto Estadísticas Industriales Marzo 2010 155

Prin EDA DistEstim Hyp Cont Cap R&RMues

ANOVA

• Una vez terminada la ANOVA y rechazada la H0 algunas pruebas nos

permiten determinar entre cuales tratamientos o niveles en específico

existe la diferencia de promedios.

• La Diferencia Significativa Mínima (LSD) es una de éstas. La misma

consiste de :

1. Calcular LSD =ji

Enn

MSaNt11

,2/

2. Calcular.. ji yy

3. Si LSDyy ji ..

Concluir quei

yj

son diferentes.

David R. González-Barreto Estadísticas Industriales Marzo 2010 156

Prin EDA DistEstim Hyp Cont Cap R&RMues

ANOVA - Ejemplo

• Un manufacturero de papel produce fundas

para cargar compras. El está interesado en

mejorar el esfuerzo en tensión que resisten

las mismas. Se sospecha que el % de

madera en la pulpa utilizada para la

manufactura puede afectar el esfuerzo en

tensión. La siguiente tabla muestra los

resultados de su experimento.

% de madera en la pulpa

5% 10% 15% 20%

7 12 14 19

8 17 18 25

15 13 19 22

11 18 17 23

9 19 16 18

10 15 18 20

David R. González-Barreto Estadísticas Industriales Marzo 2010 157

Prin EDA DistEstim Hyp Cont Cap R&RMues

ANOVA - Ejemplo

ANOVA Table for Esfuerzo by Conc

Analysis of Variance

-----------------------------------------------------------------------------

Source Sum of Squares Df Mean Square F-Ratio P-Value

-----------------------------------------------------------------------------

Between groups 382.792 3 127.597 19.61 0.0000

Within groups 130.167 20 6.50833

-----------------------------------------------------------------------------

Total (Corr.) 512.958 23

5

10

15

20

Box-and-Whisker Plot

7 10 13 16 19 22 25

Esfuerzo

Co

nc

David R. González-Barreto Estadísticas Industriales Marzo 2010 158

Prin EDA DistEstim Hyp Cont Cap R&RMues

ANOVA – Ejemplo

Multiple Range Tests for Esfuerzo by Conc

--------------------------------------------------------------------------------

Method: 95.0 percent LSD

Conc Count Mean Homogeneous Groups

--------------------------------------------------------------------------------

5 6 10.0 X

10 6 15.6667 X

15 6 17.0 X

20 6 21.1667 X

--------------------------------------------------------------------------------

Contrast Difference +/- Limits

--------------------------------------------------------------------------------

5 - 10 *-5.66667 3.07243

5 - 15 *-7.0 3.07243

5 - 20 *-11.1667 3.07243

10 - 15 -1.33333 3.07243

10 - 20 *-5.5 3.07243

15 - 20 *-4.16667 3.07243

--------------------------------------------------------------------------------

* denotes a statistically significant difference.

David R. González-Barreto Estadísticas Industriales Marzo 2010 159

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control

• La insatisfacción de los clientes es causada por la variabilidad del producto:

las características del producto no ejecutan de acuerdo a las expectativas o

ejecutan de manera diferente de unidad a unidad. La variabilidad del

producto es el resultado de la variabilidad en el proceso que lo crea.

• Por tanto, la clave para lograr productos de alta calidad es limitar la

variabilidad del proceso.

David R. González-Barreto Estadísticas Industriales Marzo 2010 160

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control

• Ningún proceso puede ser perfectamente repetible, alguna variabilidad

siempre existirá y ésta a su vez será transmitida al producto. El objetivo es mantener el proceso estable y predecible a través del tiempo, a esto le

llamamos un proceso en control.

• La herramienta que usamos para „monitorear‟ la estabilidad del proceso es

el gráfico de control.

David R. González-Barreto Estadísticas Industriales Marzo 2010 161

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control

• Para datos continuos, el monitorear la estabilidad del proceso requiere dos

gráficos: el primero maneja la localización de la distribución, mientras el

segundo trabaja con la variabilidad del proceso.

• El gráfico más común utilizado para monitorear la localización es el X -

barra ( ). Los gráficos para la variabilidad incluyen el S (desviación

estándar) y el gráfico R (del rango).

x

David R. González-Barreto Estadísticas Industriales Marzo 2010 162

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control

• Los gráficos de control son una herramienta importante en el mejoramiento

de procesos. Estos gráficos proveen señales visuales que indican cuándo

eventos excepcionales o condiciones fuera de control ocurren en el

proceso. Usar nuestros planes de respuesta o realizar análisis para

encontrar la raíz de la señal, permite que el proceso, así como el producto

que resulta del mismo, puedan ser mejorados de forma sistemática y

continua.

David R. González-Barreto Estadísticas Industriales Marzo 2010 163

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control

• Tipos de variabilidad

– Intrínseca o natural - efecto cumulativo de pequeñas e

inevitables causas en el proceso.

– Externa (causa asignable) - comúnmente provienen de

fuentes externas controlables. Generalmente son mayor que la

variabilidad intrínseca y, por lo tanto, representan un nivel

inaceptable en la ejecutoria del proceso.

David R. González-Barreto Estadísticas Industriales Marzo 2010 164

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control

• Un proceso que su única causa de variabilidad es natural, se considera que

opera en control estadístico.

• Un proceso que opera en presencia de causas asignables de variabilidad

se dice está fuera de control estadístico.

• Mediante el uso de gráficos de control podemos identificar y distinguir entre

las causas de variabilidad intrínseca y externa del proceso.

David R. González-Barreto Estadísticas Industriales Marzo 2010 165

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control

# de muestra o sequencia (tiempo)

característica

de calidad LCS

LCI

LC

}

}

k w

k w

w

wwLCS

wLC

wwLCI

David R. González-Barreto Estadísticas Industriales Marzo 2010 166

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control

Realidad

En control

Fuera de

control

En control Decisión

correcta

Dec

isió

n

Fuera de

control

Decisión

correcta

David R. González-Barreto Estadísticas Industriales Marzo 2010 167

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control

• Selección de los límites de control

– Alejando los límites de la línea central se disminuye la

probabilidad de error tipo I pero se aumenta la probabilidad de

error tipo II.

– Aunque comúnmente se usan 3 w como límites, la selección de

estos puede depender de factores económicos. Si las pérdidas

asociadas con dejar el proceso operar en estado fuera de

control superan por mucho los costos de investigar y

posiblemente corregir las causas asignables, múltiples menores

de sigma (2.5 ó 2) serían apropiados.

David R. González-Barreto Estadísticas Industriales Marzo 2010 168

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control

• Tamaño de la muestra y frecuencia del muestreo

– Lo más deseable para poder detectar desplazamientos en elproceso sería tomar muestras grandes frecuentemente. Peroesto no es lo mejor desde el punto de vista económico. En laindustria se tiende a favorecer muestras pequeñas perofrecuentes, especialmente en procesos con un alto volumen deproducción.

– Además de las Curvas Características Operacionales (O. C.)otro criterio para determinar el tamaño de muestra y lafrecuencia del muestreo es el largo promedio de corrida (ARL)del gráfico de control.

David R. González-Barreto Estadísticas Industriales Marzo 2010 169

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control

• ARL = número promedio de puntos que serán graficados antes de

que un punto indique condición de fuera de control.

p = probabilidad de que un punto salga de los límites de control

p

1ARL

David R. González-Barreto Estadísticas Industriales Marzo 2010 170

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control

Límites de control ARL en Control

+ 3 sigmas 0.0027 370

+ 2 sigmas 0.045 22

+ 1 sigma 0.32 3

Cambio en promedio 1- ARL fuera de control

3 sigmas 0.5 0.5 2

2 sigmas 0.84 0.16 6.25

1 sigma 0.975 0.025 40

David R. González-Barreto Estadísticas Industriales Marzo 2010 171

Prin EDA DistEstim Hyp Cont Cap R&RMues

Fundamentos Gráficos de Control

LCS

LC

LCI/2

/2

David R. González-Barreto Estadísticas Industriales Marzo 2010 172

Prin EDA DistEstim Hyp Cont Cap R&RMues

Fundamentos Gráficos de Control

/2

/2LCS

LC

LCI

Orden de producción

Cara

cteríst

ica d

e c

alid

ad

1 -

David R. González-Barreto Estadísticas Industriales Marzo 2010 173

Prin EDA DistEstim Hyp Cont Cap R&RMues

Fundamentos Gráficos de Control

/2

/2LCS

LC

LCI

Orden de producción

Cara

cteríst

ica d

e c

alid

ad

1 -

12

3

David R. González-Barreto Estadísticas Industriales Marzo 2010 174

Prin EDA DistEstim Hyp Cont Cap R&RMues

Fundamentos Gráficos de Control

LCS

LC

LCI

Cambio en promedio

David R. González-Barreto Estadísticas Industriales Marzo 2010 175

Prin EDA DistEstim Hyp Cont Cap R&RMues

Fundamentos Gráficos de Control

LCS

LC

LCI

Cambio en dispersión

David R. González-Barreto Estadísticas Industriales Marzo 2010 176

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control

• Subgrupos racionales - Este concepto establece que las muestrasdeben ser seleccionadas de forma tal que si hay causas asignables, laposibilidad de diferencias entre muestras o subgrupos se maximicemientras que la posibilidad de diferencias debido a causas asignablesdentro de las muestras se minimice.

• Nota: Un ejemplo de un subgrupo racional inadecuado sería formar unamuestra (subgrupo) que tenga observaciones del final de un turno y elprincipio de otro. Esto haría difícil detectar una diferencia entre turnos.

David R. González-Barreto Estadísticas Industriales Marzo 2010 177

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control - Ejemplo

En la manufactura de pistones para motores de carro, una característica de calidadimportante es el diámetro del pistón. El proceso podría estar controlado con undiámetro promedio de 74 mm. La desviación estándar de los pistones es 0.1mm (n =5).

1. Construya una gráfica de control para x con:

límites a 3 3 w

límites a /2 = 0.001

2. ¿A 3 , cuál es la probabilidad de error tipo I?

3. ¿Para los límites 3 , cuál es el ARL?

4. ¿Cuánto será el ARL, si n = 5, el proceso se sale de control y ademásla media se desplaza de 74.000 a 74.134mm?

5. ¿Si n = 10, cuál sería el ARL?

David R. González-Barreto Estadísticas Industriales Marzo 2010 178

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control - Ejemplo

Solución:

w = 74mm, 045.05

1.0

nw

1 (a) LCS = w + k w 74 + 3(0.045) = 74.134

LC = w = 74.00

LCI = w - k w 74 - 3(0.045) = 73.866

David R. González-Barreto Estadísticas Industriales Marzo 2010 179

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control - Ejemplo

1 (b) LCS = w + /2 w 74 + 3.09(0.045) = 74.139

LC = w = 74.00

LCI = w - /2 w 74 – 3.09(0.045) = 73.861

David R. González-Barreto Estadísticas Industriales Marzo 2010 180

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control

# de muestra o sequencia (tiempo)

característica de calidad LCS

LCI

LC

}

}

k w

k w

w

LCS (1b) = 74.139

LCS (1a) = 74.134

LCS (1a) = 73.866

LCS (1b) = 73.861

LC = 74.0

David R. González-Barreto Estadísticas Industriales Marzo 2010 181

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control - Ejemplo

2. /2 = 3 (3) = 0.99865, 1 - = /2 = 0.00135

= 0.00135 (2) = 0.0027

3. Para obtener el ARL primero construiremos las curvas O.C. para

30027.0

2/Z

3700027.0

11

pARL

Es el largo promedio de la corrida del gráfico x

cuando el proceso está en

control estadístico. O sea que, aunque el proceso esté en control se verá una

falsa alarma de fuera de control cada 370 muestras.

David R. González-Barreto Estadísticas Industriales Marzo 2010 182

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control - Ejemplo

4. El desplazamiento coincide con el límite de control superior, por lo

tanto, la probabilidad de que x esté entre los límites de control es

0.50. De manera que, la probabilidad de que esté fuera es p = 1 –

0.50 = 0.50:

25.0

1ARL

Esto es que el gráfico de control requerirá en promedio dos muestras de

tamaño n = 5 para detectar el desplazamiento de :

134.74 a 00.74

10

En promedio, con dos muestras se podrá detectar el desplazamiento.

5. Se puede demostrar que la probabilidad de detectar el cambio cuando

el tamaño de muestra se incrementa a n = 10, es mayor que en el caso

anterior cuando n = 5. Por lo tanto, se espera un ARL < 2.

David R. González-Barreto Estadísticas Industriales Marzo 2010 183

Prin EDA DistEstim Hyp Cont Cap R&RMues

Base Estadística de los Gráficos

de Control para Variables

El promedio muestral de una característica de calidad normalmente

distribuida N ( , ) es:

n

xxxx n...21

nNx xx donde ,~

Existe una probabilidad 1 - de que el promedio muestra x caiga entre:

xz2

Por teorema de límite central asumimos normalidad en la distribución de x .

Cuando no sabemos y , los podemos estimar con muestras preliminares.

Al menos 20 muestras con n observaciones de la característica de calidad

medida. Entonces el estimado de , el promedio del proceso es:

m

xxxx m...21

David R. González-Barreto Estadísticas Industriales Marzo 2010 184

Prin EDA DistEstim Hyp Cont Cap R&RMues

Base Estadística de los Gráficos

de Control para Variables

Un estimador de la desviación estándar ( ) cuando n < 10 es: x

...

donde ˆ 21

2 m

RRRR

d

R m

minmax1 xxR

d2 = parámetro de la distribución de rango relativo (W = R/ )

Su valor depende de n.

Antes de tratar de controlar el promedio hay que controlar la variabilidad ya que, los límites

de control gráfico x dependen de la variabilidad del proceso.

David R. González-Barreto Estadísticas Industriales Marzo 2010 185

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control R

Se utiliza para controlar la variabilidad del proceso cuando n < 10.

Los límites de control para el gráfico R son:

4

2

33ˆ3 DRd

RdRRLCS R

RLC

3

2

33ˆ3 DRd

RdRRLCI R

D3 y D4 son valores tabulados.

David R. González-Barreto Estadísticas Industriales Marzo 2010 186

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráfico de Control X-Barra

Se usa para controlar el promedio del proceso.

Los límites de control son:

RAxRnd

xLCS 2

2

3

xLC

RAxRnd

xLCI 2

2

3

A2 es un valor en la tabla.

David R. González-Barreto Estadísticas Industriales Marzo 2010 187

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control S

Se utiliza para controlar la variabilidad del proceso cuando n 10.

Cuando es desconocida un estimador será:

1

2

12

n

xx

s

n

li

y los límites de control serán:

sBcc

ssLCS 4

2

4

4

13

sLC

3

2

4

4

13 Bcc

ssLCI

B4 y B3 son valores tabulados y m

l ism

s1

David R. González-Barreto Estadísticas Industriales Marzo 2010 188

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control S

Entonces los límites de control para el gráfico x son:

sAxnc

sxLCS 3

4

3

xLC

sAxnc

sxLCI 3

4

3

David R. González-Barreto Estadísticas Industriales Marzo 2010 189

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control - Ejemplo

Se desea establecer control estadístico para el ancho de tabletas. Se toman

25 muestras de 5 observaciones cada una.

Muestra X1 X2 X3 X4 X5

x R

1 20 22 21 23 22 21.6 3

2 19 18 22 20 20 19.8 4

3 25 18 20 17 22 20.4 8

4 20 21 22 21 21 21 2

5 19 24 23 22 20 21.6 5

6 22 20 18 18 19 19.4 4

7 18 20 19 18 20 19 2

8 20 18 23 20 21 20.4 5

9 21 20 24 23 22 22 4

10 21 19 20 20 20 20 2

11 20 20 23 22 20 21 3

12 22 21 20 22 23 21.6 3

13 19 22 19 18 19 19.4 4

14 20 21 22 21 22 21.2 2

15 20 24 24 23 23 22.8 4

*En la tabla se presentan las primeras quince muestras

David R. González-Barreto Estadísticas Industriales Marzo 2010 190

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control - Ejemplo

X-bar Chart for Ancho

Subgroup

X-b

ar

Centerline = 20.84

UCL = 22.85

LCL = 18.83

0 5 10 15 20 25

18

19

20

21

22

23

Range Chart for Ancho

0 5 10 15 20 25

Subgroup

0

2

4

6

8

Ran

ge

Centerline = 3.48

UCL = 7.36

LCL = 0.00

Luego de eliminar la muestra 3 y

recalcular los límites del gráfico R, nos

percatamos de que las muestras 22 y

23 del gráfico están fuera de los límites

de control. Una vez conseguimos las

causas asignables de estos, los

eliminamos y recalculamos los límites

de control del gráfico.

David R. González-Barreto Estadísticas Industriales Marzo 2010 191

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control - Ejemplo

X-bar Chart for Ancho

Subgroup

X-b

ar

Centerline = 20.86

UCL = 22.76

LCL = 18.96

0 5 10 15 20 25

18

19

20

21

22

23

Range Chart for Ancho

Subgroup

Ran

ge

Centerline = 3.29

UCL = 6.96

LCL = 0.00

0 5 10 15 20 25

0

2

4

6

8

x

Al graficarse los restantes puntos

dentro de los límites recalculados,

notará que el punto número 15 está

todavía fuera de control en el gráfico

del promedio.

Por esta razón necesitaríamos

recalcular nuestros límites

nuevamente. Una vez todos los

puntos se encuentren dentro de los

límites de control y no muestren

ningún patrón sistemático,

asumiremos los límites recién

calculados como los límites de control

del proceso.

De este momento en adelante

trazaremos los puntos del proceso en

tiempo real haciendo uso de los

límites estimados. De encontrar

alguna señal de que el proceso se

encuentra fuera de control hay que

investigar la causa.

David R. González-Barreto Estadísticas Industriales Marzo 2010 192

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control - Ejemplo

*En la tabla se presentan las primeras quince muestras

Ilustración de los gráficos de control x y S usando 25 muestras pero de

tamaño variable.

Muestra X1 X2 X3 X4 X5 x S

1 74.030 74.002 74.019 73.992 74.008 74.010 0.0148

2 73.995 73.992 74.001 73.996 0.0046

3 73.988 74.024 74.021 74.005 74.002 74.008 0.0106

4 74.002 73.996 73.993 74.015 74.009 74.003 0.0091

5 73.992 74.007 74.015 73.989 74.014 74.003 0.0122

6 74.009 73.994 73.997 73.985 73.996 0.0099

7 73.995 74.006 73.994 74.000 73.999 0.0055

8 73.985 74.003 73.993 74.015 73.988 73.997 0.0123

9 74.008 73.995 74.009 74.005 74.004 0.0064

10 73.998 74.000 73.990 74.007 73.995 73.998 0.0063

11 73.994 73.998 73.994 73.995 73.990 73.994 0.0029

12 74.004 74.000 74.007 74.000 73.996 74.001 0.0042

13 73.983 74.002 73.998 73.994 0.0100

14 74.006 73.967 73.994 74.000 73.984 73.990 0.0153

15 74.012 74.014 73.998 74.008 0.0087

David R. González-Barreto Estadísticas Industriales Marzo 2010 193

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control - Ejemplo

X-bar Chart for Ancho

Subgroup

X-b

ar

Centerline = 74.00

UCL = 74.01

LCL = 73.99

0 5 10 15 20 25

73.98

73.99

74

74.01

74.02

Range Chart for Ancho

Subgroup

Ran

ge

Centerline = 0.02

UCL = 0.05

LCL = 0.00

0 5 10 15 20 25

0

0.01

0.02

0.03

0.04

0.05

David R. González-Barreto Estadísticas Industriales Marzo 2010 194

Prin EDA DistEstim Hyp Cont Cap R&RMues

Curva O.C.

La probabilidad de error tipo II para el gráfico de control x está dada por:

kUCLxLCLP 01\

Dado que n

Nx2

,~ y sus límites de control son:

nUCL 30

nLCL 30

n

kLCL

n

kUCL 00

n

kn

n

kn0000 33

nknk 33

David R. González-Barreto Estadísticas Industriales Marzo 2010 195

Prin EDA DistEstim Hyp Cont Cap R&RMues

Curva O.C. - Ejemplo

• Si n = 5 y se quiere saber la probabilidad de

detectar un desplazamiento de 1 = 0 + 2

en la primera muestra después del

desplazamiento.

• la probabilidad de detectar el

desplazamiento:

• La curva característica operacional para

varios tamaños de muestras (n) se presenta

a continuación.

Plot

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

0 .5 1 1.5 2 2.5 3 3.5

k

oc_n=1

oc_n=5

oc_n=7

oc_n=8

oc_n=10

oc_n=15

0708.037.747.152353

9292.00708.011

David R. González-Barreto Estadísticas Industriales Marzo 2010 196

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control para

Medidas Individuales• Existen muchas situaciones donde el tamaño de muestra para monitorear el proceso es 1

(n = 1). Algunos ejemplos de estas situaciones se describen a continuación:

– La inspección es automatizada permitiendo que cada unidad

manufacturada sea analizada.

– La razón de producción es muy lenta, haciendo prácticamente imposible o

indeseable que tamaños de muestras mayores de 1 (n > 1), puedan

acumularse para ser analizadas.

– En algunos procesos, como por ejemplo, la fabricación de papel, se toman

medidas en múltiples localizaciones a través del rollo. Por ejemplo,

podemos tomar medidas del espesor del rollo, esto produciría una

desviación estándar que es muy pequeña si el objetivo es el de controlar el

espesor del rollo a lo largo del mismo.

David R. González-Barreto Estadísticas Industriales Marzo 2010 197

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control para

Medidas Individuales

El gráfico de medidas individuales usa el rango movible de dos

observaciones consecutivas para estimar la variabilidad del proceso. El

rango movible se define como: 1iii xxMR .

Los parámetros para el gráfico de control de medidas individuales son:

2

3d

MRxLCS

Línea central = x

2

3d

MRxLCS

David R. González-Barreto Estadísticas Industriales Marzo 2010 198

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control para

Medidas Individuales - Ejemplo

La viscosidad de un primer de pintura es una importante característica de

calidad. El producto se produce en lotes y como producir cada lote toma

varias horas, el tiempo de producción es muy lento para permitir que se

haga más de una muestra.

Lote Viscosidad

x

Rango Movible

MR

1 33.75

2 33.05 0.70

3 34.00 0.95

4 33.81 0.19

5 33.46 0.35

6 34.02 0.56

7 33.68 0.34

8 33.27 0.41

9 33.49 0.22

10 33.20 0.29

11 33.62 0.42

12 33.00 0.62

13 33.54 0.54

14 33.12 0.42

15 33.84 0.72

52.33x 48.0MR

David R. González-Barreto Estadísticas Industriales Marzo 2010 199

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control para

Medidas Individuales - Ejemplo

X Chart for Viscocidad

0 3 6 9 12 15

Observation

32

32.5

33

33.5

34

34.5

35

X

Centerline = 33.52

UCL = 34.80

LCL = 32.24

MR(2) Chart for Viscocidad

0 3 6 9 12 15

Observation

0

0.4

0.8

1.2

1.6

MR

(2)

Centerline = 0.48

UCL = 1.57

LCL = 0.00

David R. González-Barreto Estadísticas Industriales Marzo 2010 200

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control para

Medidas Individuales - Ejemplo

En la siguiente tabla se muestran 15 lotes adicionales para el ejemplo de la

viscosidad de la pintura.

Lote Viscosidad

x

Rango Movible

MR

16 33.50 0.34

17 33.25 0.25

18 33.40 0.15

19 33.27 0.13

20 34.65 1.38

21 34.80 0.15

22 34.55 0.25

23 35.00 0.45

24 34.75 0.25

25 34.50 0.25

26 34.70 0.20

27 34.29 0.41

28 34.61 0.32

29 34.49 0.12

30 35.03 0.54

David R. González-Barreto Estadísticas Industriales Marzo 2010 201

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control para

Medidas Individuales - Ejemplo

X Chart for Viscocidad1

0 5 10 15 20 25 30

Observation

32

33

34

35

36

X

Centerline = 33.92

UCL = 35.01

LCL = 32.83

MR(2) Chart for Viscocidad1

0 5 10 15 20 25 30

Observation

0

0.3

0.6

0.9

1.2

1.5

MR

(2)

Centerline = 0.41

UCL = 1.34

LCL = 0.00

David R. González-Barreto Estadísticas Industriales Marzo 2010 202

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control para

Medidas Individuales - Ejemplo• Algunos analistas recomiendan no construir el gráfico de los rangos

movibles. Ellos señalan que estos no muestran realmente cambios en la

variabilidad del proceso. Más bien muestran cambios en el promedio del

proceso. Esto se muestra claramente en las figuras anteriores donde

cambios en el promedio alrededor del lote #20 se perciben en ambos

gráficos, en el de medidas individuales y en el de los rangos movibles.• Nota: En estos gráficos, de medidas individuales, hemos hecho la presunción de que las observaciones

provienen de una distribución normal. Esta presunción es crítica para este gráfico. Si mediante cualquier prueba

encontramos evidencia de que esta presunción no se cumple, tendríamos que determinar los límites de control

para las medidas individuales basándonos en las percentilas de la distribución apropiada. En este caso, utilizar

las fórmulas discutidas para calcular los límites sería incorrecto.

David R. González-Barreto Estadísticas Industriales Marzo 2010 203

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráfico de Control EWMA

El gráfico de control EWMA es una buena alternativa a los gráficos

tradicionales Shewhart, cuando nos interesa detectar desplazamientos muy

pequeños en el proceso. Este gráfico se utiliza típicamente con

observaciones individuales pero como veremos es posible crear subgrupos

cuyo tamaño de muestra n > 1. La estadística EWMA se define como:

donde 0 < < 1 es una constante y el valor inicial necesario para la primera

muestra se define como el valor deseado

z0 = 0

1)1( iii zxz

David R. González-Barreto Estadísticas Industriales Marzo 2010 204

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráfico de Control EWMA

Otra alternativa usada para el valor inicial es xz0

.

La siguiente ecuación muestra que la estadística EWMA a la que llamamos

z, es un promedio pesado de los promedios muestrales previos:

22

1

21

)1()1(

)1()1(

iiii

iiii

zxxz

zxxz

Por ejemplo, si = 0.2 entonces los pesos asignados a las observaciones

previas serán 0.16, 0.128, 0.1024,…. Mientras que el peso asignado a la

observación actual será de 0.2. Debido a que estos pesos declinan de forma

geométrica algunas personas conocen este gráfico como el de promedio

geométrico movible.

David R. González-Barreto Estadísticas Industriales Marzo 2010 205

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráfico de Control EWMA

Si las observaciones individuales xi son independientes con varianza 2 los

límites del gráfico EWMA estarán dados por:

i

i

kLCI

LC

kLCS

2

0

0

2

0

)1(1)2(

)1(1)2(

David R. González-Barreto Estadísticas Industriales Marzo 2010 206

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráfico de Control EWMA

En estas ecuaciones K sirve para determinar el ancho de los límites que se

desea, mientras que i representa la muestra bajo consideración. Como estos

límites dependen de la muestra bajo consideración los mismos no son

constantes como veremos en el ejemplo que se presenta a continuación. Sin

embargo a medida que i aumenta los límites tienden a estabilizarse de la

siguiente manera:

)2(

)2(

0

0

0

kLCI

LC

kLCS

No obstante la mayoría de los autores recomiendan utilizar la definición

original para mantener los límites exactos en los valores pequeños de i.

David R. González-Barreto Estadísticas Industriales Marzo 2010 207

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráfico de Control EWMA

Ejemplo

Los siguientes son datos para el peso de partículas tomadas en un

laboratorio. Se presume = 0.10 y k = 2.7

Muestra Observación

1 9.45

2 7.99

3 9.29

4 11.66

5 12.16

6 10.18

7 8.04

8 11.46

9 9.2

10 10.34

11 9.03

12 11.47

13 10.51

14 9.4

15 10.08

*En esta tabla se presentan las primeras quince observaciones.

David R. González-Barreto Estadísticas Industriales Marzo 2010 208

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráfico de Control EWMA

Ejemplo

EWMA Chart for Peso

0 5 10 15 20 25 30

Observation

8.8

9.2

9.6

10

10.4

10.8

11.2

EW

MA

Centerline = 10.02

UCL = 11.14

LCL = 8.89

David R. González-Barreto Estadísticas Industriales Marzo 2010 209

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráfico de Control EWMA

• Como dijimos anteriormente, estos gráficos son muy efectivos detectando

cambios pequeños en el proceso. El diseño de los mismos envuelve

determinar la constante K así como la constante . Estudios han

determinado que valores de en el intervalo 0.05 < < 0.25 trabajan muy

bien en la práctica. Los valores = 0.05, = 0.10 y = 0.20 son los más

frecuentemente utilizados. Una práctica adecuada es seleccionar valores

pequeños de para detectar cambios más pequeños. También se ha

encontrado que k = 3 trabaja bastante bien en la práctica especialmente

para valores grandes de . Sin embargo, cuando < 0.10 los estudios han

encontrado que k debe considerarse dentro del siguiente intervalo 2.6 < k <

2.8.

David R. González-Barreto Estadísticas Industriales Marzo 2010 210

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráfico de Control EWMA

• Un detalle que es importante señalar es que el gráfico tradicional Shewhartreacciona más rápido que el EWMA para desplazamientos grandes. Por loque algunos autores han sugerido un esquema de control que incluyaambos gráficos simultáneamente.

EWMA con n > 1

• Por lo general el gráfico EWMA se utiliza con observaciones individuales.Sin embargo, si los subgrupos racionales consisten de más de unaobservación, n > 1, entonces todo lo que necesitamos hacer es reemplazarxi por y por en las ecuaciones previamente discutidas.

nix

David R. González-Barreto Estadísticas Industriales Marzo 2010 211

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control por Atributos

• Cuando los datos son de tipo discreto, los gráficos de control están

asociados con modelos de distribuciones discretas. Los gráficos más

conocidos para esta clasificación de datos lo son: el gráfico p, para la

fracción de defectuosos, y el gráfico c, para el control de defectos.

• Los modelos asociados con cada uno de estos son el binomial y el Poisson,

respectivamente.

David R. González-Barreto Estadísticas Industriales Marzo 2010 212

Prin EDA DistEstim Hyp Cont Cap R&RMues

Gráficos de Control por Atributos

• Los límites de control estándar para ambos gráficos se muestran a

continuación:

• Para el gráfico p , donde p-barra es

la fracción de defectuosos promedio

• Para el gráfico c , donde c-barra es el

promedio de defectos.

n

ppp

)1(3

cc 3

David R. González-Barreto Estadísticas Industriales Marzo 2010 213

Prin EDA DistEstim Hyp Cont Cap R&RMues

Plan de Control

Product:

Line:

Voice of the CustomerVoice of the

Process

Lower

Spec

Limit

Target

Upper

Spec

Limit

units Data TypeSample

Frequency

Instrument

Used

Gage

Capability

Process Cpk or

PPM

Monitoring

System

Response

Plan

Cri

tica

l

Process Steps

[Area name here] Control PlanPrioritization Method Used:

(e.g. FMEA, Business Matrix, etc.)

Reference Documents

No. and Revision:

Product

Characteristic

Measurement System Control ToolsMeasurement

David R. González-Barreto Estadísticas Industriales Marzo 2010 214

Prin EDA DistEstim Hyp Cont Cap R&RMues

Análisis de Capacidad

• Capacidad - La habilidad de un proceso para producir productos dentro

de las especificaciones establecidas. Un proceso se dice que es capaz

cuando la gran mayoría del producto confeccionado por el mismo está

dentro de las especificaciones.

• Indices de la capacidad del proceso - Miden la capacidad de un

proceso.

David R. González-Barreto Estadísticas Industriales Marzo 2010 215

Prin EDA DistEstim Hyp Cont Cap R&RMues

Variabilidad

– La voz del proceso – se representa por la variabilidad

observada en el proceso. El proceso nos dice „lo que

puede lograr‟.

– La voz del cliente – está representada por las

especificaciones del producto. El cliente nos dice „lo

que desea obtener‟.

– La capacidad del proceso nos indica si la voz del

proceso podrá complacer la voz del cliente.

David R. González-Barreto Estadísticas Industriales Marzo 2010 216

Prin EDA DistEstim Hyp Cont Cap R&RMues

Variabilidad

Esp.

Inf.

Esp.

Sup.

Proceso Controlado usando

la filosofía de estar lo más

cercano al valor nominal.

Proceso Controlado usando

la filosofía de cualquier

valor dentro de las

especificaciones es

aceptable.

David R. González-Barreto Estadísticas Industriales Marzo 2010 217

Prin EDA DistEstim Hyp Cont Cap R&RMues

Esp.

Inf.

Esp.

Sup.

Esp.

Inf.

Esp.

Sup.

Variabilidad

Menor Variabilidad Provee

- Un proceso predecible

- Mejora habilidad de detectar cambios

- Menos pérdida, retrabajo, menor costo

- Productos y servicios que ejecutan mejor

El objetivo principal del esfuerzo de C4I es reducir la varianza del proceso

Reducción de

Varianza

Proceso proporciona

unidades fuera de

especificaciones

Proceso proporciona

unidades dentro de

especificaciones

David R. González-Barreto Estadísticas Industriales Marzo 2010 218

Prin EDA DistEstim Hyp Cont Cap R&RMues

Variabilidad

• Visión Tradicional

– Cualquier valor dentro de las

especificaciones es satisfactorio.

• Visión Moderna

– En cualquier momento en que

una característica se desvía del

valor nominal (target) existe una

pérdida. A mayor desviación,

mayor será la pérdida.

Esp.

Inf.

Esp.

Sup.

Pérdida Pérdida

Esp.

Inf.

Esp.

Sup.

Valor Nominal

Esp.

Inf.

Esp.

Sup.

Pérdida Pérdida

Pérdida

Valor Nominal

David R. González-Barreto Estadísticas Industriales Marzo 2010 219

Prin EDA DistEstim Hyp Cont Cap R&RMues

Análisis de Capacidad

Process-Capability Ratio (Cp index)

6

LEILESC

P

Si es desconocida puede ser estimada por S , en cuyo caso:

S

LEILESC

P 6

LES = “límite de especificación superior”

LEI = “límite de especificación inferior”

David R. González-Barreto Estadísticas Industriales Marzo 2010 220

Prin EDA DistEstim Hyp Cont Cap R&RMues

Análisis de Capacidad

• Cp - razón de la variabilidad del proceso (6 sigma) al ancho permitido por

las especificaciones del producto (LES - LEI).

• Debido a que el índice Cp solo considera la variabilidad del proceso, sin

incluir la medida de tendencia central o promedio, a este índice se le

conoce como la capacidad potencial del proceso.

David R. González-Barreto Estadísticas Industriales Marzo 2010 221

Prin EDA DistEstim Hyp Cont Cap R&RMues

Análisis de Capacidad

Ancho del proceso

Especificaciones del producto

LEI Nominal LES

David R. González-Barreto Estadísticas Industriales Marzo 2010 222

Prin EDA DistEstim Hyp Cont Cap R&RMues

Análisis de Capacidad

Para especificaciones de un solo lado:

3

3

LEIC

LESC

LP

uP

CPu y CPL se obtienen cuando estimamos y .

David R. González-Barreto Estadísticas Industriales Marzo 2010 223

Prin EDA DistEstim Hyp Cont Cap R&RMues

Análisis de Capacidad

• El Cp

no toma en consideración la localización del proceso con relación a

los límites de especificación. Asume que está centralizado. La localización

del proceso con relación a los límites de especificación la da el:

CPk = PCRk = min (CPu y CPL)

• Cpk es la razón de la mitad del ancho del proceso (3 sigma) al

ancho de las especificaciones del producto.

David R. González-Barreto Estadísticas Industriales Marzo 2010 224

Prin EDA DistEstim Hyp Cont Cap R&RMues

Análisis de Capacidad

LEI LESCp = 1

David R. González-Barreto Estadísticas Industriales Marzo 2010 225

Prin EDA DistEstim Hyp Cont Cap R&RMues

Análisis de Capacidad

LEI LESCp = 1

David R. González-Barreto Estadísticas Industriales Marzo 2010 226

Prin EDA DistEstim Hyp Cont Cap R&RMues

Análisis de Capacidad

LEI LESCpk = 1

David R. González-Barreto Estadísticas Industriales Marzo 2010 227

Prin EDA DistEstim Hyp Cont Cap R&RMues

Análisis de Capacidad

LEI LESCpk = 1

David R. González-Barreto Estadísticas Industriales Marzo 2010 228

Prin EDA DistEstim Hyp Cont Cap R&RMues

Análisis de Capacidad

LEI LESCpk = 2

David R. González-Barreto Estadísticas Industriales Marzo 2010 229

Prin EDA DistEstim Hyp Cont Cap R&RMues

Análisis de Capacidad

Efecto de la no normalidad

LESLEI

LEI LES

David R. González-Barreto Estadísticas Industriales Marzo 2010 230

Prin EDA DistEstim Hyp Cont Cap R&RMues

Análisis de Capacidad

¿Será el proceso capaz?

• Cp:

– Calcule la desviación estándar,

– Calcule Cp:

6

LEILESCp

Si Cp < 1.0, el proceso no tiene la capacidad potencial

Si 1.0 < Cp < 1.33, el proceso es justamente capaz

Si Cp > 1.33, el proceso es potencialmente capaz

David R. González-Barreto Estadísticas Industriales Marzo 2010 231

Prin EDA DistEstim Hyp Cont Cap R&RMues

Análisis de Capacidad

¿Será el proceso capaz?

• Cpk:

– Calcule el promedio y la desviación estándar,

– Calcule Cpk:

3

)(),(min LEIxxLESCpk

Si Cp < 1.0, el proceso no es capaz

Si 1.0 < Cp < 1.33, el proceso es justamente capaz

Si Cp > 1.33, el proceso es capaz

x

David R. González-Barreto Estadísticas Industriales Marzo 2010 232

Prin EDA DistEstim Hyp Cont Cap R&RMues

Análisis de Capacidad

¿Será el proceso capaz?

• Cpm:

– Calcule el promedio y la desviación estándar,

– Calcule Cpm:

22 )(6 Tx

LEILESCpm

x

A mayor Cpm mejor el proceso

David R. González-Barreto Estadísticas Industriales Marzo 2010 233

Prin EDA DistEstim Hyp Cont Cap R&RMues

Análisis de Capacidad

Cpk, Rendimiento y “PPM’s” para un proceso centralizado

Cpk Rendimiento* “Defective per million (ppm)*”

0.3 63.188% 368,120

0.4 76.986% 230,139

0.5 86.639% 133,614

0.6 92.814% 71,861

0.7 96.427% 35,729

0.8 98.360% 16,395

0.9 99.307% 6,934

1.0 99.730% 2,700

1.1 99.903% 967

1.2 99.968% 318

1.3 99.990% 96

1.4 99.997% 27

1.5 99.999% 6.8

1.6 >99.999% 1.6

1.7 >99.999% 0.34

1.8 >99.999% 0.07

1.9 >>99.999% 0.01

2.0 >>>99.999% 0.002

2.1 >>>>99.999% 0.0003

2.2 >>>>>99.999% 0.0000

*Presume un proceso centralizado

David R. González-Barreto Estadísticas Industriales Marzo 2010 234

Prin EDA DistEstim Hyp Cont Cap R&RMues

Análisis de Capacidad

El intervalo de confianza de Cp con un (1- )100% de confiabilidad es:

1616

1,2

2

1,2

n

x

s

LEILESC

n

x

s

LEILES n

p

n

El intervalo de confianza de Cpk con un (1- )100% de confiabilidad es:

12

1

ˆ9

11ˆ

12

1

ˆ9

11ˆ

22/22/nCn

ZCCnCn

ZCpk

pkpk

pk

pk

David R. González-Barreto Estadísticas Industriales Marzo 2010 235

Prin EDA DistEstim Hyp Cont Cap R&RMues

Repetibilidad y Reproducibilidad

(R & R)• En cualquier proceso que envuelva medidas, es altamente probable

que la variabilidad observada sea resultado no sólo del producto, pero también del instrumento de medir y la persona que lo mida.

• Repetibilidad - está asociada con la precisión inherente del instrumento de medir.

• Reproducibilidad - está asociada con la precisión de varios operadores midiendo las piezas con un mismo instrumento de medir.

David R. González-Barreto Estadísticas Industriales Marzo 2010 236

Prin EDA DistEstim Hyp Cont Cap R&RMues

R & R

componente de la

variabilidad total

causado por error de

medición

componente de la

variabilidad total

inherenteal producto

222

mediciónproductototal

222

ilidadreproducibdadrepetibilimedicion

David R. González-Barreto Estadísticas Industriales Marzo 2010 237

Prin EDA DistEstim Hyp Cont Cap R&RMues

R & R - Ejemplo

Operador A Operador B Operador C

Pieza Medidas Medidas Medidas

# 1 2 1 2 1 2

1 21 20 20 20 19 21

2 24 23 24 24 23 24

3 20 21 19 21 20 22

4 27 27 28 26 27 28

5 19 18 19 18 18 21 6 23 21 24 21 23 22

7 22 21 22 24 22 20

8 19 17 18 20 19 18

9 24 23 25 23 24 24

10 25 23 26 25 24 25

11 21 20 20 20 21 20

12 18 19 17 19 18 19

13 23 25 25 25 25 25

14 24 24 23 25 24 25

15 29 30 30 28 31 30

16 26 26 25 26 25 27 17 20 20 19 20 20 20

18 19 21 19 19 21 23

19 25 26 25 24 25 25

20 19 19 18 17 19 17

David R. González-Barreto Estadísticas Industriales Marzo 2010 238

Prin EDA DistEstim Hyp Cont Cap R&RMues

R & R - Ejemplo

ANOVA Table

Source Sum of Squares Df Mean Square F-Ratio P-Value

--------------------------------------------------------------------------------

Operators 2.21667 2 1.10833

Parts 1202.5 19 63.2895

Operators*Parts 33.45 38 0.880263 0.79 0.7815

Residual 67.0 60 1.11667

--------------------------------------------------------------------------------

Total 1305.17 119

ANOVA Table

Source Sum of Squares Df Mean Square

----------------------------------------------------------

Operators 2.21667 2 1.10833

Parts 1202.5 19 63.2895

Residual 100.45 98 1.025

----------------------------------------------------------

Total 1305.17 119

David R. González-Barreto Estadísticas Industriales Marzo 2010 239

Prin EDA DistEstim Hyp Cont Cap R&RMues

R & R - Ejemplo

Gage Report

3 operators 20 parts 2 trials

Measurement Unit Analysis and Study Variation

----------------------------------------------------------------------

5.15 Percent Study Percent

Std. dev. Variation Contribution

Repeatability 5.21398 29.72 8.84

Reproducibility 0.85726 4.89 0.24

R & R 5.28398 30.12 9.07

Part-to-Part 16.7262 95.35 90.93

95.0 Confidence Intervals

----------------------------------------------------------------------

Lower 5.15 Upper

Limit Std. dev. Limit

Repeatability 4.57508 5.21398 6.06192

Reproducibility 0.0 0.85726 5.3235

R & R 5.1677 5.28398 5.16218

Part-to-Part 12.0411 16.7262 24.8213

David R. González-Barreto Estadísticas Industriales Marzo 2010 240

Prin EDA DistEstim Hyp Cont Cap R&RMues

R & R – Ejemplo