17
Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico METODOLOGÍA DE ANÁLISIS SERIES DE TIEMPO ESTADÍSTICA INFERENCIAL o Pruebas de hipótesis o Análisis de varianza o Tablas de contingencia CONTROL ESTADÍSTICO DE PROCESOS Página 1

Pronosticos y Control de Producción en Minitab

Embed Size (px)

DESCRIPTION

Minitab

Citation preview

Page 1: Pronosticos y Control de Producción en Minitab

Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

METODOLOGÍA DE ANÁLISIS

SERIES DE TIEMPO

ESTADÍSTICA INFERENCIAL

o Pruebas de hipótesis

o Análisis de varianza

o Tablas de contingencia

CONTROL ESTADÍSTICO DE PROCESOS

Página 1

Page 2: Pronosticos y Control de Producción en Minitab

Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

METODOLOGÍA DE SERIES DE TIEMPO

1. INTRODUCCIÓN

Definición de serie de tiempo: Es una secuencia ordenada de valores de una variable en intervalos de tiempo periódicos y consecutivos.

Aplicación: la aplicación de estos métodos tiene dos propósitos: comprender las fuerzas de influencia en los datos y descubrir la estructura que produjo los datos observados. Ajustar el modelo y proceder a realizar pronósticos, monitoreo, retroalimentación y control en avance.

2. TENDENCIA Y ESTACIONALIDAD

Tendencias: Si los datos muestran una tendencia, se pueden ajustar los datos con algún tipo de curva o recta.

Por ejemplo:

Year

Clav

e 2

2009200820072006200520042003

5500

5000

4500

4000

3500

3000

Accuracy MeasuresMAPE 3.9MAD 164.9MSD 36852.8

VariableActualFits

Causar o provocar escandalo en lugares publicos o privadosQuadratic Trend Model

Yt = 6166.86 - 873.060*t + 69.4405*t**2

Estacionalidad: son fluctuaciones periódicas, por ejemplo cuando hay picos de faltas en vacaciones y después declinan.

Página 2

Page 3: Pronosticos y Control de Producción en Minitab

Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

FALT

AS A

DMIN

ISTR

YearMonth

20052004EneNovSepJulMayMarEne

1800

1700

1600

1500

1400

1300

1200

1100

Accuracy MeasuresMAPE 8.3MAD 115.1MSD 20328.9

VariableActualFits

FALTAS ADMINISTRATIVASLinear Trend Model

Yt = 1411.87 - 0.782418*t

En la gráfica anterior se observa un comportamiento mensual, con un máximo en Julio y un mínimo en Noviembre.

3. INDICADORES DE MODELOS DE SERIES DE TIEMPO

Estos indicadores sirven para comparar la efectividad de diferentes modelos utilizados. Siempre se busca el valor menor en los indicadores MAPE, MAD y MSD ya que representa un mejor ajuste del modelo, se definen como sigue:

MAPE: Porcentaje promedio absoluto de error.MAD: Desviación media absoluta. MSD: Desviación cuadrática media, es más sensible a errores anormales.

Página 3

Page 4: Pronosticos y Control de Producción en Minitab

Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

4. MÉTODOS DE PRONÓSTICO

Los métodos de series de tiempo incluyen métodos de pronóstico y de suavizamiento simples, métodos de análisis de correlación y métodos de Box Jenkins ARIMA.

4.1 MÉTODOS DE PRONÓSTICO Y SUAVIZAMIENTO SIMPLE:

Modelan componentes en una serie que normalmente son fáciles de ver en una serie de tiempo.

Cuando hay un patrón curvilíneo de los datos, se usa un análisis de tendencias con un modelo cuadrático.

Las instrucciones de Minitab son las siguientes:

1 Open Worksheet FALTASADM.MTW.2 Ejecutar Stat > Time Series > Trend Analysis.3 En Variable, poner Clave 1.4 En Model Type, seleccionar Quadratic.5 Seleccionar Generate forecasts y poner 12 en Number of forecasts.6 Seleccionar Storage .7 Seleccionar Fits (Trend Line) , Residuals (detrended data), y Forecasts. Seleccionar OK en cada diálogo.

Trend Analysis for TradeYt = 8721.43 - 2337.40*t + 191.024*t**2Accuracy MeasuresMAPE 12MAD 340MSD 142893ForecastsPeriod Forecast2011 2247.71

Year

Clav

e 1

20112010200920082007200620052004

7000

6000

5000

4000

3000

2000

1000

Accuracy MeasuresMAPE 12MAD 340MSD 142893

Variable

Forecasts

ActualFits

Deambular en la via publica en estado de embriaguez o drogadoQuadratic Trend Model

Yt = 8721.43 - 2337.40*t + 191.024*t**2

Página 4

Page 5: Pronosticos y Control de Producción en Minitab

Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

Método de Descomposición

Se usa para pronosticar cuando hay un componente de estacionalidad en la serie de tiempo o si se quiere analizar la naturaleza de los componentes. Separa las series de tiempo en componentes de tendencia lineal y estacionalidad así como el error. Se puede usar componente de estacionalidad en modo aditivo o multiplicativo con la tendencia.

Por ejemplo:

Se desea predecir la tasa de faltas administrativas durante 2006 a 2009. Como los datos tienen una tendencia que se ajusta bien con un modelo de tendencia cuadrática y tiene un componente estacional se utilizan los residuos del ejemplo del análisis de tendencias para combinar el análisis de tendencias y descomposición para pronosticar.

Las intrucciones de Minitab son las siguientes:

1 Correr el ejemplo de Análisis de Tendencias con el archivo DELITOS.MTW2 Stat > Time Series > Decomposition.3 En Variable indicar FALTAS ADM4 En Seasonal length, poner 12.5 EnModel Type, seleccionar Additive. En Model Components, seleccionar Seasonal only.6 Seleccionar Generate forecasts y poner 1 en Number of forecasts.7 Seleccionar Storage . Seleccionar Forecasts y Fits.8 Seleccionar OK en cada cuadro de diálogo

Fitted Trend EquationYt = 1453.46 + 0.791168*tAccuracy MeasuresMAPE 2.12MAD 30.87MSD 5551.93

FALT

AS A

DM

YearMonth

200920082007200620052004EneEneEneEneEneEne

1900

1800

1700

1600

1500

1400

1300

1200

1100

Accuracy MeasuresMAPE 2.12MAD 30.87MSD 5551.93

Variable

Trend

ActualFits

FALTAS ADMINISTRATIVASMultiplicative Model

Página 5

Page 6: Pronosticos y Control de Producción en Minitab

Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

121110987654321

1.2

1.0

0.8

121110987654321

20

10

0

121110987654321

1.2

1.0

0.8

121110987654321

200

0

-200

-400

Seasonal Analysis for FALTAS ADMMultiplicative Model

Seasonal Indices

Percent Variation, by Seasonal Period

Detrended Data, by Seasonal Period

Residuals, by Seasonal Period

Página 6

Page 7: Pronosticos y Control de Producción en Minitab

Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

Interpretación de los resultados

La descomposición genera tres tipos de gráficas:

1. Una gráfica de serie de tiempo mostrando los datos originales con la línea de tendencia ajustada, valores estimados y pronósticos

2. Un análisis de componentes con gráficas separadas para la serie, datos sin tendencia, datos ajustados con estacionalidad y los datos ajustados estacionalmente y sin tendencias (los residuos).

3. Un análisis estacional, mostrando los índices estacionales y la variación porcentual dentro de cada estación respecto a la suma de la variación por estación y gráficas de caja de los residuos por periodo estacional.

METODO DE WINTERS

Se aplica cuando en la serie de tiempo se presentan los patrones de tendencia y estacionalidad.

Suaviza los datos por el método exponencial de Holt – Winters. Se recomienda este método cuando se tienen presentes los componentes de tendencia y estacionalidad ya sea en forma aditiva o multiplicativa.

El efecto multiplicativo se presenta cuando el patrón estacional en los datos depende del tamaño de los datos o sea cuando la magnitud del patrón estacional se incrementa conforme los valores aumentan y se decrementa cuando los valores de los datos disminuyen.

El efecto aditivo es mejor cuando el patrón estacional en los datos no depende del valor de los datos, o sea que el patrón estacional no cambia conforme la serie se incrementa o disminuye de valor.

El método de Winters calcula los estimados de de tres componentes: nivel, tendencia y estacionalidad. Calcula estimados dinámicos con ecuaciones para los tres componentes: nivel, tendencia y estacionalidad. Estas ecuaciones dan una mayor ponderación a observaciones recientes y menos peso a observaciones pasadas, las ponderaciones decrecen geométricamente a una tasa constante

La ponderación seleccionada para Nivel, tendencia y estacionalidad es de 0.2 si se quiere hacer una correspondencia con el modelo ARIMA u otros valores entre 0 y 1 para reducir los errores de estimación.

Ejemplo de pronósticos utilizando el Método de Winters

Se desea predecir el empleo para los siguientes seis meses en la industria alimenticia usando datos colectados sobre los últimos 60 meses, usando el

Página 7

Page 8: Pronosticos y Control de Producción en Minitab

Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

método de Winters con el modelo multiplicativo, dado que hay componente estacional y de tendencia aparente en los datos.

Instrucciones de Minitab

1 Open Worksheet DELITOS.MTW.2 Ejecutar Stat > Time Series > Winters' Method.3 En Variable, poner Lesionados por arma. In Seasonal length, 12 .4 En Model Type, seleccionar Multiplicative.5 Seleccionar Generate forecasts poner 4 en Number of forecasts. Seleccionar OK.

Winters' Method for FoodMultiplicative MethodSmoothing Constants

Alpha (level) 0.2Gamma (trend) 0.2Delta (seasonal) 0.2Accuracy MeasuresMAPE 13.8561MAD 4.8550MSD 44.5868

LESI

ONAD

OS P

OR A

RMA

YearMonth

2010200920082007200620052004EneEneEneEneEneEneEne

70

60

50

40

30

20

10

Smoothing ConstantsAlpha (level) 0.2Gamma (trend) 0.2Delta (seasonal) 0.2

Accuracy MeasuresMAPE 13.8561MAD 4.8550MSD 44.5868

Variable

Forecasts95.0% PI

ActualFits

Lesionados por armaMultiplicative Method

Interpretación de los resultados

La gráfica muestra los valores de la serie y los valores estimados (un periodo adelante) y los cuatro pronósticos.

Los valores de exactitud del modelo MAPE, MAD y MSD utilizando el modelo Aditivo proporcionan un mejor ajuste en dos de los tres indicadores que con el modelo Multiplicativo como se muestra a continuación.Accuracy Measures

MAPE 13.5600MAD 4.7628MSD 43.1327

Página 8

Page 9: Pronosticos y Control de Producción en Minitab

Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

Accuracy MeasuresMultiplicative AdditiveMAPE 13.8561 13.5600MAD 4.8550 4.7628MSD 44.5868 43.1327

4.4 ANÁLISIS DE CORRELACIÓN Y MÉTODO DE ARIMA

El análisis de correlación, análisis de diferencias, autocorrelación y autocorrelación parcial, son utilizadas para identificar un modelo adecuado de ARIMA.

El Modelo ARIMA puede utilizarse para modelar series de tiempo con o sin componentes de tendencia o estacionalidad y proporcionar pronósticos.

Las diferencias se calculan entre los valores de los datos de la serie de tiempo, sirven para identificar patrones de tendencia y estacionalidad.

Los atrasos (lags), son valores anteriores con los que se determina el siguiente valor pronosticado

La autocorrelación: es la correlación entre observaciones de una serie de tiempo separadas por K unidades de tiempo, su gráfica se denomina función de autocorrelación (ACF), su análisis permite seleccionar los términos a ser incluidos en el modelo ARIMA.

Ejemplo de ARIMA:

Instrucciones de Minitab1 Worksheet DELITOS.MTW.2 Stat > Time Series > ARIMA.3 En Series, poner FALTAS_ADM.4 Seleccionar Fit seasonal model. En Period poner 12 en Nonseasonal, poner 1 en Autoregressive. En Seasonal y en Difference poner 0.5 Seleccionar Graphs. Seleccionar ACF of residuals y PACF of residuals .6 En Forecasts poner 12 en Lead e indicar una columna vacía para Store los pronósticos.7 OK en cada cuadro de diálogo.

ARIMA Model: FALTAS_ADMInterpretación de resultados

El modelo ARIMA converge en 10 iteraciones. El modelo AR(1) tiene un estadístico t de 46.78, como regla si t es mayor a 2 se puede juzgar el parámetro como significativo diferente de cero. Los residuos no parecen estar correlacionados como se muestra en las gráficas (están dentro de los intervalos de confianza,

Página 9

Lag

Auto

corr

elat

ion

54321

1.00.80.60.40.20.0

-0.2-0.4-0.6-0.8-1.0

ACF of Residuals for FALTAS_ADM(with 5% significance limits for the autocorrelations)

Page 10: Pronosticos y Control de Producción en Minitab

Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

asumiendo que el valor 10 es aleatorio). El modelo AR(1) parece ser adecuado para pronosticar.

Time

FALT

AS_A

DM

3330272421181512963

2250

2000

1750

1500

1250

1000

Time Series Plot for FALTAS_ADM(with forecasts and their 95% confidence limits)

Interpretación de resultados

El modelo ARIMA proporciona pronósticos con bandas de confianza en 95%, usando el modelo AR(1) la estacionalidad domina el perfil de pronósticos para los próximos 12 meses con los valores pronosticados similares a los 12 meses previos.

Página 10

Page 11: Pronosticos y Control de Producción en Minitab

Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

METODOLOGÍA DE ESTADÍSTICA INFERENCIAL

1. INTRODUCCIÓN

La estadística inferencial sirve para hacer inferencias sobre los parámetros de la población que pueden ser medias, varianzas y proporciones en base a los datos obtenidos de muestras.

PRUEBA PARA LA IGUALDAD DE DOS MEDIAS

Consideraremos ahora pruebas de hipótesis respecto a la igualdad de las medias de dos distribuciones normales donde no se conocen las varianzas .

Tenemos dos casos en el primero las varianzas son iguales y en el segundo las varianzas son desiguales, a continuación analizaremos cada uno de ellos.

En Minitab las instrucciones son las siguientes:

Prueba Minitab

>Stat >Basic statistics > 2- Sample tSamples in different columns

First Escándalos 2004Second Escándalos 2005º! Assume equal variancesOptions: Confidence level 95%

Test difference 0.0Alternate Not equal

OK

Resultados

Two-Sample T-Test and CI: Escándalos 2004, Escándalos 2005

Two-sample T for Escandalos 2004 vs Escandalos 2005

N Mean StDev SE MeanEscandalos 2004 3 3795 962 556Escandalos 2005 4 2804 585 293

Difference = mu (Escandalos 2004) - mu (Escandalos 2005)Estimate for difference: 990.41795% CI for difference: (-499.848, 2480.681) Como el cero se encuentra en el Intervalo de confianza, no se rechaza la Ho.

T-Test of difference = 0 (vs not =): T-Value = 1.71 P-Value = 0.148 DF = 5

Como el valor P de la prueba es mayor a 0.05 no se rechaza Ho

Página 11

Page 12: Pronosticos y Control de Producción en Minitab

Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

ANÁLISIS DE VARIANZA (ANOVA)

El análisis de la varianza de un criterio (ANOVA) es una metodología para analizar la variación entre muestras y la variación al interior de las mismas mediante la determinación de varianzas. Es llamado de un criterio porque analiza un variable independiente o Factor ej: Velocidad. Como tal, es un método estadístico útil para comparar dos o más medias poblacionales. El ANOVA de un criterio nos permite poner a prueba hipótesis tales como:

Ejemplo :

Se desea saber si los promedios de faltas administrativas por escándalos son estadísticamente iguales (Ho) o diferentes (Ha), se toman los datos siguientes:

Escándalos 2004

Escándalos 2005

4536 35202707 29924141 2543

2162

ANOVA en Minitab.

Seleccionar:

Stat > ANOVA > One Way (Unstacked) Response in separate columns Escándalos 2004, Escándalos 2005 Seleccionar º! Store Residuals º! Store Fits Confidence level 95%Graphs Seleccionar Normal plot of residualsComparisons Seleccionar Tukey’s Family error rate OK

Resultados:

La gráfica normal de residuos debe mostrar los residuos aproximados por una recta para validar el modelo

One-way ANOVA: Escandalos 2004, Escandalos 2005

Source DF SS MS F PFactor 1 1681586 1681586 2.92 0.148Error 5 2880825 576165Total 6 4562411S = 759.1 R-Sq = 36.86% R-Sq(adj) = 24.23%

Como este valor P es mayor a 0.05 no se rechaza la hipótesis nula y no hay diferencia significativa entre 2004 y 2005

S = 2.198 R-Sq = 28.69% R-Sq(adj) = 16.80%

Página 12

Page 13: Pronosticos y Control de Producción en Minitab

Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

Para todos los casos,

Ho: No hay diferencia o la variable de columna NO depende de la variable de renglón

H1: Hay diferencia la variable de columna SI depende de la variable de renglón

Ejemplo de Corrida en Minitab

Se desea saber si hay dependencia entre el tipo de delitos administrativos y la zona donde se realizan. Se registran las faltas administrativas durante 2004 y 2005 como sigue:

FALTAS ADMINISTRATIVAS POR ZONA Zona Centro Zona Norte Zona SurDeambular en la via publica en estado de embriaguez o drogado 6895 4441 3061Causar o provocar escandalo en lugares publicos o privados 5925 5569 2538Ingerir bebidas alcoholicas a bordo de un vehiculo o en via publica 5928 2822 2634Conducir bajo la influencia de alcohol o alguna droga o enervante 3667 3398 3936Provocar o participar en riñas en la via publica 2433 2195 1193Libre por falta de elementos 2170 20 15

Las instrucciones de Minitab son las siguientes:

1 Open Worksheet FALTASADM.MTW.

2 Seleccionar Stat > Tables > Chi-Square Test (Tabla cargada en la Worksheet).

3 En las Columnas de la tabla poner Zona Centro, Zona Norte y Zona Sur, OK.

Los resultados se muestran a continuación:

Chi-Sq = 1951.221, DF = 8, P-Value = 0.000

Interpretación de resultados

Como el P value de 0.00 es menor a 0.05, se rechaza Ho, por tanto existe dependencia entre el tipo de delitos y la zona donde se realizan.

Página 13

Page 14: Pronosticos y Control de Producción en Minitab

Metodología de análisis con Series de tiempo, Estadística inferencial y Control Estadístico

METODOLOGÍA DE CONTROL ESTADÍSTICO DE PROCESOSEl Control Estadístico del Proceso por medio de las cartas de control son la herramienta más poderosa para analizar la variación en los procesos. Las cartas de control enfocan la atención hacia las causas especiales de variación cuando aparecen y reflejan la magnitud de la variación debida a las causas comunes.

Las causas comunes o aleatorias se deben a la variación natural del proceso. Las causas especiales o atribuibles son por ejemplo: una situación anormal en el proceso.

Un proceso está bajo Control Estadístico cuando presenta causas comunes únicamente. Cuando ocurre esto tenemos un proceso estable y predecible.

Cuando existen causas especiales el proceso está fuera de Control Estadístico; las gráficas de control detectan la existencia de estas causas en el momento en que se dan, lo cual permite que podamos tomar acciones al momento.

Cartas de control por variables El término variable designa a cualquier característica de calidad “medible” tal como un tiempo de respuesta, número de incidentes, etc.

Carta de Individuales (Datos variables) A menudo esta carta se llama “I-MR”. Esta Carta monitorea la tendencia de un proceso con datos variables

individuales. La línea central se basa en el promedio de los datos, y los límites de control se

basan en la desviación estándar (+/- 3 sigmas)

Ejemplo: Se registra el número de robo a comercios durante 2004 y 2005. Realice la gráfica de control individual.

Observation

Indiv

idual

Value

70635649423528211471

50

40

30

20

_X=36.20

UCL=54.28

LCL=18.11

Observation

Movin

g Ran

ge

70635649423528211471

20

15

10

5

0

__MR=6.80

UCL=22.22

LCL=0

I-MR Chart of ROBO A COMERCIOS

Página 14