7
Modelos de regresión para observaciones censuradas Proyecto e-Math 1 Financiado por la Secretaría de Estado de Educación y Universidades (MECD) FIABILIDAD (VII): MODELOS DE REGRESIÓN PARA OBSERVACIONES CENSURADAS Autores: Ángel A. Juan Pérez ([email protected]), Rafael García Martín ([email protected]). RELACIÓN CON OTROS MATH-BLOCS__________________________________ Este math-block forma parte de una serie de 8 documentos relacionados todos ellos con la Fiabilidad de componentes desde un punto de vista estadístico: Conceptos Básicos (I). Identificación y descripción gráfica de los datos (II). Análisis paramétrico de los tiempos de fallo (III). Análisis no paramétrico de los tiempos de fallo (IV). Comparación no paramétrica de muestras (V). Tests de vida acelerada (VI). Modelos de regresión para observaciones censuradas (VII). Análisis Probit (Éxito / fracaso) (VIII). ESQUEMA DE CONTENIDOS___________________________________________ Fiabilidad (VII): Modelos de regresión para obs. censuradas Ejemplo reg. múltiple con obs. cens. (Minitab) Regresión múltiple con obs. censuradas

Fiabilidad Modelo Observacion Censurada

Embed Size (px)

DESCRIPTION

fiabilidad

Citation preview

  • Modelos de regresin para observaciones censuradas

    Proyecto e-Math 1 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    FIABILIDAD (VII): MODELOS DE REGRESIN PARA OBSERVACIONES CENSURADAS

    Autores: ngel A. Juan Prez ([email protected]), Rafael Garca Martn ([email protected]).

    RELACIN CON OTROS MATH-BLOCS__________________________________

    Este math-block forma parte de una serie de 8 documentos relacionados todos ellos con la Fiabilidad de componentes desde un punto de vista estadstico:

    Conceptos Bsicos (I). Identificacin y descripcin grfica de los datos (II). Anlisis paramtrico de los tiempos de fallo (III). Anlisis no paramtrico de los tiempos de fallo (IV). Comparacin no paramtrica de muestras (V). Tests de vida acelerada (VI). Modelos de regresin para observaciones censuradas (VII). Anlisis Probit (xito / fracaso) (VIII).

    ESQUEMA DE CONTENIDOS___________________________________________

    Fiabilidad (VII): Modelos de regresin para obs.

    censuradas

    Ejemplo reg. mltiple con obs. cens. (Minitab)

    Regresin mltiple con obs. censuradas

  • Modelos de regresin para observaciones censuradas

    Proyecto e-Math 2 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    INTRODUCCIN_____________________________________________________

    En cualquier investigacin sobre anlisis de fiabilidad puede resultar de sumo inters identificar aquellas variables que estn correlacionadas con los tiempos de fallo. Bsicamente, hay dos razones por las cuales este proceso de identificacin no se puede realizar utilizando las tcnicas comunes de regresin mltiple:

    1) La variable dependiente (tiempos de fallo) no suele distribuirse de forma normal (condicin necesaria para aplicar regresin por mnimos cuadrados).

    2) La existencia de observaciones censuradas

    El objetivo de la regresin con observaciones censuradas ser encontrar una expresin matemtica que nos describa el tiempo de fallo de una determinada proporcin de unidades (percentil de T Tp) en funcin de una o varias v.a. independientes (temperatura, horas de trabajo al da, grupo a que pertenecen los datos, etc.).

    Para llevar a cabo de forma efectiva estos tests de vida acelerada, ser conveniente recurrir a software especializado. En este captulo se har uso del programa MINITAB a fin de ejemplificar con casos prcticos los conceptos involucrados en este tipo de estudios.

    REGRESIN MLTIPLE CON OBS. CENSURADAS_________________________

    Por defecto, MINITAB usar un modelo de regresin lineal a la hora de explicar la relacin existente entre las variables independientes X1, X2, ..., Xn y la variable dependiente Tp (percentil de orden p de T). Sin embargo, es posible construir modelos no lineales sin ms que transformar las variables explicativas del modelo.

    Adems, segn la distribucin que sigan los tiempos de fallo T (exponencial, Weibull, etc.), puede resultar conveniente (ver tabla) realizar alguna de las siguientes transformaciones del percentil Tp: ( ) ( )pppppp TLogYTLnYTY 10;; === El modelo de regresin lineal mltiple tendr pues la forma:

    pnnp XbXbbY ++++= ...110 donde:

    b0, b1, ..., bn son el trmino independiente y los coeficientes de regresin = parmetro de escala (escala = 1 / forma) p = percentil de orden p de la distribucin de los residuos (), la cual vendr

    determinada por la distribucin de T (ver tabla).

    En la tabla siguiente se relaciona la distribucin de los tiempos de fallo T con:

    1) Las transformaciones idneas para Tp , y 2) Las distribuciones que siguen los residuos

  • Modelos de regresin para observaciones censuradas

    Proyecto e-Math 3 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    Yp Distrib. de tiempos de fallo (T) Distrib. de

    Weibull exponencial

    valores extremos (0,1)

    log-normal base e normal (0,1) Ln Tp

    log-logstica logstica (0,1) Log10 Tp log-normal base 10

    normal normal (0,1)

    valores extremos valores extremos (0,1) Tp logstica logstica (0,1)

    EJEMPLO REGRESIN MLTIPLE CON OBS. CENSURADAS________________

    Continuando con el ejemplo de las capas aislantes para motores (ver el math-block Fiabilidad VI), supngase ahora que se desean estimar los tiempos en que una determinada proporcin de protecciones aislantes fallan, en funcin no slo de las temperaturas, sino tambin de la planta donde fueron construidas (planta 1 o planta 2), i.e., se buscar una expresin de la forma:

    pp cXbXaY +++= 21

    Entrada de datos (input): se debe indicar la variable donde se han registrado los tiempos de fallo T, la distribucin que siguen dichas observaciones, y las variables independientes del modelo (en este caso ArrTemp X1 y Planta X2). Indicaremos tambin la columna de censura y aquellas columnas donde se guardan los valores de las variables independientes para los cuales se desean hacer predicciones (ArrNuevaT y NuevaPlant).

    Finalmente, se pedir un grfico de probabilidad para los residuos, a fin de estimar si la distribucin escogida es o no adecuada:

  • Modelos de regresin para observaciones censuradas

    Proyecto e-Math 4 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    Salida de datos (output):

    Regression with Life Data: T versus ArrTemp; Planta Response Variable: T Censoring Information Count Uncensored value 66 Right censored value 14 Censoring value: Censura = C Estimation Method: Maximum Likelihood Distribution: Weibull Regression Table Standard 95,0% Normal CI Predictor Coef Error Z P Lower Upper Intercept -15,1603 0,9468 -16,01 0,000 -17,0160 -13,3047 ArrTemp 0,83925 0,03397 24,71 0,000 0,77267 0,90584 Planta -0,18077 0,08457 -2,14 0,033 -0,34652 -0,01501 Shape 2,9431 0,2707 2,4577 3,5244 Log-Likelihood = -562,525 Anderson-Darling (adjusted) Goodness-of-Fit Standardized Residuals = 0,5078 Table of Percentiles Predictor Standard 95,0% Normal CI Percent Row Number Percentile Error Lower Upper 50 1 182093,6 32466,16 128389,8 258260,9 50 2 151980,8 25286,65 109689,6 210577,6 50 3 41530,38 5163,756 32548,44 52990,94 50 4 34662,51 3913,866 27781,00 43248,61

    Informacin sobre la distribucin elegida

    Valores estimados de a, b1, b2, y 1/ (shape=1/scale), as como los p-valores asociados al test con H0: el coeficiente es 0 (i.e., no tiene razn de existir en el modelo)

    Predicciones (basadas en el modelo creado) para los tiempos de fallo del 50% de dispositivos bajo los valores de temperatura y planta indicados: (80,1), (80,2),(100,1),y (100,2)

  • Modelos de regresin para observaciones censuradas

    Proyecto e-Math 5 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    La tabla de regresin proporciona los coeficientes del modelo. En este caso, dado que se ha usado una Weibull, la ecuacin del modelo sera:

    pp PlantaArrTempTLn ++= 9431,21

    18077,083925,01603,15

    donde la variable Planta puede tomar los valores 1 2, y sigue una distrib. de valores extremos (0,1).

    A partir de los p-valores asociados a cada coeficiente (0,000 para ArrTemp, y 0,033 para Planta), los cuales son significativos para = 0,05, se puede afirmar que: (1) la temperatura influye de forma decisiva sobre los tiempos de fallo (ms altas temperaturas significan menor tiempo hasta el fallo), y (2) la calidad de la capa aislante depender de la planta de produccin en la que fue construida (las capas aislantes fabricadas en la planta 1 duran ms).

    La tabla de percentiles muestra el percentil de orden 50 asociado a cada combinacin de temperatura y planta de produccin. Dado que este percentil es una buena aproximacin a la esperanza de vida de una unidad, es posible pronosticar lo siguiente: a 80 C, las protecciones fabricadas en la planta 1 durarn unas 182.093,6 horas (o 20,77 aos), mientras que la duracin esperada de las de la planta 2 ser de tan slo 151.980,8 horas (17,34 aos). Anlogas conclusiones se pueden extraer para una temperatura de 100 C.

    Aunque MINITAB hace todos los clculos de forma automtica, resulta interesante entender cmo el programa obtiene sus predicciones a partir del modelo. Por ejemplo, para una proteccin fabricada en la planta 1 (Planta = 1), y sometida una temperatura de 80 C (ArrTemp = 32,85998), el modelo anterior sera:

    ppTLn ++= 33978,0118077,085998,3283925,01603,15

    Se sabe que los residuos siguen en este caso una distribucin de valores extremos (0,1), cuya f.d. viene dada por:

    { }xexXPxF == exp1)()( Por tanto, el percentil de orden 50 de esta distribucin ser:

    0,50 = P(X

  • Modelos de regresin para observaciones censuradas

    Proyecto e-Math 6 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    Por lo que respecta a la bondad del ajuste, en el grfico siguiente se aprecia que las observaciones estn suficientemente cerca de la recta de probabilidad, por lo que se puede dar por bueno el ajuste mediante la Weibull:

    BIBLIOGRAFA______________________________________________________ [1]. Hager, H. W., and L. J. Bain. 1970. Inferential procedures for thegeneralized gamma distribution J.

    Am. Stat. Assoc. 65: 1601-1609. [2]. Harter, H. L. 1967. Maximum-likelihood estimation of the parametersof a four-parameter generalized

    gamma population for complete and censored samples. Technometrics 9: 159-165. [3]. Kaplan, E. L., and P. Meier. 1958. Nonparametric estimation from incomplete observations. J. Am.

    Stat. Assoc. 53: 457-481. [4]. Nelson, W. 1990. Accelerated Testing: Statistical Models, Test Plansand Data Analyses. John Wiley.

    pp: 75-85. [5]. Nelson, W. B., and G. J. Hahn. 1972. Linear estimation of regression relationships from censored

    data, Part I-Simple methods and their application (with discussion). Technometrics 14: 247-276. [6]. Stacy, E.W., and G. A. Mihram. 1965. Parameter estimation for a Generalized Gamma distribution.

    Technometrics 7: 349-358. [7]. Stacy, E. W. 1962. A generalization of the Gamma distribution. Ann.Math. Stat. 33: 1187-1192. [8]. Parr, V. H., and J. T. Webster. 1965. A method for discriminating between failure density functions

    used in reliability predictions.Technometrics 7: 1-10. [9]. Prentice, R. L. 1974. A Log Gamma Model and its maximum likelihood estimation. Biometrika 61:

    539-544. [10]. Farewell, V. T., and R. L. Prentice 1977. A study of distributional shape in life testing. Technometrics

    19: 69-75. [11]. Galambos, J. 1978. The Asymtotic Theory of Extreme Order Statistics.Wiley-Interscience. New York.

    pp: 189-191. [12]. Lawless, J. F. 1982. Statistical Models and Methods for Lifetime Data.John Wiley. pp: 298-321.

    -8 -4 0

    0,1

    1

    2 3

    5

    10

    20 30 40 50 60 70 80 90 95 99 99,9

    Standardized Residuals

    Perc

    ent

    Probability Plot for SResids of TExtreme value Distribution - ML Estimates - 95,0% CI

    Censoring Column in Censura

    FailureCensor

    AD*

    66 14

    0,5078

  • Modelos de regresin para observaciones censuradas

    Proyecto e-Math 7 Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

    ENLACES___________________________________________________________ Los siguientes artculos son un excelente material para quien desee profundizar ms sobre este tema:

    [W1] http://www.colpos.mx/agrocien/Bimestral/2000/jul-ago/art-9.pdf [W2] http://bear.fhcrc.org/~clk/papers/weipan.pdf