288
Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en Sistemas de Información "DETECCION DE PATRONES DE DAÑOS Y AVERÍAS EN LA INDUSTRIA AUTOMOTRIZ" Tesista: Ing. Hugo Daniel Flores Director: Dra. Paola Britos Codirector: Dr. Ramón García-Martínez Ciudad Autónoma de Buenos Aires, 2009

TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

Embed Size (px)

Citation preview

Page 1: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

Universidad Tecnológica NacionalFacultad Regional Buenos AiresDirección de Posgrado

TESIS de Maestría en

Ingeniería en Sistemas de Información

"DETECCION DE PATRONES DE DAÑOS Y AVERÍAS EN LAINDUSTRIA AUTOMOTRIZ"

Tesista: Ing. Hugo Daniel Flores

Director: Dra. Paola Britos

Codirector: Dr. Ramón García-Martínez

Ciudad Autónoma de Buenos Aires, 2009

Page 2: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 1 de287 Ing. Hugo Daniel Flores

Resumen En la industria automotriz uno de los temas relevantes en la producción y distribución de unidades es la detección e identificación de daños y/o averías producidas a lo largo del circuito que recorren los autos desde que salen de planta de producción hasta que llegan a su destino final. Con el incremento de la globalización, los fabricantes de vehículos han ido rediseñando sus redes de producción en todo el mundo. Para optimizar los costes, determinados países son escogidos para especializarse en la producción de ciertos modelos. Esta situación ha dado lugar a un inevitable aumento del transporte de los vehículos desde los países productores a los mercados finales. Durante estos trayectos los vehículos se ven sometidos a daños, en grado variable, en toda la cadena de suministro. El objetivo del proyecto es utilizar la metodología CRISP-DM para detectar patrones en la producción de daños y/o averías en la cadena de distribución para permitir a la industria:

• Identificar daños y/o averías. • Determinar responsabilidad de siniestralidad en función del tipo de avería y tipo de

transporte. • Imputar incidentes según el tipo de transporte. • Determinar tipos de averías y/o daños. • Determinar partes averiadas y/o dañadas que muestren algún tipo de comportamiento. • Especificar gravedad de daños y/o averías. • Definir e identificar modelos con daños especificando partes, tipo de daño y gravedad. • Especificar lugares donde se producen daños y/o averías tratando de definir patrones de

comportamiento. • Especificar estadísticamente: tipos de transporte que producen daños y/o averías como así

también, partes, tipos de averías, gravedades, lugares donde se producen. • Descubrir información “oculta” en función de los modelos generados a partir de los datos

disponibles.

Page 3: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 2 de287 Ing. Hugo Daniel Flores

Page 4: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 3 de287 Ing. Hugo Daniel Flores

Dedicatoria

A mi esposa y familia

Sandra, María Elena, Paula y Marcos

Page 5: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 4 de287 Ing. Hugo Daniel Flores

Page 6: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 5 de287 Ing. Hugo Daniel Flores

Agradecimiento A la Universidad Tecnológica Nacional, Facultad Regional Tucumán y por su intermedio al Estado Nacional por darme la posibilidad de estudiar y acceder a un nivel académico superior. A la Escuela de Posgrado de la Universidad Tecnológica Nacional, Facultad Regional Buenos Aires por haberme permitido acceder a este nivel de estudio. A mis tutores Dra. Paola Britos y Dr. Ramón García Martínez por haberme conducido a lo largo del desarrollo de este trabajo de tesis. A la Dra. Zulma Cataldi por su colaboración y asesoramiento en la especificación de los lineamientos generales para el desarrollo de esta tesis. A mis colegas y asociados por haber contribuido abierta y desinteresadamente en las pruebas y consultas realizadas no solo para este proyecto en particular sino también por todos los emprendimientos que vamos logrando. A mi esposa por darme la confianza y el apoyo, y soportar diariamente la ardua labor que implica mi desarrollo profesional permanente. A mi madre por haberme inculcado desde niño a seguir el camino de la educación para mejorar mi futuro como persona, como hijo, como hermano y como hombre de familia. Espero que este trabajo y su propuesta de futuras líneas de investigación sirvan como agradecimiento y devolución hacia la sociedad por las oportunidades que me brindó a través de la Universidad Estatal.

Page 7: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 6 de287 Ing. Hugo Daniel Flores

Page 8: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 7 de287 Ing. Hugo Daniel Flores

Índice 1. Introducción ..................................................................................................................................... 9

1.1. Minería de Datos (Data Mining) ............................................................................................... 9 1.2. Lineamientos del documento de tesis ..................................................................................... 10

2. Técnicas de Minería de Datos ........................................................................................................ 11 1. Análisis estadístico ..................................................................................................................... 11 2. Análisis a través de sistemas inteligentes .................................................................................. 12 3. Conclusiones .............................................................................................................................. 13

3. Metodologías de Minería de Datos ................................................................................................ 15 3.1. SEMMA .................................................................................................................................. 15 3.2. CRISP-DM .............................................................................................................................. 16 3.3. Microsoft ................................................................................................................................. 18 3.4. Comparación de Metodologías ............................................................................................... 21

4. La metodología CRISP-DM........................................................................................................... 23 4.1. Introducción ............................................................................................................................ 23

4.1.1. La Metodología CRISP-DM ............................................................................................ 23 4.1.2. Pasaje de modelos genéricos a modelos especializados .................................................. 24

4.2. El modelo de referencia CRISP-DM ...................................................................................... 25 4.2.1. Comprensión del Negocio ................................................................................................ 27 4.2.2. Comprensión de Datos ..................................................................................................... 31 4.2.3. Preparación de Datos ....................................................................................................... 33 4.2.4. Modelado ......................................................................................................................... 37 4.2.5. Evaluación ........................................................................................................................ 39

4.3. La guía de usuario de CRISP-DM .......................................................................................... 43 4.3.1. Comprendiendo el negocio .............................................................................................. 43 4.3.2. Comprensión de Datos ..................................................................................................... 51 4.3.3. Preparación de los datos ................................................................................................... 56 4.3.4. Modelado ......................................................................................................................... 60 4.3.5. Evaluación ........................................................................................................................ 64 4.3.6. Desarrollo ......................................................................................................................... 67

4.4. Las salidas del CRISP-DM ..................................................................................................... 69 4.4.1. Comprensión del Negocio ................................................................................................ 70 4.4.2. Comprensión de Datos ..................................................................................................... 71 4.4.3. Preparación de Datos ....................................................................................................... 72 4.4.4. Modelado ......................................................................................................................... 73 4.4.5. Evaluación ........................................................................................................................ 74 4.4.6. Desarrollo ......................................................................................................................... 75 4.4.7. Resumen de dependencias ............................................................................................... 75

4.5. Apéndice ................................................................................................................................. 77 4.5.1. Glosario/Terminología ..................................................................................................... 77 4.5.2. Tipos de problemas de minería de datos .......................................................................... 77

5. Descripción y desarrollo de la industria. ........................................................................................ 85 5.1. La industria automotriz y el control de daños y/o averías ...................................................... 85 5.2. Circuitos logísticos .................................................................................................................. 86 5.3. Transportes y lugares de almacenamiento .............................................................................. 87

6. Procesos a analizar, límites y alcance ............................................................................................ 89 6.1. Puntos de Control .................................................................................................................... 89 6.2. Estándares de inspección ........................................................................................................ 89

7. Información y datos ....................................................................................................................... 91

Page 9: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 8 de287 Ing. Hugo Daniel Flores

7.1. Proceso de inspección y captura de datos ............................................................................... 91 7.2. Sistema normalizado de codificación de daños y/o averías .................................................... 91 7.3. Proceso de educción de requerimientos del proyecto ............................................................. 91

8. Aplicación de la metodología propuesta. ....................................................................................... 95 8.1. Comprensión del Negocio ....................................................................................................... 95 8.2. Comprensión de Datos .......................................................................................................... 104 8.3. Preparación de Datos ............................................................................................................ 112 8.4. Modelado .............................................................................................................................. 115

8.4.1. Selección de las técnicas de modelado .......................................................................... 115 8.4.2. Generación de la prueba de diseño ................................................................................ 115 8.4.3. Construcción de los modelos ......................................................................................... 116 8.4.4. Descripción de los modelos ........................................................................................... 119

8.4.4.1. Modelo de Clasificación ......................................................................................... 119 8.4.4.2. Modelo de Clustering .............................................................................................. 144 8.4.4.3. Modelo de Predicción ............................................................................................. 167

8.4.5. Dificultades encontradas ................................................................................................ 190 8.5. Evaluación ............................................................................................................................. 190

8.5.1. Evaluación de los resultados en términos de minería de datos ...................................... 190 8.5.2. Evaluación de los resultados en términos de objetivos de negocio. .............................. 218

8.5.2.1. Tipos de averías. ..................................................................................................... 219 8.5.2.2. Lugares. ................................................................................................................... 220 8.5.2.3. Modelos. .................................................................................................................. 220 8.5.2.4. Partes, Averías y Gravedad. .................................................................................... 221 8.5.2.5. Lugares, Partes y Tipos de Averías. ........................................................................ 224 8.5.2.6. Modelos, Partes y Tipos de Averías........................................................................ 232 8.5.2.7. Imputación Tipo de Transporte. .............................................................................. 238

8.6. Desarrollo .............................................................................................................................. 241 8.6.1. Plan de desarrollo ........................................................................................................... 241 8.6.2. Supervisión y mantenimiento del plan ........................................................................... 250 8.6.3. Producción de Informe definitivo .................................................................................. 251 8.6.4. Revisión del proyecto..................................................................................................... 252

9. Conclusiones ................................................................................................................................ 253 10. Líneas futuras de investigación .................................................................................................. 257 11. Bibliografías y Documentación ................................................................................................. 259 12. Anexos ....................................................................................................................................... 261

Anexo 1: Terminología de negocio. ............................................................................................. 261 Anexo 2: Terminología de minería de datos. ............................................................................... 262 Anexo 3: Consultas estructuradas para base de datos. ................................................................. 264 Anexo 4: Codificación ................................................................................................................. 273 Anexo 5: Presentación final. ........................................................................................................ 277

Page 10: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 9 de287 Ing. Hugo Daniel Flores

1. Introducción 1.1. Minería de Datos (Data Mining) El gran desarrollo tecnológico de los últimos años ha potenciado el almacenamiento de grandes volúmenes de información. No solo desde el punto de vista del “computador personal” sino también desde el punto de vista de la computación como un conjunto de dispositivos electrónicamente interconectados capaces de soportar el trasporte de grandes cantidades de información en una dirección determinada con el propósito de ser almacenada centraliza o descentralizadamente, o bien desde el punto de vista de redes electrónicas donde desde cada nodo se permite la posibilidad de cargar información en una o más bases de datos. Al mayor poder de procesamiento y transporte de información se suman los avances tecnológicos en materia de base de datos que soportan “grandes” volúmenes de información de diferentes orígenes y fuentes pudiendo incluir texto, números, imágenes, video, etc. Estos avances en materia de gran capacidad de almacenamiento de información han dado lugar a la creación de nuevas tecnologías como la Minería de Datos. Conceptualmente la Minería de Datos o Explotación de Datos, como también será llamada en el presente trabajo, se puede definir como un conjunto de técnicas y herramientas aplicadas al proceso no trivial de extraer y presentar conocimiento implícito, previamente desconocido, potencialmente útil y humanamente comprensible, a partir de grandes conjuntos de datos con motivo de predecir de forma automatizada tendencias y comportamientos y/o descubrir de forma automatizada modelos previamente desconocidos [Piatetski-Shapiro, 1991]. Desde un punto de vista empresarial la minería de datos puede ser definida como un conjunto de áreas que tiene como propósito la identificación de un conocimiento obtenido a partir de las bases de datos que aporten un sesgo hacia la toma de decisiones [Molina, 2001]. Lo que realmente hace el data mining es reunir las ventajas de varias áreas como la Estadística, la Inteligencia Artificial, la Computación Gráfica, el Datawarehouse y el Procesamiento Masivo, principalmente usando como materia prima bases de datos. Para tener una aproximación cercana a las diversas definiciones encontradas en diferentes artículos de diferentes autores se puede concluir que la minería de datos es un proceso con el cual se pueden descubrir y cuantificar relaciones predictivas en los datos, y del resultado de este proceso es posible obtener conocimiento útil para el negocio. Hoy en día realizando las consultas (simplemente navegando los datos) convencionales a grandes bases de datos no es suficiente para resolver problemas de negocios, sino que se hace necesario seguir una metodología ordenada para aplicar herramientas tecnológicas y técnicas disponibles en informáticas para así obtener conocimiento y resultados que permitan a las compañías obtener un beneficio. El entorno natural del Data Mining es el Datawarehouse. La minería de datos trata de sacar información de detalle de un almacén de datos. No se conforma solo con la visualización de datos, sino que es necesario obtener resultados en cuanto a la relación que existe entre los mismos y como estos podrían repercutir en el negocio.

Page 11: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 10 de287 Ing. Hugo Daniel Flores

Para la explotación de datos aplicando minería de datos existen diferentes técnicas las cuales pueden ser desarrolladas según diferentes metodologías. A continuación se describirán algunas técnicas y metodologías de Data Mining. 1.2. Lineamientos del documento de tesis El primer capítulo desarrolla una breve introducción a la minería de datos que es la base operacional del presente proyecto de tesis. El capítulo dos muestra una descripción de las diferentes técnicas de minería de datos que pueden ser aplicadas en función de las necesidades del estudio en cuestión. El tercer capítulo realiza una comparación entre las diferentes metodología de minería de datos desarrolladas hasta el presente. Además muestra el avance tecnológico de cada técnica y muestra como resultado una breve conclusión que motiva la aplicación de la metodología seleccionada para este proyecto. En el cuarto capítulo se desarrolla la metodología completa a utilizar en este proyecto y esta además representa para esta tesis el estado de la tecnología. Se toma como marco de referencia la metodología propuesta por la organización creadora de la misma y a la cual se hace referencia en las respectivas citas. Le quinto capítulo describe la situación actual de la industria automotriz en lo referente a daños y/o averías. Además se muestran los posibles circuitos logísticos estándares en la industria y demás detalles como los tipos de transporte o lugares de estacionamiento de las unidades automotrices. El sexto capítulo hace referencia a los procesos a analizar, los límites del proyecto y los alcances del mismo. En el séptimo capítulo se realiza la descripción global del sistema de información del que se obtiene toda la información para la explotación de datos. En el capítulo ocho se realiza la aplicación de la metodología propuesta a la industria automotriz. Paso a paso se hace el desarrollo completo de la metodología propuesta. El capítulo nueve muestra las conclusiones a las que se arriba luego del desarrollo del proyecto de tesis. En el capítulo diez se presentan las posibles líneas de investigación que surgen de la realización de este proyecto. El capítulo once muestra la bibliografía a la cual se ha recurrido para el desarrollo del presente proyecto. Finalmente en el capítulo doce se muestran todos los anexos utilizados para la preparación, análisis y evaluación de los resultados.

Page 12: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 11 de287 Ing. Hugo Daniel Flores

2. Técnicas de Minería de Datos Las bases de la minería de datos se encuentran en la inteligencia artificial y en el análisis estadístico y mediante los modelos extraídos. Utilizando técnicas de minería de datos se aborda la solución a problemas de predicción, clasificación y segmentación. 1. Análisis estadístico Debido al gran volumen de datos con el que se puede contar en la actualidad y al poder de proceso en la tecnología desarrollada hasta aquí, se hace viable la exploración de la información utilizando diferentes técnicas estadísticas. El Análisis Estadístico se preocupa más por el poder de generalización de los resultados obtenidos para inferir los resultados a situaciones más generales que la estudiada. A continuación se presentan algunas técnicas:

• ANOVA o análisis de la Varianza: Contrasta si existen diferencias significativas entre las medidas de una o más variables continuas en grupos de población distintos.

• Regresión: Define la relación entre una o más variables y un conjunto de variables predictoras de las primeras.

• Chi cuadrado: Contrasta la hipótesis de independencia entre variables. • Componentes principales: Permite reducir el número de variables observadas a un menor

número de variables artificiales, conservando la mayor parte de la información sobre la varianza de las variables.

• Análisis discriminante: Método de clasificación de individuos en grupos que previamente se han establecido, y que permite encontrar la regla de clasificación de los elementos de estos grupos, y por tanto identificar cuáles son las variables que mejor definan la pertenencia al grupo.

• Series temporales: Es el conocimiento de una variable a través del tiempo para que a partir de ese conocimiento y bajo el supuesto de que no van a producirse cambios estructurales, poder realizar predicciones. Suelen basarse en un estudio de la serie en ciclos, tendencias y estacionalidades, que se diferencian por el ámbito de tiempo abarcado, para por composición obtener la serie original. Se pueden aplicar enfoques híbridos con los métodos anteriores, en los que la serie se puede explicar no sólo en función del tiempo sino como combinación de otras variables de entornos más estables y, por lo tanto, más fácilmente predecibles.

• Análisis cluster1: Permite clasificar una población en un número determinado de grupos, en base a semejanzas y desemejanzas de perfiles existentes entre los diferentes componentes de dicha población.

• El método Chaid (Chi Squared Automatic Interaction Detector): Es un análisis que genera un árbol de decisión para predecir el comportamiento de una variable, a partir de una o más variables predictoras, de forma que los conjuntos de una misma rama y un mismo nivel son disjuntos. Es útil en aquellas situaciones en las que el objetivo es dividir una población en distintos segmentos basándose en algún criterio de decisión. El árbol de decisión se construye partiendo el conjunto de datos en dos o más subconjuntos de observaciones a partir de los valores que toman las variables predictoras. Cada uno de estos subconjuntos vuelve después a ser particionado utilizando el mismo algoritmo. Este proceso continúa hasta que no se encuentran diferencias significativas en la influencia de las

1 Análisis cluster usando mapas autoorganizados (técnica de sistemas inteligentes) será aplicado en esta tesis.

Page 13: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 12 de287 Ing. Hugo Daniel Flores

variables de predicción de uno de estos grupos hacia el valor de la variable de respuesta. La raíz del árbol es el conjunto de datos íntegro, los subconjuntos y los subsubconjuntos conforman las ramas del árbol. Un conjunto en el que se hace una partición se llama nodo. El número de subconjuntos en una partición puede ir de dos hasta el número de valores distintos que puede tomar la variable usada para hacer la separación. La variable de predicción usada para crear una partición es aquella más significativamente relacionada con la variable de respuesta de acuerdo con test de independencia de la Chi cuadrado sobre una tabla de contingencia.

2. Análisis a través de sistemas inteligentes El objetivo de la aplicación de Sistemas Inteligentes en la minería de datos es extraer información de manera no supervisada. Se preocupa por ofrecer soluciones algorítmicas con un costo computacional aceptable. A continuación se presentan algunas de estas técnicas:

• Algoritmos genéticos: Son métodos numéricos de optimización, en los que aquella variable o variables que se pretenden optimizar junto con las variables de estudio constituyen un segmento de información. Aquellas configuraciones de las variables de análisis que obtengan mejores valores para la variable de respuesta, corresponderán a segmentos con mayor capacidad reproductiva. A través de la reproducción, los mejores segmentos perduran y su proporción crece de generación en generación. Se puede además introducir elementos aleatorios para la modificación de las variables (mutaciones). Al cabo de cierto número de iteraciones, la población estará constituida por buenas soluciones al problema de optimización.

• Redes neuronales: Genéricamente son métodos de proceso numérico en paralelo, en el que las variables interactúan mediante transformaciones lineales o no lineales, hasta obtener salidas. Estas salidas se contrastan con los que tenían que haber salido, basándose en unos datos de prueba, dando lugar a un proceso de retroalimentación mediante el cual la red se reconfigura, hasta obtener un modelo adecuado.

• Lógica difusa: Es una generalización del concepto de estadística. La estadística clásica se basa en la teoría de probabilidades, a su vez ésta en la técnica conjuntista, en la que la relación de pertenencia a un conjunto es dicotómica (el 2 es par o no lo es). Si se establece la noción de conjunto borroso como aquel en el que la pertenencia tiene una cierta graduación (¿un día a 20º C es caluroso?), dispondremos de una estadística más amplia y con resultados más cercanos al modo de razonamiento humano.

• Mapas autoorganizados: Los mapas autoorganizados o SOM (Self-Organizing Map), también llamados redes de Kohonen son un tipo de red neuronal no supervisada, competitiva, distribuida de forma regular en una rejilla de, normalmente, dos dimensiones, cuyo fin es descubrir la estructura subyacente de los datos introducidos en ella. A lo largo del entrenamiento de la red, los vectores de datos son introducidos en cada neurona y se comparan con el vector de peso característico de cada neurona. La neurona que presenta menor diferencia entre su vector de peso y el vector de datos es la neurona ganadora (o BMU, Best-Matching Unit, Unidad con mejor ajuste) y ella y sus vecinas verán modificados sus vectores de pesos.

• Algoritmos de inducción: Encuadrado dentro de las técnicas de Aprendizaje Automático (Machine Learning), estos algoritmos permiten construir automáticamente a partir de un conjunto de datos de entrenamiento un árbol de clasificación. Para inferir el árbol, el algoritmo realiza particiones binarias sucesivas en el espacio de las variables explicativas,

Page 14: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 13 de287 Ing. Hugo Daniel Flores

de forma que en cada partición se escoge la variable que aporta más información en función de una medida de entropía o cantidad de información. El árbol así construido consta del mínimo número de atributos (variables) que se requieren para la clasificación eficiente de los ejemplos dados, con lo que es claro el gran poder explicativo de esta técnica. También se pueden elaborar, a partir del árbol, reglas de clasificación fácilmente interpretables, que definen las características que más diferencian a las distintas clases establecidas inicialmente. Este tipo de sistemas clasificadores presentan la ventaja, frente a las técnicas estadísticas, de que tienen un carácter estrictamente no paramétrico. Además, aunque no alcanzan el poder predictivo de las redes neuronales, sus resultados son mucho más fácilmente interpretables que los modelos de “caja negra” suministrados por aquéllas.

3. Conclusiones En general, cualquiera que sea el problema a resolver, no existe una única técnica para solucionarlo, sino que puede ser abordado siguiendo aproximaciones distintas. El número de técnicas es muy grande y es muy probable que siga creciendo. La experiencia práctica muestra la aptitud de las técnicas de minería de datos para resolver problemas empresariales. También es clara su aportación para resolver problemas científicos que impliquen el tratamiento de grandes cantidades de datos. La minería de datos es, en realidad, una prolongación de una práctica estadística de larga tradición, la de Análisis de Datos. Existe, además, una aportación propia de técnicas específicas de Inteligencia Artificial, en particular sobre la integración de los algoritmos, la automatización del proceso y la optimización del coste. A diferencia de la IA, que es una ciencia joven, en Estadística se viene aprendiendo de los datos desde hace más de un siglo, la diferencia consiste en que ahora existe la potencia de cálculo suficiente para tratar ficheros de datos de forma masiva y automática. Esta es una realidad que cada vez será más habitual. Por otro lado y en relación a la amplia diversidad de técnicas disponibles, conviene tener claro que no existe la técnica más inteligente, sino formas inteligentes de utilizar una técnica y que cada uno utiliza de forma inteligente aquello que conoce. También que para la mayoría de los problemas no existen diferencias significativas en los resultados obtenidos.

Page 15: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 14 de287 Ing. Hugo Daniel Flores

Page 16: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 15 de287 Ing. Hugo Daniel Flores

3. Metodologías de Minería de Datos 3.1. SEMMA2 SAS Institute3 es el desarrollador de esta metodología, la define como el proceso de selección, exploración y modelado de grandes cantidades de datos para descubrir patrones de negocio desconocidos. El nombre de esta terminología es el acrónimo correspondiente a las cinco fases básicas del proceso (Figura 1).

Figura 1: Fases de la metodología SEMMA

El proceso se inicia con la extracción de la población muestral sobre la que se va a aplicar el análisis. El objetivo de esta fase consiste en seleccionar una muestra representativa del problema en estudio. La representatividad de la muestra es indispensable ya que de no cumplirse invalida todo el modelo y los resultados dejan de ser admisibles. La forma más común de obtener una muestra es la selección al azar, es decir, cada uno de los individuos de una población tiene la misma posibilidad de ser elegido. Este método de muestreo se denomina muestreo aleatorio simple. La metodología SEMMA establece que para cada muestra considerada para el análisis del proceso se debe asociar el nivel de confianza de la muestra. Una vez determinada una muestra o conjunto de muestras representativas de la población en estudio, la metodología SEMMA indica que se debe proceder a una exploración de la información disponible con el fin de simplificar en lo posible el problema para optimizar la eficiencia del modelo. Para lograr este objetivo se propone la utilización de herramientas de visualización o de técnicas estadísticas que ayuden a poner de manifiesto relaciones entre variables. De esta forma se pretende determinar cuáles son las variables explicativas que van a servir como entradas al modelo. La tercera fase de la metodología consiste en la manipulación de los datos, en base a la exploración realizada, de forma que se definan y tengan el formato adecuado los datos que serán introducidos en el modelo. Una vez que se han definido las entradas del modelo con el formato adecuado para la aplicación de la técnica de modelado, se procede al análisis y modelado de los datos. El objetivo de esta fase consiste en establecer una relación entre las variables explicativas y las variables objeto del estudio, que posibiliten inferir el valor de las mismas con un nivel de confianza determinado. Las técnicas utilizadas para el modelado de los datos incluyen métodos estadísticos tradicionales (tales como análisis discriminante, métodos de agrupamiento, y análisis de regresión), así como técnicas basadas en datos tales como redes neuronales, técnicas adaptativas, lógica fuzzy (difusa), árboles de decisión, reglas de asociación y computación evolutiva.

2 SEMMA: Simple, Explore, Modify, Model, Assess. 3 SAS Institute: Es una empresa con sede en Cary (Carolina del Norte, Estados Unidos). Es uno de los principales fabricantes de software business intelligence.

Muestreo (Sample)

Exploración (Explore)

Manipulación (Modify)

Modelado (Model)

Valoración (Assess)

Page 17: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 16 de287 Ing. Hugo Daniel Flores

Finalmente, la última fase del proceso consiste en la valoración de los resultados mediante el análisis de bondad del modelo o modelos contrastados con otros métodos estadísticos o con nuevas poblaciones muestrales. 3.2. CRISP-DM4 La metodología CRISP-DM (Chapman, 1999) consta de cuatro niveles de abstracción, organizados de forma jerárquica en tareas que van desde el nivel más general hasta los casos más específicos. A nivel más general, el proceso está organizado en seis fases (Figura 2), estando cada fase a su vez estructurada en varias tareas generales de segundo nivel. Las tareas generales se proyectan a tareas específicas, donde se describen las acciones que deben ser desarrolladas para situaciones específicas. Así, si en el segundo nivel se tiene la tarea general “limpieza de datos”, en el tercer nivel se dicen las tareas que tienen que desarrollarse para un caso específico, como por ejemplo, “limpieza de datos numéricos”, o “limpieza de datos categóricos”. El cuarto nivel, recoge el conjunto de acciones, decisiones y resultados sobre el proyecto de Data Mining específico. La metodología CRISP-DM proporciona dos documentos distintos como herramienta de ayuda en el desarrollo del proyecto de Data Mining: el del modelo de referencia y la guía del usuario. El documento del modelo de referencia describe de forma general las fases, tareas generales y salidas del proyecto de Data Mining. La guía del usuario proporciona información más detallada sobre la aplicación práctica del modelo de referencia al proyecto de Data Mining específico, proporcionando consejos y listas de comprobación sobre las tareas correspondientes a cada fase. La metodología CRISP-DM estructura el ciclo de vida de un proyecto de Data Mining en seis fases, que interactúan entre ellas de forma iterativa durante el desarrollo del proyecto (Figura 2). Las flechas indican relaciones más habituales entre las fases, aunque se pueden establecer relaciones entre cualquier fase. El círculo exterior simboliza la naturaleza cíclica del proceso de modelado.

4 CRISP-DM: Cross Industry Standard Process for Data Mining.

Page 18: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 17 de287 Ing. Hugo Daniel Flores

Figura 2: Fases del proceso de modelado metodología CRISP-DM. La primera fase análisis del problema, incluye la comprensión de los objetivos y requerimientos del proyecto desde una perspectiva empresarial, con el fin de convertirlos en objetivos técnicos y en una planificación. La segunda fase de análisis de datos comprende la recolección inicial de datos, en orden a que sea posible establecer un primer contacto con el problema, identificando la calidad de los datos y estableciendo las relaciones más evidentes que permitan establecer las primeras hipótesis. Una vez realizado el análisis de datos, la metodología establece que se proceda a la preparación de los datos, de tal forma que puedan ser tratados por las técnicas de modelado. La preparación de datos incluye las tareas generales de selección de datos a los que se van a aplicar la técnica de modelado (variables y muestras), limpieza de los datos, generación de variables adicionales, integración de diferentes orígenes de datos y cambios de formato. La fase de preparación de los datos, se encuentra muy relacionada con la fase de modelado, puesto que en función de la técnica de modelado que vaya a ser utilizada los datos necesitan ser procesados en diferentes formas. Por lo tanto las fases de preparación y modelado interactúan de forma sistemática.

Análisis del Problema

Análisis de los datos

Preparación de los datos

Modelado

Evaluación

Explotación

Datos

Page 19: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 18 de287 Ing. Hugo Daniel Flores

En la fase de modelado se seleccionan las técnicas de modelado más apropiadas para el proyecto de Data Mining específico. Las técnicas a utilizar en esta fase se seleccionan en función de los siguientes criterios:

• Ser apropiada al problema • Disponer de datos adecuados • Cumplir los requerimientos del problema • Tiempo necesario para obtener un modelo • Conocimiento de la técnica

Antes de proceder al modelado de los datos se debe de establecer un diseño del método de evaluación de los modelos, que permita establecer el grado de bondad de los modelos. Una vez realizadas estas tareas genéricas se procede a la generación y evaluación del modelo. Los parámetros utilizados en la generación del modelo dependen de las características de los datos. En la fase de evaluación, se evalúa el modelo, no desde el punto de vista de los datos, sino del cumplimiento de los criterios de éxito del problema. Se debe revisar el proceso teniendo en cuenta los resultados obtenidos para poder repetir algún paso en el que a la vista del desarrollo posterior del proceso se hayan podido cometer errores. Si el modelo generado es válido en función de los criterios de éxito establecidos en la primera fase, se procede a la explotación del modelo. Normalmente los proyectos de Data Mining no terminan en la implantación del modelo, sino que se deben documentar y presentar los resultados de manera comprensible en orden a lograr un incremento del conocimiento. Además en la fase de explotación se debe de asegurar el mantenimiento de la aplicación y la posible difusión de los resultados [Fayyad, 1996]. 3.3. Microsoft En la Figura 3 se describe las relaciones entre cada paso en la metodología desarrollada por Microsoft para la implementación de Data Mining (Figura 3).

Page 20: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 19 de287 Ing. Hugo Daniel Flores

Figura 3: Fases del proceso de modelado metodología Microsoft. El primer paso del proceso de minería de datos consiste en definir claramente el problema empresarial. Este paso incluye analizar los requisitos empresariales, definir el ámbito del problema, definir las métricas por las que se evaluará el modelo y definir el objetivo final del proyecto de minería de datos. Estas tareas se traducen en preguntas como las siguientes:

• ¿Qué se está buscando? • ¿Qué atributo del conjunto de datos se desea intentar predecir? • ¿Qué tipos de relaciones se intenta buscar? • ¿Se desea realizar predicciones a partir del modelo de minería de datos o sólo buscar

asociaciones y patrones interesantes? • ¿Cómo se distribuyen los datos? • ¿Cómo se relacionan las columnas? o en caso de haber varias tablas, ¿cómo se relacionan las

tablas? Para responder a estas preguntas, es probable que se deba dirigir un estudio de disponibilidad de datos para investigar las necesidades de los usuarios de la empresa con respecto a los datos disponibles. Si los datos no son compatibles con las necesidades de los usuarios, puede que se deba volver a definir el proyecto. El segundo paso del proceso de minería de datos consiste en consolidar y limpiar los datos identificados en el paso “Definir el problema”. Los datos pueden estar dispersos en la empresa y almacenados en distintos formatos; también pueden contener incoherencias como entradas que faltan o contienen errores.

Definir el problema

Preparar datos

Explorar datos

Generar modelos

Validar modelos

Implementar y actualizar modelos

Integración de servicio

Integración de servicio

Vista de origen de datos Diseñador de

minería de datos

Page 21: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 20 de287 Ing. Hugo Daniel Flores

El tercer paso del proceso de minería de datos consiste en explorar los datos preparados. Se debe comprender los datos para tomar las decisiones adecuadas al crear los modelos. Entre las técnicas de exploración se incluyen calcular los valores mínimos y máximos, calcular la media y las desviaciones estándar y examinar la distribución de los datos. Una vez explorados los datos, se puede decidir si el conjunto de datos contiene datos con errores y, a continuación, crear una estrategia para solucionar los problemas. El cuarto paso del proceso de minería de datos consiste en generar los modelos de minería de datos. Antes de generar un modelo, se deben separar aleatoriamente los datos preparados en conjuntos de datos de entrenamiento y comprobación independientes. El conjunto de datos de entrenamiento se utiliza para generar el modelo y el conjunto de datos de comprobación para comprobar la precisión del modelo mediante la creación de consultas de predicción. Una vez definida la estructura del modelo de minería de datos, se procesa rellenando la estructura vacía con los patrones que describen el modelo. Esto se conoce como entrenar el modelo. Los patrones se encuentran al pasar los datos originales por un algoritmo matemático. El modelo de minería de datos se define mediante un objeto de estructura de minería de datos, un objeto de modelo de minería de datos y un algoritmo de minería de datos. El quinto paso del proceso de minería de datos consiste en explorar los modelos que se han generado y comprobar su eficacia. No se debe implementar un modelo en un entorno de producción sin comprobar primero si el modelo funciona correctamente. Además, puede ser que se hayan creado varios modelos y se deba decidir cuál funciona mejor. Si ninguno de los modelos que se han creado en el paso Generar Modelos funciona correctamente, puede ser que se deba volver a un paso anterior del proceso y volver a definir el problema o volver a investigar los datos del conjunto de datos original. El último paso del proceso de minería de datos consiste en implementar los modelos que funcionan mejor en un entorno de producción. Una vez que los modelos de minería de datos se encuentran en el entorno de producción, se pueden llevar acabo diferentes tareas, dependiendo de las necesidades. Éstas son algunas de las tareas que se pueden realizar:

• Utilizar los modelos para crear predicciones que se puedan utilizar para tomar decisiones empresariales.

• Incrustar la funcionalidad de minería de datos directamente en una aplicación. • Crear un paquete en el que se utilice un modelo de minería de datos para separar de forma

inteligente los datos entrantes en varias tablas. • Crear un informe que permita a los usuarios realizar consultas directamente en un modelo de

minería de datos existente. La actualización del modelo forma parte de la estrategia de implementación. A medida que la organización recibe más datos, se deben volver a procesar los modelos para mejorar así su eficacia.

Page 22: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 21 de287 Ing. Hugo Daniel Flores

3.4. Comparación de Metodologías Las metodologías SEMMA, CRISP-DM y Microsoft esencialmente son muy parecidas. Las tres están compuestas por etapas o fases que interactúan entre sí. En referencia a la tecnología SEMMA está más ligada a los aspectos técnicos de la explotación de datos. En cuanto a las otras dos, están más enfocadas en el negocio en sí; es decir en la aplicación de la Minería de Datos a los negocios. Esta diferencia se ve específicamente en la primera etapa donde SEMMA arranca directamente en el trabajo de datos mientras que CRISP-DM y Microsoft empiezan por el estudio del negocio y sus objetivos, y luego recién se transforma en un problema técnico. Analizando la propuesta metodológica de Microsoft se puede ver que está íntimamente vinculada a la aplicación de las herramientas de su propia compañía (Microsoft) especialmente en lo que respecta a la integración de servicios, vista de origen de datos y diseñador de minería de datos. Lo mismo ocurre con la metodología SEMMA la cual está ligada a herramientas SAS. Para concluir se puede decir que uno de los motivos por los cuales fue escogida para el presente proyecto la metodología CRISP-DM es que este sistema está diseñado como una metodología independiente de la herramienta tecnológica a utilizar en la Explotación de Datos. Esto último la hace más flexible. Otro punto importante es que es de libre acceso y cumple con la característica de ser orientada al negocio. Para esta implementación su desarrollo será aplicado a los datos de la Industria Automotriz. Finalmente también es posible resaltar que la metodología CRISP-DM es más completa debido a que tiene toda una fase dedicada al entendimiento del negocio. La Tabla 1 muestra un cuadro comparativo entre las diferentes metodologías descriptas hasta aquí.

Metodologías CRISP-DM SEMMA Microsoft Estructura Fases y niveles Fases Fases Niveles Parte de lo general a

lo específico No tiene No tiene

Fases Análisis del problema Análisis de datos Preparación de Datos Modelado Evaluación Explotación

Muestreo Exploración Manipulación Modelado Valoración

Definir el problema Preparar los datos Explorar los datos Generar modelos Explorar y validar los modelos Implementar y actualizar los modelos

Herramientas Genéricas SAS Microsoft Procesos Iterativo e interactivo

entre fases Iterativo e interactivo entre fases

Iterativo e interactivo entre fases

Documentación Modelo de referencia Guía de usuario

No se especifica No se especifica

Objetivos Se centra en los objetivos empresariales del proyecto

Se centra en las características técnicas del desarrollo del proceso

Se centra en los objetivos empresariales del proyecto

Tabla 1: Cuadro comparativo de metodologías

Page 23: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 22 de287 Ing. Hugo Daniel Flores

Page 24: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 23 de287 Ing. Hugo Daniel Flores

4. La metodología CRISP-DM 4.1. Introducción

4.1.1. La Metodología CRISP-DM 4.1.1.1. Interrupción jerárquica La metodología de CRISP-DM está descrita en términos de un modelo de proceso jerárquico consistente en un conjunto de tareas descritas en cuatro niveles de abstracción (de lo general a lo específico): fase, tarea genérica, tarea especializada, e instancia de procesos. (Ver figura 4.)

Figura 4: Cuatro niveles de interrupción de la metodología CRISP-DM En el nivel superior, el proceso de minería de datos es organizado en un número de fases; cada fase consiste de varias tareas genéricas de segundo nivel. Este segundo nivel es llamado genérico porque esta destinado a ser bastante general para cubrir todas las situaciones posibles de minería de datos. Las tareas genéricas están destinadas a ser tan completas y estables como sea posible. Completo significa que cubre tanto al proceso entero de minería de datos como todas las aplicaciones de minería de datos posibles. Estable significa que el modelo debería ser válido para acontecimientos normales y aún para desarrollos imprevistos como técnicas de modelado nuevo. El tercer nivel, el nivel de tarea especializado, es el lugar para describir como las acciones en las tareas genéricas deberían ser realizadas en ciertas situaciones específicas. Por ejemplo, en el segundo nivel podría haber una tarea genérica llamada limpieza de datos. El tercer nivel describe como esta tarea se distingue en situaciones diferentes, como la limpieza de valores numéricos contra la limpieza de valores categóricos, o si el tipo de problema es de agrupamiento o de modelado predictivo. La descripción de fases y tareas como pasos discretos realizados en un orden específico representa una secuencia idealizada de eventos. En la práctica, muchas de las tareas pueden ser realizadas en un orden diferente, y esto a menudo es necesario para volver a hacer tareas anteriores repetidamente y repetir ciertas acciones. Este modelo

Page 25: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 24 de287 Ing. Hugo Daniel Flores

de proceso no intenta capturar todas estas posibles rutas del proceso de la minería de datos porque esto requeriría un modelo de proceso demasiado complejo. El cuarto nivel, la instancia de proceso, es un registro de las acciones, decisiones, y de los resultados de una minería de datos real. Una instancia de proceso esta organizado según las tareas definidas en los niveles más altos, pero representa más bien lo que en realidad sucede en un caso particular que lo que sucede en general. 4.1.1.2. Modelo de referencia y guía de usuario Horizontalmente, la metodología de CRISP-DM distingue entre el modelo de referencia y la guía de usuario. El modelo de referencia presenta una descripción rápida de fases, las tareas, y sus salidas, y describe que hacer en el proyecto de minería de datos. La guía de usuario da consejos más detallados e insinuaciones para cada fase y cada tarea dentro de una fase, y representa como realizar un proyecto de minería de datos. 4.1.2. Pasaje de modelos genéricos a modelos especializados 4.1.2.1. Contexto de la minería de datos El contexto de minería de datos traza un mapa entre lo genérico y el nivel especializado en CRISP-DM. Actualmente se distinguen cuatro dimensiones diferentes de contextos de minería de datos:

• El dominio de aplicación es el área específica en la que el proyecto de minería de datos toma lugar.

• Los tipos de problemas de minería de datos describen la(s) clase(s) específica(s) de objetivo(s) con el que el proyecto de minería de datos trata.

• El aspecto técnico cubre cuestiones específicas en minería de datos que describe diferentes (técnicas) dificultades que por lo general ocurren durante la minería de datos.

• La herramienta y las especificaciones de dimensión técnica en la que las herramienta(s) de minería de datos y/o técnicas son aplicadas durante el proyecto de minería de datos.

La Tabla 2 resume estas dimensiones de contextos de minería de datos y muestra ejemplos específicos para cada dimensión.

Contexto Data Mining

Dimensión Dominio

Aplicación Tipo

Problema Data Mining

Aspecto Técnico

Herramienta y Técnica

Ejemplos

Modelar Respuesta Descripción y sumarización

Valores por omisión

Clementine

Realizar Predicción Segmentación Outliers Mineset Realizar Predicción Descripción

Concepto Outliers Decision Tree

Clasificación Decision Tree Predicción Análisis

Dependencia

Tabla 2: Dimensión de contextos y ejemplos de minería de datos

Page 26: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 25 de287 Ing. Hugo Daniel Flores

Un contexto específico de minería de datos es un valor concreto para una o más de estas dimensiones. Por ejemplo, un proyecto de minería de datos tratando con un problema de clasificación que se revuelve con la predicción constituye un contexto específico. Lo más específico (los valores) para las dimensiones de contextos diferentes son fijadas (especificadas), lo mas concreto es el contexto de minería de datos. 4.1.2.2. Pasaje con contextos Se distinguen dos tipos diferentes de pasajes (plan) entre el nivel genérico y un especializado en el CRISP-DM:

• Pasaje para el presente: Si sólo se aplica el modelo de proceso genérico para realizar un proyecto de minería simple e intentar pasar de tareas genéricas y sus descripciones al proyecto específico como requerido, se habla sobre un pasaje solo para (probablemente) un solo uso.

• Pasaje para el futuro: Si sistemáticamente se especializa el modelo de proceso genérico

según un contexto predefinido (o se analiza sistemáticamente de modo similar y consolidando las experiencias de un único proyecto hacia un modelo de proceso especializado para el uso futuro en contextos comparables), se habla explícitamente de la sobre escritura de un modelo de proceso especializado en términos de CRISP-DM.

Cualquiera de los tipos de trazados es apropiado según sus propios objetivos, depende de su contexto de minería de datos específicos y las necesidades de su organización. 4.1.2.3. Pasaje La estrategia básica para pasar un mapa del modelo de proceso genérico al nivel especializado es la misma para ambos tipos de pasaje:

• Analizar su contexto específico. • Quitar cualquier detalle no aplicable a su contexto. • Agregar cualquier detalle específico a su contexto. • Especializar (o instanciar) el contenido genérico según las características concretas de su

contexto. • Renombrar el contenido genérico posible para proporcionar significados más explícitos en

su contexto para la aclaración. 4.2. El modelo de referencia CRISP-DM El modelo de proceso corriente para la minería de datos proporciona una descripción del ciclo de vida del proyecto de minería de datos. Este contiene las fases de un proyecto, sus tareas respectivas, y las relaciones entre estas tareas. En este nivel de descripción, no es posible identificar todas las relaciones. Las relaciones podrían existir entre cualquier tarea de minería de datos según los objetivos, el contexto, y -lo más importante- el interés del usuario sobre los datos. El ciclo de vida del proyecto de minería de datos consiste en seis fases, se muestran en la Figura 2 (Fases del proceso de modelado metodología CRISP-DM). La secuencia de las fases no es rígida.

Page 27: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 26 de287 Ing. Hugo Daniel Flores

El movimiento hacia adelante y hacia atrás entre fases diferentes es siempre requerido. El resultado de cada fase determina que la fase o la tarea particular de una fase tienen que ser realizados después. Las flechas indican las más importantes y frecuentes dependencias entre fases. El círculo externo en la Figura 2 simboliza la naturaleza cíclica de la minería de datos. La minería de datos no se termina una vez que la solución es desplegada. Las informaciones ocultas (lecciones ocultas) durante el proceso y la solución desplegada pueden provocar nuevas y a menudo más preguntas enfocadas en el negocio. Los procesos de minería subsecuentes se beneficiarán de las experiencias previas. A continuación se describe brevemente cada fase:

• Comprensión del Negocio: Esta fase inicial se enfoca en la comprensión de los objetivos de proyecto y exigencias desde una perspectiva de negocio, luego se convierte este conocimiento de los datos en la definición de un problema de minería de datos y en un plan preliminar diseñado para alcanzar los objetivos.

• Comprensión de los datos: La fase de entendimiento de datos comienza con la colección de datos inicial y continúa con las actividades que permiten familiarizarse con los datos, identificar los problemas de calidad de datos, descubrir los primeros conocimientos en los datos, y/o descubrir subconjuntos interesantes para formar hipótesis en cuanto a la información oculta.

• Preparación de Datos: La fase de Preparación de Datos cubre todas las actividades necesarias para construir el conjunto de datos final (los datos que serán provistos por las herramientas de modelado) de los datos en bruto iniciales. Las tareas de Preparación de Datos probablemente van a ser realizadas muchas veces y no en cualquier orden prescripto. Las tareas incluyen la selección de tablas, registros y atributos, así como la transformación y la limpieza de datos para las herramientas que modelan.

• Modelado: En esta fase, varias técnicas de modelado son seleccionadas y aplicadas, y sus parámetros son calibrados a valores óptimos. Típicamente hay varias técnicas para el mismo tipo de problema de minería de datos. Algunas técnicas tienen requerimientos específicos sobre la forma de datos. Por lo tanto, volver a la fase de Preparación de Datos es a menudo necesario.

• Evaluación: En esta etapa en el proyecto, se ha construido un modelo (o modelos) que parece tener una alta calidad de la perspectiva de análisis de datos. Antes de proceder al despliegue final del modelo es importante evaluar a fondo el modelo y la revisión de los pasos ejecutados para crearlo para comparar el modelo correctamente obtenido con los objetivos de negocio. Un objetivo clave es determinar si hay alguna cuestión importante de negocio que no ha sido suficientemente considerada. En el final de esta fase, una decisión en el uso de los resultados de minería de datos debería ser tomada.

• Desarrollo: La creación del modelo no es generalmente el final del proyecto. Incluso si el objetivo del modelo es de aumentar el conocimiento de los datos, el conocimiento ganado debería ser organizado y presentado en el modo en el que el cliente pueda usarlo. Ello a menudo implica la aplicación de modelos "vivos" dentro de un proceso de toma de decisiones de una organización, por ejemplo, en tiempo real la personalización de página Web o la repetida obtención de bases de datos de mercadeo. Dependiendo de los requerimientos, la fase de desarrollo puede ser tan simple como la generación de un informe o tan compleja como la realización repetida de un proceso cruzado de minería de datos a través de la empresa. En muchos casos, es el cliente, no el analista de datos, quien lleva el paso de desarrollo. Sin embargo, incluso si el analista realizara el esfuerzo de despliegue, esto es importante para el cliente para entender que acciones necesitan ser ejecutadas en orden para hacer uso de los modelos creados en ese momento.

Page 28: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 27 de287 Ing. Hugo Daniel Flores

La figura 5 presenta un contexto de fases acompañadas por tareas genéricas y las salidas. En las secciones siguientes, se describen cada tarea genérica y sus salidas más detalladamente. La atención es enfocada en descripciones de tarea y resúmenes de salidas.

Figura 5: Tareas genéricas y salidas del modelo de referencia CRISP-DM 4.2.1. Comprensión del Negocio La primera etapa de la metodología apunta a la comprensión de los objetivos del proyecto desde el punto de vista de los objetivos de negocio. En función del conocimiento obtenido del negocio se plantea un problema de minería de datos. En esta etapa se desarrollan los pasos preliminares para lograr los objetivos del negocio con herramientas de minería de datos.

Page 29: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 28 de287 Ing. Hugo Daniel Flores

Figura 6: Comprensión del Negocio 4.2.1.1. Determinación de objetivos de negocio Tarea: Determinar los objetivos de negocio El primer objetivo para un contexto es entender desde una perspectiva de negocio lo que el cliente realmente quiere lograr. A menudo el cliente tiene muchos objetivos que compiten y restricciones que deben ser correctamente equilibrados. El objetivo debe ser mostrar (destapar) factores importantes, al principio esto puede influir en el resultado del proyecto. Una consecuencia posible de la negligencia de este paso es gastar un gran esfuerzo produciendo respuestas correctas a preguntas incorrectas o erradas. Salida: Contexto Se registra la información que se conoce sobre la situación de negocio de la organización en el principio del proyecto. Objetivos de negocio Se describe el objetivo primario del cliente, desde una perspectiva de negocio. Además de los objetivos del negocio primario allí hay típicamente otras preguntas de negocio relacionadas con lo que al cliente le gustaría administrar. Por ejemplo, el objetivo primario del negocio podría ser mantener a clientes corrientes por predicción cuando ellos son propensos a moverse a un competidor. Los ejemplos de preguntas relacionadas de negocio son ¿Cómo el uso del canal

Page 30: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 29 de287 Ing. Hugo Daniel Flores

primario (por ejemplo, ATM, visita al negocio, Internet) afecta si los clientes se quedan o se van? o ¿Bajar los honorarios de ATM considerablemente reducirá el número de los clientes más importante que se irán? Criterios de éxito de negocio Se describen los criterios para un resultado acertado o útil al proyecto desde el punto de vista del negocio. Esto podría ser bastante específico y capaz de ser medido objetivamente, por ejemplo, la reducción de clientes se revuelve a un cierto nivel o valor, o esto podría ser general y subjetivo, como “dar ideas útiles en las relaciones”. En este último caso, debería indicarse quien hace el juicio subjetivo. 4.2.1.2. Evaluación de la situación Tarea: Evaluar la situación Esta tarea implica la investigación más detallada sobre todos los recursos, restricciones, presunciones, y otros factores que deberían ser considerados en la determinación del objetivo de análisis de datos y el plan de proyecto. En la tarea anterior, su objetivo es ponerse rápidamente al día con la situación. Aquí se quiere ampliar sobre los detalles. Salida: Inventario de recursos Se listan los recursos disponibles para el proyecto, incluyendo el personal (expertos de negocio, expertos de datos, soportes técnicos, expertos en minería de datos), datos (extractos fijos, aproximaciones a la vida real, almacenes de datos, o datos operacionales), recursos computacionales (plataformas de hardware), y software (herramientas de minería de datos, otros software relevantes). Requerimientos, presunciones, y restricciones Se listan todos los requerimientos del proyecto, incluyendo el programa de terminación, la comprensibilidad y calidad de los resultados, y la seguridad, así como las cuestiones legales. Como parte de esta salida se debe asegurar que se permita usar los datos. Se listan las presunciones hechas por el proyecto. Estas pueden ser presunciones sobre los datos que pueden ser verificados durante la minería de datos, pero también puede incluir presunciones no comprobables sobre el negocio relacionado con el proyecto. Es en particular importante listar si esto afectará la validez de los resultados. Se listan las restricciones sobre el proyecto. Estas pueden ser restricciones sobre la disponibilidad de recursos, pero puede también incluir coacciones tecnológicas como el tamaño de conjunto de datos lo que es práctico para usar el modelado. Riesgos y contingencias Se listan los riesgos o los acontecimientos que podrían retrasar el proyecto o hacer que falle. Se listan los planes de contingencia correspondientes, que acción será tomada si estos riesgos o acontecimientos ocurren.

Page 31: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 30 de287 Ing. Hugo Daniel Flores

Terminología Se compila un glosario de terminología relevante al proyecto. Esto puede incluir dos componentes: (1) Un glosario de terminología relevante del negocio, que forma parte de la comprensión del negocio disponible al proyecto. La construcción de este glosario es una útil “evocación al conocimiento” y un ejercicio de educación. (2) Un glosario de terminología de minería de datos, ilustrada con ejemplos relevantes al problema del negocio en cuestión. Costos y beneficios Se construye un análisis de costo-beneficio para el proyecto, que compare los gastos del proyecto con los beneficios potenciales al negocio si esto es exitoso. La comparación debería ser tan específica como sea posible. Por ejemplo, usar medidas monetarias en una situación comercial. 4.2.1.3. Determinación de los objetivos de la minería de datos Tarea: Determinar los objetivos de la minería de datos Un objetivo de negocio declara objetivos en la terminología de negocio. Un objetivo de minería de datos declara objetivos de proyecto en términos técnicos. Por ejemplo, el objetivo de negocio podría ser “Aumentar catálogos de ventas a clientes existentes.” Un objetivo de minería de datos podría ser “Predecir cuantas baratijas un cliente comprará, obteniendo datos de sus compras de tres años pasados, información demográfica (edad, sueldo, ciudad, etc.), y el precio del artículo.” Salida: Objetivos de la minería de datos Se describen las salidas intencionadas del proyecto que permiten el logro de los objetivos de negocio. Criterios de éxito de la minería de datos Se definen los criterios de un resultado exitoso para el proyecto en términos técnicos por ejemplo, un cierto nivel de predicción precisa o un perfil de inclinación a comprar con un determinado grado de "elevación". Como con un criterio de éxito de negocio, puede ser necesario describir estos en términos subjetivos, en este caso la persona o las personas que hacen el juicio subjetivo deberían ser identificadas. 4.2.1.4. Producir el plan del proyecto Tarea: Producir el plan del proyecto Se describe el plan intencionado para alcanzar los objetivos de minería de datos y así alcanzar los objetivos de negocio. El plan debería especificar los pasos para ser realizados durante el resto del proyecto, incluyendo la selección inicial de herramientas y técnicas.

Page 32: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 31 de287 Ing. Hugo Daniel Flores

Salida: Plan del Proyecto Se listan las etapas a ser ejecutadas en el proyecto, juntos con su duración, recursos requeridos, entradas, salidas, y dependencias. Donde sea posible, se debe hacer explícita la iteración en gran escala en el proceso de minería de datos. Por ejemplo, las repeticiones del modelado y las fases de evaluación. Como parte del plan de proyecto es también importante analizar dependencias entre la planificación de tiempo y los riesgos. Se marcan los resultados de estos análisis explícitamente en el plan de proyecto, idealmente con acciones y recomendaciones si los riesgos se manifiestan. El plan de proyecto contiene proyectos detallados para cada fase. Se decide en este punto que estrategia de evaluación será usada en la fase de evaluación. El plan de proyecto es un documento dinámico debido a que en el final de cada fase son necesarios una revisión del progreso y logros y es recomendada una actualización correspondiente del plan de proyecto. Los puntos de revisión específicas para estas actualizaciones son parte del plan del proyecto. Evaluación inicial de herramientas y técnicas En el final de la primera fase, una evaluación inicial de herramientas y técnicas debería ser realizada. Aquí, por ejemplo, se puede seleccionar una herramienta de minería de datos que soporte varios métodos para las distintas etapas del proceso. Es importante evaluar herramientas y técnicas tempranamente en el proceso desde la selección de herramientas y técnicas y esto puede influir en el proyecto entero.

4.2.2. Comprensión de Datos En esta fase se desarrolla el entendimiento de datos y todas aquellas actividades relacionadas con la limpieza de datos, identificación de problemas vinculados con la toma de datos, procedimientos para determinar la calidad de datos y todo lo tendiente a facilitar la familiarización con los datos. A partir de esta etapa se determinan los primeros subconjuntos de datos que pueden contener la información que se está buscando.

Page 33: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 32 de287 Ing. Hugo Daniel Flores

Figura 7: Comprensión de Datos 4.2.2.1. Recolección de datos iniciales Tarea: Recolectar datos iniciales Se adquieren en el proyecto los datos (o el acceso a los datos) listados en los recursos del proyecto. Esta colección inicial incluye carga de datos, si es necesario para la comprensión de los datos. Por ejemplo, si se usa un instrumento específico para la comprensión de los datos, esto perfectamente se entiende para abrir sus datos en esta herramienta. Este esfuerzo posiblemente conduce a los pasos iniciales de Preparación de Datos. Si se adquieren datos de múltiples fuentes, la integración es una cuestión adicional, aquí o más tarde en las fases de Preparación de Datos. Salida: Informe de colección de datos inicial Se lista el conjunto de dato(s) adquirido(s), juntos con sus posiciones, los métodos usados para adquirirlos, y algunos de los problemas encontrados. Se registran los problemas encontrados y algunas de las resoluciones alcanzadas. Esto ayuda a la réplica (observación) futura del proyecto o a la ejecución de proyectos similares futuros.

Page 34: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 33 de287 Ing. Hugo Daniel Flores

4.2.2.2. Describir los datos Tarea: Describir los datos Se examinan las propiedades "gruesas" o "superficiales" de los datos e informes adquiridos en los resultados. Salida: Informe de descripción de datos Se describen los datos que han sido adquiridos, incluyendo su formato, la cantidad de datos (por ejemplo, el número de registros y campos en cada tabla), los identificadores de los campos, y cualquier otro rasgo superficial que ha sido descubierto. Se evalúa si los datos adquiridos satisfacen las exigencias relevantes. 4.2.2.3. Explorar los datos Tarea: Explorar los datos Esta tarea dirige interrogantes de minería de datos usando preguntas, visualización, y técnicas de reporte. Estos incluyen la distribución de atributos claves (por ejemplo, el atributo objetivo de una tarea de predicción) relacionados entre pares o pequeños números de atributos, los resultados de simples agregaciones, las propiedades de las subpoblaciones significativas, y análisis estadísticos simples. Estos análisis directamente pueden dirigir los objetivos de minería de datos; ellos también pueden contribuir o refinar la descripción de datos e informes de calidad, y alimentar en la transformación y otros pasos de Preparación de Datos necesarios para análisis futuros. Salida: Informe de exploración de datos Se describen los resultados de esta tarea, incluyendo primeras conclusiones o hipótesis iniciales y su impacto sobre el resto del proyecto. Si es apropiado, se pueden incluir gráficos y plots para indicar las características de datos que sugieren más examen de subconjuntos de datos interesantes. 4.2.2.4. Verificar la calidad de los datos Tarea: Verificar la calidad de los datos Se examina la calidad de los datos, dirigiendo preguntas como: ¿Los datos están completos? ¿Esto cubre todo los casos requeridos? ¿Son correctos, o estos contienen errores y, si hay errores, que tan comunes son estos? ¿Hay valores omitidos en los datos? Si es así, ¿como se representan estos, donde ocurre esto, y que tan comunes son estos? Salida: Informe de calidad de datos Se listan los resultados de la verificación de calidad de datos; si existen problemas de calidad, se listan las posibles soluciones. Las soluciones a los problemas de calidad de datos generalmente dependen tanto del conocimiento de los datos como del negocio.

4.2.3. Preparación de Datos

Page 35: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 34 de287 Ing. Hugo Daniel Flores

En esta etapa se desarrollan las actividades para construir el conjunto de datos final. Aquí se relaciona directamente el formato de los datos obtenidos con las herramientas de minería de datos a utilizar. La tarea de Preparación de Datos probablemente será desarrollada en más de una fase en paralelo a lo largo de todo el proyecto. Esta fase y sus tareas están vinculados con los aspectos técnicos de sistemas como lo son las base de datos, tablas, registros, documentos electrónicos y todos los programas / procesos para la transformación de los datos en información utilizable por los modelos de minería de datos.

Figura 8: Preparación de Datos Salida: Conjunto de datos Este es el conjunto (o conjuntos) producido por la fase de Preparación de Datos, que es usada para modelar o para el trabajo principal de análisis del proyecto.

Page 36: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 35 de287 Ing. Hugo Daniel Flores

Descripción del conjunto de datos Se describe el conjunto de datos (o conjuntos) que es usado para el modelado y el trabajo principal de análisis del proyecto. 4.2.3.1. Selección de datos Tarea: Seleccionar datos Se decide si los datos son usados para el análisis. Los criterios incluyen tanto la importancia a los objetivos de la minería de datos, la calidad, y las restricciones técnicas como los límites sobre el volumen de datos o los tipos de datos. La selección de datos puede cubrir tanto la selección de atributos (columnas) como la selección de registros (filas) en una tabla. Salida: Razonamiento para la inclusión/exclusión Se listan los datos para ser incluidos o excluidos y los motivos para estas decisiones. 4.2.3.2. Limpieza de datos Tarea: Limpiar datos Se eleva la calidad de los datos al nivel requerido por las técnicas de análisis seleccionadas. Esto puede implicar la selección de los subconjuntos de datos limpios, la inserción de datos por defecto adecuados, o técnicas más ambiciosas tales como la estimación de datos faltantes mediante modelado. Salida: Informe de la limpieza de los datos Se describe que decisiones y acciones fueron tomadas para dirigir los problemas de calidad de datos informados durante la tarea de Verificación de Calidad de Datos de la fase de Comprensión de Datos. Las transformaciones de los datos para una apropiada limpieza y el posible impacto en el análisis de resultados deberían ser considerados. 4.2.3.3. Construir datos Tarea: Construir datos Esta tarea incluye la construcción de operaciones de preparación de datos tales como la producción de atributos derivados o el ingreso de nuevos registros, o la transformación de valores para atributos existentes. Salidas: Atributos derivados Los atributos derivados son los atributos nuevos que son construidos de uno o más atributos existentes en el mismo registro. Ejemplo: área = longitud x anchura.

Page 37: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 36 de287 Ing. Hugo Daniel Flores

Registros generados Se describe la creación de registros completamente nuevos. Ejemplo: Crear registros para los clientes quienes no hicieron compras durante el año pasado. No habría ninguna razón de tener tales registros en los datos brutos, pero para el objetivo del modelado esto podría tener sentido para representar explícitamente el hecho que ciertos clientes no hayan hecho ninguna compra. 4.2.3.4. Integrar datos Tarea: Integrar datos Estos son los métodos por el cual la información es combinada desde múltiples tablas o registros para crear nuevos registros o valores. Salida: Combinación de datos La combinación de tablas se refiere a la unión simultánea de dos o más tablas que tienen información diferente sobre el mismo objeto. Ejemplo: una cadena de venta al público tiene una tabla con la información sobre las características generales de cada tienda (por ejemplo, el espacio, el tipo de comercio), otra tabla con datos resumidos de las ventas (por ejemplo, el beneficio, el cambio porcentual en ventas desde el año anterior), y la otra con información sobre los datos demográficos del área circundante. Cada una de estas tablas contiene un registro para cada tienda. Estas tablas pueden ser combinadas simultáneamente en una nueva tabla con un registro para cada tienda, combinando campos de las tablas fuentes. Los datos combinados también cubren agregaciones. La agregación se refiere a operaciones en la que nuevos valores de información resumida son calculados desde múltiples registros y/o tablas. Por ejemplo, convirtiendo una tabla de compra de clientes donde hay un registro para cada compra en una tabla nueva donde hay un registro para cada cliente, con campos tales como el número de compras, el promedio de la cantidad de compra, el porcentaje de ordenes cobrados a tarjeta de crédito, el porcentaje de artículos bajo promoción, etc. 4.2.3.5. Formatear datos Tarea: Formatear datos Se refiere a modificaciones principalmente sintácticas hechas a los datos que no cambian su significado, pero podría ser requerido por la herramienta de modelado. Salida: Datos reformateados Algunas herramientas tienen requerimientos sobre el orden de los atributos, tales como el primer campo que es un único identificador para cada registro o el último campo que es el campo resultado que el modelo debe predecir. Podría ser importante cambiar el orden de los registros en el conjunto de datos. Quizás la herramienta de modelado requiere que los registros sean clasificados según el valor del atributo de resultado.

Page 38: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 37 de287 Ing. Hugo Daniel Flores

Comúnmente, los registros del conjunto de datos son ordenados al principio de algún modo, pero el algoritmo que modela necesita que ellos estén en un orden moderadamente arbitrario. Por ejemplo, cuando se usan redes neuronales, esto es generalmente mejor para los registros para ser presentados en un orden aleatorio, aunque algunas herramientas manejen esto automáticamente sin la intervención explicita del usuario. Además, hay cambios puramente sintácticos hechos para satisfacer las exigencias de la herramienta de modelado específica. Ejemplos: el quitar las comas de adentro de campos de texto en ficheros de datos delimitados por coma, cortar todos los valores a un máximo de 32 caracteres.

4.2.4. Modelado En esta fase se eligen diferentes técnicas de modelado de datos y se estudian y ajustan parámetros con los valores correctos para el proyecto. Existen en el universo tecnológico muchas técnicas para la resolución del mismo problema de minería de datos. Es altamente probable que desde el modelado sea necesario volver a la fase de preparación de datos puesto que todas las técnicas en evaluación pueden tener requisitos de formato de datos diferentes. Durante esta etapa los datos son procesados más de una vez posiblemente por cada herramienta.

Figura 9: Modelado

Page 39: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 38 de287 Ing. Hugo Daniel Flores

4.2.4.1. Selección de la técnica de modelado Tarea: Escoger la técnica de modelado Como primer paso en modelado, se debe seleccionar la técnica de modelado real que va a ser usado. Aunque se haya podido seleccionar una herramienta durante la fase de Comprensión del Negocio, esta tarea se refiere a la técnica de modelado específico, por ejemplo, un árbol de decisión construido con C4.5, o la generación de redes neuronales Back-Propagación. Si múltiples técnicas son aplicadas, se realiza esta tarea separadamente para cada técnica. Salida: Técnicas de modelado Se documenta la técnica de modelado real que se está por usar. Presunciones del modelado Muchas técnicas de modelado hacen presunciones específicas sobre los datos como por ejemplo que todos los atributos tengan distribuciones uniformes, no encontrar valores no permitidos, el atributo de clase debe ser simbólico, etc. Se debe registrar cualquiera de tales presunciones hechas. 4.2.4.2. Generación de la prueba de diseño Tarea: Generar la prueba de diseño Antes de construir un modelo, se debe generar un procedimiento o el mecanismo para probar la calidad y validez del modelo. Por ejemplo, en tareas de minería de datos supervisados como la clasificación, es común usar tasas de errores como medida de calidad para modelos de minería de datos. Por lo tanto, típicamente se separa el conjunto de datos en una serie y en un conjunto de prueba construimos el modelo sobre el conjunto de series, y se estima su calidad sobre el conjunto de prueba separado. Salida: Prueba de diseño Se describe el plan intencionado para el entrenamiento, la prueba, y la evaluación de los modelos. Un componente primario del plan determina como dividir un conjunto de datos disponible en datos de entrenamiento, datos de prueba, y conjunto de datos de validación. 4.2.4.3. Construcción del modelo Tarea: Construir el modelo Se ejecuta la herramienta de modelado sobre el conjunto de datos preparados para crear uno o más modelos. Salidas: Parámetros de ajustes

Page 40: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 39 de287 Ing. Hugo Daniel Flores

Con cualquier herramienta de modelado, hay a menudo un gran número de parámetros que pueden ser ajustados. Se listan los parámetros y sus valores escogidos, también con el razonamiento para elegir los parámetros de ajustes. Modelos Estos son los modelos reales producidos por la herramienta de modelado, no un informe. Descripciones del modelo Se describen los modelos obtenidos. Se informa sobre la interpretación de los modelos y se documenta cualquier dificultad encontrada con sus significados. 4.2.4.4. Evaluación del modelo Tarea: Evaluar el modelo Se interpretan los modelos según su conocimiento de dominio, los criterios de éxitos de minería de datos, y el diseño de prueba deseado. Se juzga el éxito de la aplicación del modelado y se descubren técnicas mas técnicamente; se necesita tomar contacto con analistas de negocio y expertos en el dominio luego para hablar de los resultados de la minería de datos en el contexto de negocio. Se nota que esta tarea sólo se considera para modelos, mientras que la fase de evaluación también toma en cuenta todos los otros resultados que fueron producidos en el curso del proyecto. Se intenta clasificar los modelos. Se evalúan los modelos según los criterios de evaluación. Tanto como es posible, también se tiene en cuenta objetivos del negocio y criterios de éxito de negocio. En los grandes proyectos de minería de datos, se aplica una sola técnica más de una vez, o se generan resultados de minería de datos con varias técnicas diferentes. En esta tarea, se comparan todos los resultados según los criterios de evaluación. Salida: Evaluación de modelos Se resumen los resultados de esta tarea, se listan las calidades de los modelos generados (por ejemplo, en términos de exactitud), y se clasifican su calidad en relación con cada uno. Parámetros de ajustes revisados Según la evaluación del modelo, se revisan los parámetros de ajuste para la siguiente corrida en la tarea de Construcción del Modelo. Se repite la construcción y evaluación del modelo hasta que se encuentre el/los mejor/es modelo/s. Se documenta todo, tanto las revisiones como las evaluaciones.

4.2.5. Evaluación Hasta esta fase se han obtenido algunos modelos de minería de datos con sus datos y parámetros establecidos en forma óptima pero antes de pasar a la etapa final es necesario evaluar los resultados obtenidos por la ejecución de los programas en función de los objetivos de negocio. Aquí se puede presentar la necesidad de eliminar, modificar o considerar nuevas cuestiones relacionadas con el negocio. Al final de la fase probablemente se tomarán algunas decisiones.

Page 41: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 40 de287 Ing. Hugo Daniel Flores

Figura 10: Evaluación 4.2.5.1. Evaluación de los resultados Tarea: Evaluar los resultados Los pasos de la evaluación anterior tratan con factores como la exactitud y la generalidad del modelo. Este paso evalúa el grado al que el modelo responde (encuentra) los objetivos de negocio y procura determinar si hay alguna decisión de negocio por el que este modelo es deficiente. Otra opción de evaluación es probar el/los modelo/s sobre aplicaciones de prueba en la aplicación real, si el tiempo y las restricciones de presupuesto lo permiten. Además, la evaluación también verifica otros resultados generados por la minería de datos. Los resultados de la minería de datos implican modelos que necesariamente son relacionados con los objetivos originales de negocio y todas los otros descubrimientos que no son relacionados necesariamente con los objetivos originales de negocio, pero también podría revelar desafíos adicionales, información, o insinuaciones para futuras direcciones. Salida: Evaluación de los resultados de la minería de datos en lo que concierne a criterios de éxito de negocio Se resumen los resultados de evaluación en términos de criterios de éxito de negocio, incluyendo una declaración final en cuanto a si el proyecto ya encuentra los objetivos iniciales de negocio. Modelos aprobados Después de la evaluación de modelos en lo que concierne a criterios de éxito de negocio, los modelos generados que encuentran los criterios seleccionados son los modelos aprobados.

Page 42: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 41 de287 Ing. Hugo Daniel Flores

4.2.5.2. Proceso de revisión Tarea: Revisar el proceso En este punto, los modelos resultantes pasan a ser satisfactorios y a satisfacer las necesidades de negocio. Ahora es apropiado hacer una revisión más cuidadosa de los compromisos de la minería de datos para determinar si hay algún factor importante o tarea que de algún modo ha sido pasada por alto. Esta revisión también cubre cuestiones de calidad como por ejemplo: ¿Se construyó correctamente el modelo? ¿Se usan sólo los atributos que se permitieron usar y que están disponibles para análisis futuros? Salida: Revisión de proceso Se resume la revisión de proceso y se destacan las actividades que han sido omitidas y/o aquellas que deberían ser repetidas. 4.2.5.3. Determinación de los próximos pasos Tarea: Determinar los próximos pasos Según los resultados de la evaluación y la revisión de proceso, se decide como proceder. Se decide si hay que terminar este proyecto y tomar medidas sobre el desarrollo si es apropiado, tanto iniciar más iteraciones, o comenzar nuevos proyectos de minería de datos. Esta tarea incluye los análisis de recursos restantes y del presupuesto, que puede influir en las decisiones. Salida: Lista de posibles acciones Se listan las acciones futuras potenciales, con los motivos a favor y en contra de cada opción. Decisión Se describe la decisión en cuanto a como proceder, junto con el razonamiento. 4.2.6. Desarrollo El final del proyecto no termina con el modelado de datos y su ejecución y posterior evaluación de los resultados puesto que el conocimiento obtenido hasta aquí debe ser presentado de forma clara y precisa a todos los actores dentro de la organización. Se puede presentar un simple informe de resultados, desarrollar una aplicación para la presentación de los resultados o bien instruir al usuario de los modelos para que ellos mismos generen y ejecuten los modelos con nuevos datos. Es importante al final de esta fase tener desarrollada toda la documentación del proyecto para dar independencia al usuario final en la utilización y generación de nuevos procesos de explotación de datos.

Page 43: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 42 de287 Ing. Hugo Daniel Flores

Figura 11: Desarrollo 4.2.6.1. Desarrollo del plan Tarea: Desarrollar el plan De acuerdo al desarrollo de los resultados de minería de datos en el negocio, esta tarea toma los resultados de la evaluación y determina una estrategia para el desarrollo. Si un procedimiento general ha sido identificado para crear el/los modelo/s relevante/s, este procedimiento es documentado aquí para el desarrollo posterior. Salida: Desarrollo del plan Resumir la estrategia de desarrollo, incluyendo los pasos necesarios y como realizarlos. 4.2.6.2. Plan de supervisión y mantenimiento Tarea: Planear la supervisión y el mantenimiento La supervisión y el mantenimiento son cuestiones importantes si los resultados de minería de datos son parte del negocio cotidiano y de su ambiente. La preparación cuidadosa de una estrategia de mantenimiento ayuda a evitar largos periodos innecesarios de uso incorrecto de resultados de minería de datos. Para supervisar el desarrollo de los resultados de la minería de datos, el proyecto necesita un plan detallado de proceso de supervisión. Este plan tiene en cuenta el tipo específico de desarrollo.

Page 44: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 43 de287 Ing. Hugo Daniel Flores

Salida: Supervisión y plan de mantenimiento Se resume la estrategia de supervisión y mantenimiento incluyendo los pasos necesarios y como realizarlos. 4.2.6.3. Informe definitivo de producto Tarea: Producir el informe final En el final del proyecto, se sobrescribe un informe final. Según el plan de desarrollo, este informe puede ser sólo un resumen del proyecto y sus experiencias (si éstas aún no han sido documentadas como una actividad en curso) o ésta puede ser una presentación final y comprensiva de los resultados de minería de datos. Salidas: Informe definitivo Esto es el informe escrito final del compromiso de la minería de datos. Esto incluye todo el desarrollo anterior, el resumen y la organización de los resultados. Presentación final También a menudo habrá una reunión en la conclusión del proyecto en el que los resultados son presentados verbalmente al cliente. 4.2.6.4. Revisión del proyecto Tarea: Revisar el proyecto Se evalúa lo que fue correcto y lo que se equivocó, lo que fue bien hecho y lo que necesita ser mejorado. Salida: Documentación de la experiencia Se resumen las experiencias importantes ganadas durante el proyecto. Por ejemplo, trampas, accesos engañosos, o las insinuaciones para seleccionar las mejores técnicas de minería de datos en situaciones similares podrían ser la parte de esta documentación. En proyectos ideales, la documentación de la experiencia también cubre cualquier informe que ha sido escrito por miembros individuales del proyecto durante las fases del proyecto y sus tareas. 4.3. La guía de usuario de CRISP-DM

4.3.1. Comprendiendo el negocio 4.3.1.1. Determinación de objetivos de negocio Tarea: Determinar objetivos de negocio El primer objetivo es comprender a fondo, desde una perspectiva de negocio, lo que el cliente realmente quiere lograr. A menudo el cliente tiene muchos objetivos y restricciones que compiten que deben ser correctamente equilibrados. El objetivo debe ser destapar factores importantes en el

Page 45: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 44 de287 Ing. Hugo Daniel Flores

principio del proyecto esto puede influir en el resultado final. Una consecuencia probable de descuidar este paso puede ser a expensas de un gran esfuerzo de producir las respuestas correctas a las preguntas incorrectas. Salida: Contexto Se debe cotejar la información sobre la situación de negocio de la organización al principio del proyecto. Estos detalles no sólo sirven para identificar más estrechamente los objetivos de negocio a ser alcanzados, sino también sirven para identificar los recursos, tanto humanos como materiales, que pueden ser usados durante el curso del proyecto. Actividades: Organizar

• Desarrollar organigramas que identifiquen divisiones, departamentos, y grupos de proyectos. El organigrama debería también identificar los nombres de los gerentes y sus responsabilidades.

• Identificar a personas claves en el negocio y sus roles. • Identificar a un patrocinador interno (el patrocinador financiero y el experto primario del

dominio de usuario). • Indicar si hay un comité de dirección y lista de miembros. • Identificar las unidades de negocio que son afectadas por el proyecto de minería de datos

(por ejemplo, el Control de comercialización, Ventas, Finanzas). Área del problema

• Identificar el área del problema (por ejemplo, el control de comercialización, el cuidado de cliente, el desarrollo comercial, etc.).

• Describir el problema en términos generales. • Comprobar el estado actual del proyecto (por ejemplo, comprobar si ya esta claro que dentro

de la unidad de negocio un proyecto de minería de datos debe ser realizado, o si la minería de datos necesita ser promovida como una tecnología clave en el negocio).

• Clarificar los requisitos previos del proyecto (por ejemplo, ¿Cuál es la motivación del proyecto? ¿La minería de datos ya está siendo usada en el negocio?).

• Si es necesario, preparar presentaciones y demostraciones de minería de datos para el negocio.

• Identificar grupos de objetivos para el resultado de proyecto (por ejemplo, ¿Se espera entregar un informe para la dirección superior o un sistema operacional para ser usado por usuarios finales inexpertos?).

• Identificar las necesidades de los usuarios y sus expectativas. Solución actual

• Describir cualquier solución usada actualmente para dirigir el problema. • Describir las ventajas y las desventajas de la solución corriente y el nivel al que esto es

aceptado por los usuarios.

Page 46: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 45 de287 Ing. Hugo Daniel Flores

Salida: Objetivos de negocio Describir el objetivo primario del cliente, desde una perspectiva de negocio. Además del objetivo de negocio primario, hay típicamente un gran número de preguntas relacionadas al negocio a las que al cliente le gustaría dirigir. Por ejemplo, el objetivo primario de negocio podría ser mantener a clientes actuales por predicción cuando ellos son propensos a moverse a un competidor, mientras un objetivo secundario de negocio podría ser el de determinar si precios (comisiones) inferiores afectan sólo un a segmento particular de clientes. Actividades

• De manera informal describir el problema a ser solucionado. • Especificar todas las preguntas de negocio tan precisas como sea posible. • Especificar cualquier otras exigencias de negocio (por ejemplo, el negocio no quiere perder

a ningún cliente). • Especificar las ventajas esperadas en términos de negocio.

Se debe tener cuidado Se debe tener cuidado de establecer objetivos inalcanzables. Deben ser tan realistas como posibles y hechos por ellos. Salida: Criterios de éxito de negocio Describir los criterios para un resultado exitoso o útil al proyecto desde el punto de vista del negocio. Esto podría ser bastante específico y fácilmente medible, como una reducción de cliente a un cierto grado, o general y subjetivo, como “dar ideas útiles en las relaciones”. En el caso último, se debe estar seguro de indicar quien haría el juicio subjetivo. Actividades

• Especificar criterios de éxito de negocio (por ejemplo, Mejorar la tasa de respuesta en una campaña de correo en el 10 por ciento y marcar la tasa en el 20 por ciento).

• Identificar quien evalúa los criterios de éxito. Se debe recordar Cada uno de los criterios de éxito debería relacionarse con al menos uno de los objetivos especificados de negocio. Se recomienda Antes del comienzo de la evaluación de situación, se podría analizar las experiencias anteriores del problema. Internamente, usando CRISP-DM, o externamente, usando soluciones pre-empaquetadas.

Page 47: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 46 de287 Ing. Hugo Daniel Flores

4.3.1.2. Evaluación de la situación Tarea: Evaluar la situación Esta tarea implica una investigación más detallada sobre todos los recursos, restricciones, presunciones, y otros factores que deberían ser considerados en la determinación del objetivo de análisis de datos y en el desarrollo del plan de proyecto. Salida: Inventario de recursos Listar los recursos disponibles para el proyecto, incluyendo el personal (expertos de datos y de negocios, soportes técnicos, expertos en minería de datos), datos (extracciones fijas, acceso a datos existentes en almacenes de datos u operacionales), recursos computacionales (plataformas de hardware), y software (instrumentos de minería de datos, otros software relevantes). Actividades: Recursos de Hardware

• Identificar el hardware básico. • Establecer la disponibilidad del hardware básico para el proyecto de minería de datos. • Comprobar si la planificación del mantenimiento de hardware se opone a la disponibilidad

del hardware para el proyecto de minería de datos. • Identificar el hardware disponible para ser usado por la herramienta de minería de datos (si

el instrumento es conocido en esta etapa). Fuentes de datos y conocimientos

• Identificar las fuentes de datos. • Identificar el tipo de fuentes de datos (fuentes en línea, expertos, documentación escrita,

etc.). • Identificar fuentes de conocimiento. • Identificar el tipo de fuentes de conocimientos (fuentes en línea, expertos, documentación

escrita, etc.). • Comprobar herramientas disponibles y técnicas. • Describir el conocimiento de generalidades relevantes (de manera informal o formal).

Fuentes de personal

• Identificar al patrocinador del proyecto. • Identificar al administrador de sistema, el administrador de base de datos, y el personal de

soporte técnico para futuras preguntas. • Identificar al analista de mercado, los expertos en minería de datos, y estadísticos, y

comprobar su disponibilidad. • Comprobar la disponibilidad de expertos de dominio para fases posteriores

Se debe recordar Se debe recordar que el proyecto puede necesitar personal técnico en cualquier momento en todas partes del proyecto, por ejemplo durante la transformación de datos.

Page 48: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 47 de287 Ing. Hugo Daniel Flores

Salidas: Requerimientos, presunciones, y restricciones Listar todos los requerimientos del proyecto, incluyendo la planeación de la terminación, la comprensibilidad, y la calidad y seguridad de los resultados, así como cuestiones legales. Como parte de esta salida, se debe asegurar que se permiten usar los datos. Listar las presunciones hechas por el proyecto. Estos pueden ser presunciones sobre los datos, que pueden ser verificados durante la minería de datos, pero también puede incluir presunciones no comprobables relacionadas con el proyecto. Esto es en particular importante de ponerlos en una lista si ellos afectarán la validez de los resultados. Listar las restricciones hechas en el proyecto. Estas restricciones podrían implicar la carencia de recursos para terminar algunas tareas en el proyecto en el tiempo requerido, o pueden ser restricciones legales o éticas sobre el uso de los datos o la solución necesaria para terminar la tarea de minería de datos. Actividades: Requerimientos

• Especificar el perfil del grupo objetivo. • Capturar todos los requerimientos en la planificación. • Capturar los requerimientos de comprensibilidad, exactitud, desarrollar habilidades,

mantenimiento, y repetibilidad del proyecto de minería de datos y los modelos resultantes. • Capturar los requerimientos de seguridad, restricciones legales, de privacidad, información,

y planificación de proyecto. Presunciones

• Aclarar todas las presunciones (incluyendo las implícitas) y las hechas por ellos explícitamente (por ejemplo, dirigir las cuestiones de negocio, a un número mínimo de clientes con la edad por encima de 50 es necesaria).

• Listar las presunciones sobre calidad de datos (por ejemplo, exactitud, disponibilidad) • Listar las presunciones sobre factores externos (por ejemplo, cuestiones económicas,

productos competitivos, avances técnicos). • Aclarar presunciones que conducen a cualquiera de las estimaciones (por ejemplo, el precio

de un instrumento específico es asumido para ser menor que $ 1.000). • Listar todas las presunciones en cuanto a si es necesario entender y describir o explicar el

modelo (por ejemplo, cómo el modelo y los resultados son presentados a la dirección / patrocinador).

Restricciones

• Comprobar restricciones generales (por ejemplo, cuestiones legales, presupuesto, escalas de tiempo, y recursos).

• Comprobar el correcto acceso a fuentes de datos (por ejemplo, restricciones de acceso, la contraseña requerida).

• Comprobar la accesibilidad de técnica de datos (los sistemas operativos, el sistema de administración de datos, el formato de archivo y de base de datos).

• Comprobar si el conocimiento relevante es accesible. • Comprobar restricciones de presupuesto (gastos fijos, gastos de implementación, etc.).

Page 49: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 48 de287 Ing. Hugo Daniel Flores

Se debe recordar La lista de presunciones también incluye presunciones al principio del proyecto, esto es, lo que el punto de inicio del proyecto ha sido. Salidas: Riesgos y contingencias Listar los riesgos, es decir los acontecimientos que podrían ocurrir, impactando en la planificación, el costo, o el resultado. Listar los planes de contingencias respectivos: que acción será tomada para evitar o reducir al mínimo el impacto o recuperarse de la ocurrencia de los riesgos previstos. Actividades: Identificar riesgos

• Identificar riesgos de negocio (por ejemplo, el competidor aparece primero con mejores resultados).

• Identificar riesgos de organización (por ejemplo, el departamento que solicita el proyecto no tiene financiación para el proyecto).

• Identificar riesgos financieros (por ejemplo, aumentar la financiación depende de los resultados iniciales de minería de datos).

• Identificar riesgos técnicos. • Identificar los riesgos que dependen de datos y de las fuentes de datos (por ejemplo, la mala

calidad y cobertura). Desarrollo de planes de contingencia

• Determinar condiciones en las que cada riesgo puede ocurrir. • Desarrollar planes de contingencia.

Salida: Terminología Compilar un glosario de terminología relevante al proyecto. Esto debería incluir al menos dos componentes: (1) Un glosario de terminología relevante de negocio, que forma parte de la comprensión de negocio disponible al proyecto. (2) Un glosario de terminología de minería de datos, ilustrada con ejemplos relevantes al problema de negocio en cuestión. Actividades

• Comprobar la disponibilidad previa de glosarios; sino se debe comenzar a bosquejar glosarios.

• Hablar a expertos de dominio para entender la terminología. • Familiarizarse con la terminología de negocio.

Salida: Costos y beneficios Preparar un análisis de costo-beneficio para el proyecto, comparando los gastos del proyecto con el beneficio potencial para el negocio si esto es exitoso.

Page 50: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 49 de287 Ing. Hugo Daniel Flores

Actividades

• Estimar el costo para la colección de datos. • Estimar el costo de desarrollo y realización de una solución. • Identificar beneficios (por ejemplo, mejorar la satisfacción del cliente, ROI, y el aumento de

las ganancias). • Estimar gastos de operación.

Se recomienda La comparación debería ser tan específica como sea posible, cómo esto permite un mejor caso de negocio para ser realizado. Se debe tener cuidado Se deben identificar costos ocultos, como la extracción y preparación repetida de datos, cambios en los procesos laborales, y tiempo requerido para el entrenamiento. 4.3.1.3. Determinar objetivos de minería de datos Tarea: Determinar objetivos de minería de datos Un objetivo de negocio declara objetivos en la terminología de negocio; un objetivo de minería de datos declara objetivos de proyecto en términos técnicos. Por ejemplo, el objetivo de negocio podría ser, “Aumentar la venta por catalogo a clientes existentes”, mientras un objetivo de minería de datos podría ser, “Predecir cuantas baratijas comprará un cliente, considerando sus compras durante los tres años pasados, información demográfica relevante, y el precio del artículo.” Salida: Objetivos de minería de datos Describir las salidas planeadas del proyecto que permiten el logro de los objetivos de negocio. Se debe tener en cuenta que estas son salidas normalmente técnicas. Actividades

• Traducir las preguntas de negocio a objetivos de minería de datos (por ejemplo, una campaña de control de comercialización requiere la segmentación de clientes para decidir a quien acercarse en esta campaña; el nivel/tamaño de los segmentos deberían ser especificados).

• Especificar datos, tipo de problema de minería de datos (por ejemplo, la clasificación, la descripción, la predicción, y clustering).

Se recomienda Puede ser sabio redefinir el problema. Por ejemplo, modelar la retención de producto más que la retención del cliente cuando la retención del cliente entrega resultados muy tarde para afectar la salida.

Page 51: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 50 de287 Ing. Hugo Daniel Flores

Salida: Criterios de éxitos de minería de datos Definir los criterios para un resultado acertado para el proyecto en términos técnicos, por ejemplo un cierto grado de exactitud predictiva o un perfil de propensión a comprar con un nivel dado "elevación". Cómo con los criterios de éxitos del negocio, puede ser necesario describir estos en términos subjetivos, en el caso de que la persona o las personas que hacen el juicio subjetivo debieran ser identificadas. Actividades

• Especificar los criterios para evaluar el modelo (por ejemplo, la exactitud del modelo, el funcionamiento y la complejidad).

• Definir el patrón de pruebas para los criterios de evaluación. • Especificar las reglas que dirigen criterios de evaluación subjetivos (por ejemplo, la

habilidad de explicar del modelo y de los datos y la comprensión de mercadeo proporcionada por el modelo).

Se debe tener cuidado Los datos que extraen criterios de éxito son diferentes a los criterios de éxito de negocio definidos antes. Se debe recordar Se debe recordar que es sabio planear para el desarrollo desde el principio del proyecto. 4.3.1.4. Producción del plan del proyecto Tarea: Producir el plan del proyecto Describir el plan propuesto para alcanzar los objetivos de minería de datos y así alcanzar los objetivos de negocio. Salida: Plan del Proyecto Listar las etapas para ser ejecutadas en el proyecto, juntos con su duración, recursos requeridos, entradas, salidas, y dependencias. En cualquier parte donde sea posible, se deben hacer explícitas las iteraciones en gran escala en el proceso de minería de datos. Por ejemplo, las repeticiones del modelado y fases de evaluación. Como parte del plan de proyecto, es también importante analizar dependencias entre el planeamiento de los tiempos y los riesgos. Marcar los resultados de estos análisis explícitamente en el plan de proyecto, idealmente con acciones y recomendaciones para actuar si los riesgos son manifestados. Aunque esta sea la única tarea en la que el plan de proyecto directamente es llamado, sin embargo debería ser consultado continuamente y repasado en todas partes del proyecto. Debería ser consultado el plan de proyecto como mínimo siempre que una tarea nueva sea comenzada o una iteración futura de una tarea o una actividad este comenzando.

Page 52: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 51 de287 Ing. Hugo Daniel Flores

Actividades

• Definir el plan de proceso inicial y hablar de la viabilidad con todo el personal incluido. • Combinar todos los objetivos identificados y técnicas seleccionadas en un procedimiento

coherente que solucione las cuestiones del negocio y encuentre los criterios de éxito de negocio.

• Estimar el esfuerzo y los recursos necesarios para alcanzar y desarrollar la solución. Es útil considerar la experiencia de otras personas estimando escalas de tiempo para proyectos de minería de datos. Por ejemplo, es a menudo presumido que el 50-70 por ciento del tiempo y el esfuerzo en un proyecto de minería de datos es usado en la fase de Preparación de Datos, mientras que solo un 20-30 por ciento es usado en la fase de Comprensión de Datos, mientras que solo un 10-20 por ciento es gastado en cada uno de las fase de Modelado, Evaluación, y Comprensión del Negocio y el 5-10 por ciento en la fase de Desarrollo.

• Identificar pasos críticos. • Marcar los puntos de decisión. • Marcar los puntos de revisión. • Identificar las principales iteraciones.

Salida: Evaluación Inicial de herramientas y técnicas Al final de la primera fase, el equipo de proyecto realiza una evaluación inicial de herramientas y técnicas. Aquí, es importante seleccionar una herramienta de minería de datos que soporte varios métodos para las diferentes etapas del proceso, ya que la selección de herramientas y técnicas puede influir en el proyecto entero. Actividades

• Crear una lista de criterios de selección para herramientas y técnicas (o usar uno existente si está disponible).

• Escoger herramientas y técnicas posibles. • Evaluar la adecuación de técnicas. • Revisar y priorizar técnicas aplicables según la evaluación de soluciones alternativas

4.3.2. Comprensión de Datos 4.3.2.1. Recolección de datos iniciales Tarea: Recoger datos iniciales Obtener los datos (o el acceso a los datos) listados en los recursos de proyecto. Esta colección inicial incluye carga de datos, si es necesario para la Comprensión de Datos. Por ejemplo, si se tiene la intención de usar una herramienta específica para comprender los datos es lógico cargar los datos en esta herramienta. Salida: Informe de la recolección de datos inicial Se debe describir toda la variedad de datos usados para el proyecto, e incluir cualquier requerimiento de selección para datos más detallados. El informe de colección de datos también debería definir si algunos atributos son relativamente más importantes que otros.

Page 53: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 52 de287 Ing. Hugo Daniel Flores

Se debe recordar que cualquier evaluación de calidad de datos debería ser hecha no solamente de las fuentes de datos individuales, sino también de algunos datos que son resultado de fuentes de datos que se combinan. Por inconsistencias entre las fuentes, los datos combinados pueden presentar los problemas que no existen en las fuentes de datos individuales. Actividades: Planificación de requerimientos de datos Se debe planear que información es necesaria (por ejemplo, sólo para atributos determinados, o la información adicional específica). Comprobar si toda la información necesaria (para resolver los objetivos de la minería de datos) esta en realidad disponible. Criterios de selección

• Se debe especificar los criterios de selección (por ejemplo, ¿Qué atributos son necesarios para los objetivos específicos de minería de datos? ¿Que atributos han sido identificados como no pertinentes? ¿Cuantos atributos se pueden manejar con las técnicas escogidas?).

• Elegir tablas/archivos de interés. • Elegir datos dentro de una tabla/archivo. • Pensar cuanto tiempo de un historial habría que usar (por ejemplo, si 18 meses de datos

están disponibles, sólo 12 meses pueden ser necesarios para el ejercicio). Se debe tener cuidado Se debe estar consciente de que los datos recolectados de diferentes fuentes pueden dar lugar a problemas de calidad cuando sean combinados (por ejemplo, los archivos de dirección combinados con una base de datos de cliente pueden mostrar inconsistencias de formato, invalidez de datos, etc.). Inserción de datos

• Si los datos contienen libre entradas de texto, ¿se tendrá que codificarlos para modelar o necesitamos agruparlos en entradas específicas?

• ¿Se pueden encontrar atributos omitidos? • ¿Se puede mejorar la extracción los datos?

Se recomienda Se debe recordar que algún conocimiento sobre los datos puede estar disponible de fuentes no electrónicas (por ejemplo, de gente, de texto impreso, etc.). Puede ser necesario un preproceso de los datos (datos de serie tiempo, promedios ponderados, etc.). 4.3.2.2. Descripción de datos Tarea: Describir datos Examinar las propiedades "gruesas" de los datos obtenidos y el informe sobre los resultados.

Page 54: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 53 de287 Ing. Hugo Daniel Flores

Salida: Informe de descripción de datos Se deben describir los datos que han sido obtenidos, incluyendo el formato de los datos, la cantidad de los datos (por ejemplo, el número de registros y campos internos de cada tabla), las identidades de los campos, y cualquier otro rasgo superficial que haya sido descubierto. Actividades: Análisis volumétrico de datos

• Identificar datos y métodos de captura. • Acceder a las fuentes de datos. • Usar análisis estadísticos si es apropiado. • Reportar las tablas y sus relaciones. • Comprobar el volumen de datos, el número de múltiplos, la complejidad. • Notar si los datos contienen entradas de texto libres.

Atributo, tipos y valores

• Comprobar la accesibilidad y disponibilidad de atributos. • Comprobar los tipos de atributos (numérico, simbólico, la taxonomía, etc.). • Comprobar el rango de valores de los atributos. • Analizar los atributos correlativos (correlaciones de atributo). • Comprender el significado de cada atributo y clasificar (describir) el valor en términos de

negocio. • Para cada atributo se debe calcular la estadística básica (por ejemplo, calcular la

distribución, el promedio, el máximo, el mínimo, la desviación estándar, la varianza, la moda, la inclinación, etc.).

• Analizar la estadística básica y relacionar los resultados con su significado en términos de negocio.

• Decidir si el atributo es relevante para los objetivos específicos de la minería de datos. • Determinar si el significado del atributo es usado coherentemente (conscientemente). • Entrevistar a expertos de dominio para obtener su opinión sobre la importancia de los

atributos. • Decidir si es necesario equilibrar los datos (basado en las técnicas a ser usadas).

Claves

• Se deben analizar relaciones claves. • Se debe comprobar la cantidad de coincidencias entre valores de atributos claves a través de

tablas. Revisión de Objetivos/Presunciones Se debe actualizar la lista de presunciones, si es necesario.

Page 55: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 54 de287 Ing. Hugo Daniel Flores

4.3.2.3. Exploración de datos Tarea: Explorar datos Esta tarea aborda las preguntas de minería de datos que pueden ser dirigidas usando la interrogación, la visualización, y técnicas de informe. Estos análisis pueden directamente dirigir los objetivos de minería de datos. Sin embargo, ellos pueden también contribuir a refinar la descripción de datos e informes de calidad, y alimentar internamente la transformación y otros pasos de preparación de datos necesario antes de que pueda ocurrir un futuro análisis. Salida: Informe de exploración de datos Describir los resultados de esta tarea, incluyendo las primeras conclusiones o las hipótesis iniciales y su impacto sobre el resto del proyecto. El informe también puede incluir gráficos y diseños (plots) que indican las características de los datos o los puntos de interés de subconjuntos de datos dignos de una futura investigación. Actividades: Explorar Datos

• Se debe analizar en detalles las propiedades de atributos interesantes (por ejemplo, la estadística básica, las sub-poblaciones interesantes).

• Identificar las características de las sub-poblaciones. Formar suposiciones para análisis futuro • Considerar y evaluar la información y conclusiones en el informe de descripciones de datos. • Formar una hipótesis e identificar acciones. • Transformar la hipótesis en un objetivo de minería de datos, si es posible. • Aclarar objetivos de minería de datos o hacerlos más exactos. Una búsqueda "ciega" no es

necesariamente inútil, pero una búsqueda más dirigida hacia objetivos de negocio es preferible. • Realizar un análisis básico para verificar la hipótesis. 4.3.2.4. Verificación de la calidad de datos Tarea: Verificar la calidad de datos Se debe examinar la calidad de los datos, dirigiendo preguntas como: ¿Son los datos completos? ¿Estos cubren todos los casos requeridos? ¿Hay en ellos errores o ellos contienen errores? Si hay errores, ¿como son ellos? ¿Hay valores omitidos en los datos? Si es así, ¿cómo son representados, donde ocurren, y como son ellos? Salida: Informe de calidad de datos Listar los resultados de la verificación de calidad de datos; si hay problemas de calidad listar las posibles soluciones. Actividades Identificar valores especiales y catalogar su significado.

Page 56: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 55 de287 Ing. Hugo Daniel Flores

Revisión de atributos claves

• Se debe comprobar la cobertura (por ejemplo, si todos los valores posibles son representados).

• Comprobar las claves. • Verificar que los significados de los atributos y valores contenidos se satisfacen

simultáneamente. • Identificar atributos omitidos y campos en blanco. • Establecer el significado de datos que faltan o fallan. • Se deben comprobar los atributos con los valores diferentes que tienen significados similares

(por ejemplo, la grasa baja la dieta). • Comprobar la ortografía y el formato de valores (por ejemplo, mismo valor pero a veces

comienza con una letra minúscula y a veces con una letra mayúscula). • Comprobar las desviaciones, y decidir si una desviación es "ruido" o puede indicar un

fenómeno interesante. • Comprobar la plausibilidad de valores, (por ejemplo, todos los campos que tienen el mismo

o casi los mismos valores). Se recomienda Se debe repasar cualquiera de los atributos que dan respuestas que están en desacuerdo con el sentido común (por ejemplo, adolescentes con altos niveles de ingreso). Se pueden usar plots de visualización, histogramas, etc. para revelar inconsistencias en los datos. Calidad de datos en archivos planos

• Si los datos son almacenados en archivos planos, se debe comprobar que delimitador es usado y si esto es usado coherentemente en todos los atributos.

• Si los datos son almacenados en archivos planos, comprobar el número de campos en cada registro para ver si ellos coinciden.

Ruido e inconsistencias entre fuentes

• Comprobar consistencia y superabundancia entre fuentes diferentes. • Se debe planear para tratar el ruido. • Descubrir el tipo de ruido y que atributos son afectados.

Se recomienda Se debe recordar que puede ser necesario excluir algunos datos ya que ellos no exponen comportamiento positivo o negativo (por ejemplo, al comprobar en el comportamiento del préstamo de clientes, excluye a todo los que nunca han tomado prestado, aquellos que no financian una hipoteca de casa, aquellos cuya hipoteca se acerca a la madurez, etc.). Revisar si las presunciones son válidas o no, considerando la información real o actual en los datos y el conocimiento de negocio.

Page 57: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 56 de287 Ing. Hugo Daniel Flores

4.3.3. Preparación de los datos Salida: Conjunto de datos Estos son los conjuntos de dato(s) producidos por la fase de Preparación de Datos, usada para modelar o para el trabajo de análisis principal del proyecto. Salida: Descripción del conjunto de datos Esto es, la descripción del conjunto de datos(s) usado para el modelado o para el trabajo de análisis principal del proyecto. 4.3.3.1. Datos seleccionados Tarea: Seleccionar datos Se debe decidir los datos a ser usados para el análisis. Los criterios incluyen la importancia a los objetivos de minería de datos, la calidad, y las restricciones técnicas como los límites en el volumen de datos o en los tipos de datos. Salida: Razonamiento para inclusión/exclusión Listar los datos a ser usados / excluidos y los motivos para estas decisiones. Actividades

• Recoger datos adicionales apropiados (de diferentes fuentes - internos así como externos). • Realizar las pruebas de importancia y correlación para decidir si los campos son incluidos. • Reconsiderar Criterios de Selección de Datos (ver Tarea 2.1) en la luz de las experiencias de

calidad de los datos y en la exploración de datos (esto es, se puede desear incluir/excluir otros juegos de datos).

• Reconsiderar Criterios de Selección de Datos (ver la Tarea 2.1) en la luz de experiencia de modelado (esto es, la evaluación del modelo puede mostrar que otros conjuntos de datos son necesarios).

• Seleccionar diferentes subconjuntos de datos (por ejemplo, atributos diferentes, sólo los datos que encuentran ciertas condiciones).

• Considerar el uso de técnicas de muestreo (por ejemplo, una solución rápida puede implicar la prueba dura y el entrenamiento del conjunto de datos o la reducción del tamaño del conjunto de datos de prueba, si la herramienta no puede manejar conjunto de datos llenos. Esto puede también ser útil para tener muestras ponderadas para dar distinta importancia a atributos diferentes o valores diferentes del mismo atributo).

• Documentar el razonamiento para la inclusión/exclusión. • Comprobar técnicas disponibles para el muestreo de datos.

Se recomienda Basado en Criterios de Selección de Datos se debe decidir si uno o más atributos son más importantes que otros y el correspondiente peso de los atributos. Decidir basado en el contexto (esto es, el uso, la herramienta, etc.), cómo manejarse con el peso.

Page 58: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 57 de287 Ing. Hugo Daniel Flores

4.3.3.2. Limpieza de datos Tarea: Limpiar datos Se debe elevar la calidad de datos al nivel requerido por las técnicas de análisis seleccionadas. Esto puede implicar la selección de subconjuntos limpios de los datos, la inserción de faltas apropiadas, o técnicas más ambiciosas como la estimación de datos omitidos por modelado. Salida: Informe de la limpieza de datos Describir las decisiones y las acciones que fueron tomados para dirigir los problemas de calidad de datos informados durante la Tarea de Verificación de Calidad de Datos. Si los datos están para ser usados en el ejercicio de minería de datos, el informe debería dirigir cuestiones de calidad de datos excepcionales y el efecto posible que esto podría tener sobre los resultados. Actividades

• Reconsiderar como tratar con cualquier tipo de ruido observado. • Corregir, remover, o ignorar el ruido. • Decidir como tratar con valores especiales y su significado. El área de valores especiales

puede dar lugar a muchos resultados extraños y con cuidado deberían ser examinados. Los ejemplos de valores especiales podrían surgir por los resultados tomados de una revisión donde algunas cuestiones no fueron preguntadas o no fueron contestadas. Esto podría terminar en un valor de 99 para datos desconocidos. Por ejemplo, 99 para estado civil o afiliación política. Los valores especiales también podrían surgir cuando los datos son truncados por ejemplo 00 para gente de 100 años o para todos los coches con 100.000 kilómetros en el odómetro.

• Reconsiderar Criterios de Selección de Datos (ver Tarea 2.1) en la luz de las experiencias de los datos limpios (esto es, se puede desear incluir/excluir otros conjuntos de datos).

Se recomienda Recordar que algunos campos pueden ser irrelevantes a los objetivos de la minería de datos y, por lo tanto, el ruido en aquellos campos no tiene ninguna importancia. Sin embargo, si el ruido es ignorado por estos motivos, esto debería ser totalmente documentado como circunstancias que pueden cambiarse más tarde. 4.3.3.3. Construcción de datos Tarea: Construir datos Esta tarea incluye la construcción de operaciones de preparación de datos tales como la producción de atributos derivados, completar registros nuevos, o transformar valores para atributos existentes. Actividades

• Comprobar los mecanismos de construcción disponibles con la lista de herramientas sugeridas para el proyecto.

• Decidir si esto es lo mejor para realizar la construcción dentro de la herramienta o fuera de ella (esto es, que es más eficiente, exacto, repetible).

Page 59: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 58 de287 Ing. Hugo Daniel Flores

• Reconsiderar Criterios de Selección de Datos (ver Tarea 2.1) en la luz de las experiencias de construcción de datos (esto es, se puede desear incluir/excluir otros conjuntos de datos).

Salida: Atributos derivados Los atributos derivados son los atributos nuevos que son construidos de uno o más atributos existentes en el mismo registro. Un ejemplo podría ser: área = longitud x anchura. ¿Por qué se debería tener que construir atributos derivados durante el curso de una investigación de minería de datos? No debería pensarse que sólo los datos de bases de datos u otras fuentes deberían ser usados en la construcción de un modelo. Los atributos derivados podrían ser construidos porque:

• El conocimiento del contexto convence que algún hecho es importante y debería ser representado aunque no se tenga ningún atributo actualmente para representarlo.

• El algoritmo de modelado en uso maneja sólo ciertos tipos de datos - por ejemplo se está usando regresión lineal y se sospecha que hay ciertas no-linealidades que serán incluidas en el modelo.

• El resultado de la fase de modelado sugiere que ciertos hechos no sean cubiertos. Actividades: Derivar atributos

• Decidir si cualquier atributo puede ser normalizado (por ejemplo, usando un algoritmo de agrupamiento (clustering) con el periodo y el ingreso, en ciertas divisas, el ingreso se controlará).

• Considerar agregar nueva información sobre la importancia relevante de los atributos para agregar nuevos atributos (por ejemplo, atributos con peso, normalización ponderada).

• ¿Cómo se puede construir o imputar atributos faltantes? Decidir el tipo de construcción (por ejemplo, la combinación, el promedio, la inducción).

• Agregar atributos nuevos a los datos de acceso. Se recomienda Antes de agregar Atributos Derivados, se debe intentar determinar si y como ellos facilitan el proceso de modelado o facilitan el algoritmo de modelado. Quizás “el ingreso por persona” es un mejor o más fácil atributo para usar que “el ingreso por casa.” No se debe sacar atributos simplemente para reducir el número de atributos de entrada. Otro tipo de atributo derivado es la transformación de un atributo individual, por lo general realizado para cubrir las necesidades de las herramientas de modelado. Actividades Transformaciones de atributo individual

• Especificar los pasos de transformaciones necesarias en los términos de facilitar la transformación disponible (por ejemplo, cambiar un binning de un atributo numérico).

• Realizar pasos de transformación. Se recomienda Las transformaciones pueden ser necesarias para cambiar rangos a campos simbólicos (por ejemplo, años a rangos de edad) o campos simbólicos (“definitivamente sí”, “sí”, “no se sabe,” "no") a valores numéricos. Las herramientas de modelado o los algoritmos a menudo los requieren.

Page 60: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 59 de287 Ing. Hugo Daniel Flores

Salida: Registros generados Los registros generados son registros completamente nuevos, que agregan nuevo conocimiento o representan nuevos datos que de otro modo no son representados (por ejemplo, habiendo segmentado los datos, puede ser útil generar un registro para representar al miembro prototípico de cada segmento para un tratamiento futuro). Actividades Comprobar por técnicas disponibles si es necesario (por ejemplo, mecanismos para construir prototipos para cada segmento de datos segmentados). 4.3.3.4. Integración de datos Tarea: Integrar datos Estos son métodos para combinar la información de múltiples tablas u otras fuentes de información para crear nuevos registros o valores. Salida: Datos combinados La combinación de tablas se refiere a la unión de dos o más tablas que tienen diferente información sobre los mismos objetos. En esta etapa, también puede ser aconsejable generar registros nuevos. También puede ser recomendado para generar valores agregados. La agregación se refiere a operaciones donde los nuevos valores son calculados por información resumida de múltiples registros y/o tablas. Actividades

• Comprobar si las aplicaciones de integración son capaces de integrar las fuentes de entrada como se requiere.

• Integrar fuentes y resultados almacenados. • Reconsiderar Criterios de Selección de Datos (ver la Tarea 2.1) en la luz de las experiencias

de integración de datos (esto es, se puede desear incluir/excluir otros conjuntos de datos). Se recomienda Recordar que algún conocimiento puede estar contenido en un formato no-electrónico. 4.3.3.5. Formateo de datos Tarea: Formatear datos Transformar formateando se refiere principalmente a modificaciones sintácticas hechas a los datos que no cambian su significado, pero podría ser requerido por la herramienta de modelado.

Page 61: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 60 de287 Ing. Hugo Daniel Flores

Salida: Datos reformateados Algunas herramientas tienen requerimientos sobre el orden de los atributos, tal que el primer campo sea un único identificador para cada registro o el campo último ser el juego de resultados que el modelo debe predecir. Actividades: Atributos reorganizados Algunas herramientas tienen requerimientos sobre el orden de los atributos, tal que el primer campo es un único identificador para cada registro o el campo último es el juego de resultados que el modelo debe predecir. Reordenando registros Podría ser importante cambiar el orden de los registros en el conjunto de datos. Quizás el instrumento de modelado requiere que los registros sean clasificados según el valor del atributo de resultado. Reformateado de valores internos • Estos son cambios puramente sintácticos hechos para satisfacer las exigencias de la herramienta

específica de modelado. • Reconsiderar Criterios de Selección de Datos (ver Tarea 2.1) en la luz de las experiencias de

limpieza de datos (esto es, se puede desear incluir/excluir otros conjuntos de datos).

4.3.4. Modelado 4.1. Seleccionar técnicas de modelado Tarea: Seleccionar técnicas de modelado Como primer paso en modelado, seleccionar la técnica de modelado inicial actual. Si hay múltiples a ser aplicados, realizar separadamente esta tarea para cada técnica. Se debe recordar que no todos los instrumentos y técnicas son aplicables a todas y cada tarea. Para ciertos problemas, sólo algunas técnicas son apropiadas. “Requerimientos políticos” y otras restricciones adicionales limitan las opciones disponibles para el ingeniero de minería de datos. Puede ser que solo una herramienta o técnica estén disponibles para solucionar el problema a mano y que el instrumento no pueda ser absolutamente lo mejor, desde un punto de vista técnico.

Page 62: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 61 de287 Ing. Hugo Daniel Flores

Figura 11: Diversidad de Técnicas Salida: Técnicas de modelado Registrar las técnicas de modelado real que se usan. Actividades Decidir las técnicas apropiada para el ejercicio teniendo en cuenta la herramienta seleccionada. Salida: Presunciones de modelado Muchas técnicas de modelado realizan presunciones específicas sobre los datos. Actividades

• Definir cualquier presunción construida por la técnica sobre los datos (por ejemplo, la calidad, el formato, la distribución).

• Comparar estas presunciones con aquellas del Informe de Descripción de Datos. • Se debe asegurar que estas presunciones sostienen y permiten volver a la fase de

Preparación de Datos, si es necesario.

Page 63: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 62 de287 Ing. Hugo Daniel Flores

4.3.4.2. Generar el diseño de prueba Tarea: Generar el diseño de prueba Antes de construir un modelo, es necesario definir un procedimiento para probar la calidad del modelo y la validez. Por ejemplo, en tareas de minería de datos supervisadas como la clasificación, es común usar tasas de error como medidas de calidad para modelos de minería de datos. Por lo tanto, el diseño de prueba especifica que el conjunto de datos debería ser separado en el entrenamiento y en el conjunto de prueba. El modelo esta construido sobre el conjunto de entrenamiento y su calidad estimada sobre el conjunto de prueba. Salida: Diseño de Prueba Describir el plan deliberado para el entrenamiento, las pruebas, y la evaluación de los modelos. Un componente primario del plan es para decidir como dividir el conjunto de datos disponible sobre datos que se entrenan, datos de prueba, y conjunto de pruebas de validación. Actividades

• Comprobar que existen diseños de prueba separadamente para cada objetivo de minería de datos.

• Decidir los pasos necesarios (el número de iteraciones, el número de desviaciones o curvas, etc.).

• Preparar los datos requeridos para la prueba

4.3.4.3. Construcción del modelo Tarea: Construir el modelo Se corre la herramienta de modelado sobre el conjunto de datos listo para crear uno o más modelos. Salida: Parámetros de ajuste Con cualquier herramienta de modelado hay a menudo un gran número de parámetros que pueden ser ajustados. Se debe listar los parámetros y sus valores seleccionados, con la explicación (el razonamiento) para la elección. Actividades

• Determinar los parámetros iniciales. • Documentar las razones para elegir aquellos valores.

Salida: Modelos Controlar la herramienta de modelado en el conjunto de datos listos para crear uno o más modelos. Actividades

• Ejecutar la técnica seleccionada sobre el conjunto de datos de entrada para producir el modelo.

Page 64: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 63 de287 Ing. Hugo Daniel Flores

• Post-procesar los resultados de minería de datos (por ejemplo, editar reglas, mostrar árboles).

Salida: Descripción del modelo Describir el resultado del modelado y evaluar su exactitud esperada, la robustez, y defectos posibles. Informar sobre la interpretación de los modelos y encontrar cualquier dificultad. Actividades

• Describir cualquier característica del modelo actual que puede ser útil para el futuro. • Ajustar parámetro de entorno (de registro) usado para producir el modelo. • Dar una descripción detallada del modelo y cualquier rasgo especial. • Para modelos basados por regla, listar las reglas producidas, más cualquier evaluación de

cada regla o la exactitud y alcance total del modelo. • Para modelos no transparentes, listar cualquier información técnica sobre el modelo (como

la topología de las redes neuronales) y cualquier descripción de comportamiento producido por el proceso de modelado (como la exactitud o la sensibilidad).

• Describir el comportamiento del modelo y la interpretación. • Expresar conclusiones respecto a los patrones en los datos (si hay alguno); a veces el

modelo revela hechos importantes sobre los datos sin un proceso de evaluación separado (por ejemplo, que la salida o la conclusión son duplicadas en una de las entradas).

4.3.4.4. Evaluación del modelo Tarea: Evaluar el modelo El modelo ahora debería ser evaluado para asegurar que se encontró criterio de éxito de la minería de datos y aprobar los criterios de prueba deseados. Esto es una evaluación puramente técnica basada en el resultado de las tareas de modelado. Salida: Evaluación del modelo Resumir los resultados de esta tarea, listar las calidades de los modelos generados (por ejemplo, en términos de exactitud), y el nivel de su calidad en relación a otro. Actividades

• Evaluar los resultados en lo que concierne a criterios de evaluación. • Probar los resultados según una estrategia de prueba (por ejemplo: Corrida y Prueba,

Validación cruzada, bootstrapping, etc.). • Comparar los resultados de la evaluación y la interpretación. • Crear la clasificación de resultados en lo que concierne a criterios de éxito y evaluación. • Seleccionar los mejores modelos. • Interpretar los resultados en términos de negocio (tanto como sea posible en esta etapa). • Conseguir comentarios de los modelos por expertos en datos o en el dominio. • Chequear la credibilidad del modelo.

Page 65: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 64 de287 Ing. Hugo Daniel Flores

• Comprobar los efectos sobre los objetivos de minería de datos. • Comprobar los modelos contra una base de conocimiento determinada para ver si la

información descubierta es nueva y útil. • Comprobar la fiabilidad de los resultados. • Analizar el potencial para el desarrollo de cada resultado • Si hay una descripción verbal del modelo generado (por ejemplo, en forma de reglas),

evaluar las reglas: ¿Ellas son lógicas, o ellas son factibles, hay demasiadas reglas o hay demasiado poco, ellos violan el sentido común?

• Evaluar resultados. • Conseguir ideas específicas de cada técnica de modelado y ciertos parámetros de ajustes que

conduzcan a resultados buenos/malos. Se recomienda “Tablas de Elevación” y “Tablas de Beneficio” pueden ser construidas para determinar bien lo que el modelo predice. Salida: Revisión de parámetros de ajuste Según la evaluación del modelo, se debe revisar parámetros de ajuste para la siguiente corrida en la tarea de Construcción del Modelo. Iterar (repetir) la construcción del modelo y evaluar hasta que se encuentre el mejor modelo. Actividades Ajustar parámetros para producir mejores modelos. 4.3.5. Evaluación Los pasos de evaluación previa tratan con factores como la exactitud y la generalidad del modelo. Este paso evalúa el grado en el que el modelo encuentra los objetivos de negocio, y procura determinar si hay alguna razón de negocio por la qué este modelo sea deficiente. Se comparan resultados con los criterios de evaluación definidos en el principio del proyecto. Un modo bueno para definir las salidas totales de un proyecto de minería de datos es usar la ecuación:

RESULTADOS = MODELOS + CONCLUSIONES En esta ecuación, definimos que la salida total del proyecto de minería de datos no son solamente los modelos (aunque ellos sean, desde luego, importantes) sino también las conclusiones, las que definimos como algo (aparte del modelo) que es importante en:

• la búsqueda de los objetivos de negocio o importancia para arribar a nuevas preguntas, • las líneas de aproximación, o • los efectos negativos (por ejemplo, los problemas de calidad de datos descubierto por el uso

de la minería de datos).

Page 66: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 65 de287 Ing. Hugo Daniel Flores

Se debe tener en cuenta que aunque el modelo esté directamente conectado a las preguntas de negocio, las conclusiones no necesariamente están relacionadas con cualquiera de las preguntas u objetivos, mientras ellos son importantes para el promotor del proyecto. 4.3.5.1. Evaluación de los resultados Tarea: Evaluar los resultados Esta etapa evalúa el grado al que el modelo encuentra los objetivos de negocio, y procura determinar si hay alguna razón de negocio por el cual este modelo es deficiente. Otra opción es probar el (los) modelo(s) sobre la aplicación de prueba en el sistema verdadero, si las restricciones de tiempo y de presupuesto así lo permiten. Además, la evaluación también evalúa otros resultados generados por la minería de datos. Los resultados de minería de datos cubren los modelos que están relacionados con los objetivos originales de negocio y todas las demás conclusiones. Unos son relacionados con los objetivos de negocios originales mientras que otros podrían revelar desafíos adicionales, información, o ideas para futuras administraciones (direcciones). Salida: Evaluación de los resultados de minería de datos en lo que respecta a criterios de éxito de negocio Resumir resultados de evaluación en términos de criterios de éxito de negocio, incluyendo una declaración final relacionada a si el proyecto encuentra los objetivos iniciales de negocio. Actividades

• Comprender los resultados de la minería de datos. • Interpretar los resultados en términos de la aplicación (del uso). • Comprobar efectos sobre los objetivos de minería de datos. • Comprobar los resultados de minería de datos contra la base de un conocimiento

determinado para ver si la información descubierta es nueva y útil. • Evaluar y estimar los resultados en lo que respecta a criterios de éxito de negocio (esto es, si

el proyecto ha alcanzado los Objetivos de Negocio originales). • Comparar los resultados de la evaluación y la interpretación. • Clasificar los resultados en lo que respecta a criterios de éxito de negocio. • Comprobar el efecto de los resultados sobre el objetivo (fin) de la aplicación inicial. • Determinar si hay nuevos objetivos de negocio para ser dirigidos más tarde en el proyecto, o

en nuevos proyectos. • Expresar recomendaciones para proyectos futuros de minería de datos

Salida: Modelos aprobados Después de evaluar los modelos con respecto a los criterios de éxito de negocio, se debe seleccionar y probar los modelos generados que encontraron los criterios seleccionados.

Page 67: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 66 de287 Ing. Hugo Daniel Flores

4.3.5.2. Proceso de revisión Tarea: Revisar el proceso En este punto, el modelo resultante parece ser satisfactorio y parece satisfacer necesidades de negocio. Es ahora apropiado hacer una revisión más cuidadosa de las promesas de minería de datos para determinar si hay algún factor importante o tarea que de algún modo ha sido pasada por alto. En esta etapa del ejercicio de minería de datos, el Proceso de Revisión toma la forma de una Revisión de Garantía de Calidad. Salida: Revisión de procesos Resumir el proceso de revisión y poner en una lista las actividades que han sido omitidas y/o deberían ser repetidas. Actividades

• Proporcionar una descripción del proceso de minería de datos usado. • Analizar el proceso de minería de datos. Para cada etapa del proceso: ¿Esto fue necesario?

¿Esto fue ejecutado de forma óptima? ¿En que modo podría ser mejorado? • Identificar fracasos. • Identificar pasos desviados (de engaños). • Identificar acciones alternativas posibles y/o caminos inesperados en el proceso. • Revisar resultados de minería de datos en lo que concierne a criterios de éxito de negocio.

4.3.5.3. Determinación de los próximos pasos Tarea: Determinar los próximos pasos Basado en los resultados de evaluación y la revisión de proceso, se debe decidir como proceder. Las decisiones a ser tomadas incluyen si hay que terminar este proyecto y seguir adelante al desarrollo para iniciar futuras iteraciones, o establecer nuevos proyectos de minería de datos. Salida: Lista de acciones posibles Listar acciones futuras posibles con los motivos para y contra de cada opción. Actividades • Analizar el potencial para el desarrollo de cada resultado. • Estimar el potencial para la mejora de proceso actual. • Comprobar los recursos restantes para determinar si ellos permiten iteraciones de proceso

adicionales (o si recursos adicionales pueden estar siendo disponibles). • Recomendar continuar con las alternativas. • Refinar el plan de proceso. Salida: Decisión Describir las decisiones hechas, con el razonamiento para ello.

Page 68: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 67 de287 Ing. Hugo Daniel Flores

Actividades

• Clasificar las acciones posibles. • Seleccionar una de las acciones posibles. • Documentar las razones para la elección.

4.3.6. Desarrollo 4.3.6.1. Plan de desarrollo Tarea: Desarrollo del Plan Esta tarea comienza con la evaluación de los resultados y concluye con una estrategia para el desarrollo de los resultados de la minería de datos en el negocio. Salida: Plan de Desarrollo Resumir la estrategia de desarrollo, incluyendo los pasos necesarios y como realizarlos. Actividades

• Resumir resultados desarrollados. • Construir y evaluar los planes alternativos para el desarrollo. • Decidir para cada resultado conocimiento o información distintos. • Determinar como el conocimiento o la información serán propagados (generados) a los

usuarios. • Decidir como será supervisado el uso del resultado y medir sus beneficios (donde sea

aplicable). • Decidir por cada resultado de modelo desarrollado o de software. • Establecer como el modelo o el resultado de software serán desplegados dentro de los

sistemas de la organización. • Determinar como su empleo será supervisado y como se miden sus beneficios (donde sea

aplicable). • Identificar posibles problemas durante el desarrollo (peligros a ser evitados).

4.3.6.2. Supervisión y mantenimiento del plan Tarea: Supervisar y mantener el plan La supervisión y el mantenimiento son cuestiones importantes si los resultados de la minería de datos se hacen parte del negocio cotidiano y de su ambiente. Una preparación cuidadosa de una estrategia de mantenimiento ayuda a evitar innecesariamente largos períodos de uso incorrecto de los resultados de minería de datos. Para supervisar el desarrollo de los resultados de minería de datos, el proyecto necesita un plan detallado para supervisar y mantener. Este plan tiene en cuenta el tipo específico de desarrollo.

Page 69: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 68 de287 Ing. Hugo Daniel Flores

Salida: Plan de supervisión y mantenimiento Resumir la estrategia de supervisión y mantenimiento, la inclusión de pasos necesarios y como realizarlos. Actividades

• Comprobar aspectos dinámicos (esto es, ¿qué cosas podrían cambiar en el entorno?). • Decidir como será supervisada la precisión. • Determinar cuando el resultado de minería de datos o el modelo no deberían ser usados más.

Identificar criterios (la validez, el límite de la exactitud, nuevos datos, cambios en el dominio de aplicación, etc.), y que debería pasar si el modelo o el resultado no pueden ser usados más. Actualización del modelo, establecimiento de nuevos proyectos de minería de datos, etc.

• ¿Cambiarán con el tiempo los objetivos de negocio del empleo del modelo? Documentar totalmente el problema inicial que el modelo intentaba solucionar.

• Desarrollar el plan de mantenimiento y la supervisión. 4.3.6.3. Producción de Informe definitivo Tarea: Producir Informe definitivo En el final del proyecto, el equipo de proyecto sobrescribe un informe definitivo. Según el plan de desarrollo, este informe puede ser sólo un resumen del proyecto y su experiencia, o una presentación final de los resultados de minería de datos. Salida: Informe definitivo En el final del proyecto, habrá al menos un informe definitivo en el que todos los hilos son encontrados. Así como la identificación de los resultados obtenidos, el informe también debería describir el proceso, mostrar los costos que se han encontrados, definir cualquier desviación del plan original, describir proyectos de implementación, y hacer cualquier recomendación para el futuro trabajo. El contenido real detallado del informe depende en gran medida de la audiencia planeada. Actividades

• Identificar cuales informes son necesarios (presentación de diapositiva, conclusiones de administración, detalles encontrados, explicación de los modelos, etc.).

• Analizar que tan bien se han encontrado los objetivos de minería de datos iniciales. • Identificar grupos de objetivos para el informe. • Describir en forma general las estructuras y el contenido de informe(s). • Seleccionar conclusiones para ser incluidas en los informes. • Escribir un informe.

Salida: Presentación final Así como un informe definitivo, puede ser necesario hacer una presentación final para concluir el proyecto (por ejemplo, al patrocinador de dirección). La presentación normalmente contiene un

Page 70: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 69 de287 Ing. Hugo Daniel Flores

subconjunto del contenido de la información en el informe definitivo, estructurado de un modo diferente. Actividades

• Decidir el grupo objetivo para la presentación final y determinar si ellos ya habrán recibido el informe definitivo.

• Seleccionar cuales de los artículos del informe definitivo deberían ser incluidos en la presentación final.

4.3.6.4. Revisión del proyecto Tarea: Revisar el proyecto Evaluar que fue lo correcto y que fue lo errado, cual fue el éxito obtenido, y que necesidades serán mejoradas. Salida: Documentación de experiencia Resumir la gran experiencia ganada durante el proyecto. Por ejemplo, trampas, accesos a información incorrecta (misleading approaches), o los puntos para seleccionar las mejores técnicas de minería de datos en situaciones similares podrían ser la parte de esta documentación. En proyectos ideales, la documentación de experiencia también cubre cualquier informe que ha sido escrito por miembros individuales del proyecto durante el proyecto. Actividades • Entrevistar a toda la gente significativa involucrada en el proyecto y preguntarles sobre su

experiencia durante el proyecto. • Si los usuarios finales trabajan en el negocio con los resultados de minería de datos,

entrevistarlos: ¿Están satisfechos? ¿Cómo podría haber sido mejor realizado? ¿Necesitan de apoyo adicional?

• Resumir la realimentación y escribir la documentación de experiencia. • Analizar el proceso (las cosas que se trabajaron bien, los errores producidos, las lecciones

aprendidas, etc.). • Documentar el proceso de minería de datos específico (¿Cómo pueden los resultados y la

experiencia de aplicación del modelo ser realimentado en el proceso?) • Generalizar desde los detalles para producir la experiencia útil para proyectos futuros. 4.4. Las salidas del CRISP-DM Esta sección contiene las breves descripciones de los objetivos y el contenido de los informes más importantes. Aquí, se enfoca en los informes que son significativos para comunicar los resultados de una fase a la gente no involucrada en esta fase (y posiblemente no involucrada en este proyecto). Estos no son necesariamente idénticos a las salidas como lo descrito en el modelo de referencia y la guía de usuario. El objetivo de estas salidas es mas para documentar resultados mientras se está realizando el proyecto.

Page 71: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 70 de287 Ing. Hugo Daniel Flores

4.4.1. Comprensión del Negocio Los resultados de la fase de Comprensión de Negocio pueden ser resumidos en un informe. Se sugiere las secciones siguientes: Contexto La sección Contexto proporciona una descripción básica del contexto de proyecto. Se deben listar cuales áreas están trabajando en el proyecto, que problemas han sido identificados, y por qué la minería de datos parece proporcionar una solución. Objetivos de negocio y criterios de éxito La sección de Objetivos de negocio describe los objetivos del proyecto en términos de negocio. Para cada objetivo, Los Criterios de Éxito de Negocio, esto es, describir las medidas para determinar si realmente el proyecto ha logrado sus objetivos. Esta sección también debería listar los objetivos que fueron considerados, pero rechazados. El razonamiento de la selección de objetivos debería ser dado. Inventario de recursos La sección de Inventario de Recursos apunta a identificar el personal, fuentes de datos, instalaciones técnicas, y otros recursos que pueden ser útiles en la realización del proyecto. Requerimientos, presunciones, y restricciones Esta sección lista los requerimientos generales para la ejecución del proyecto: tipo de resultados de proyecto, presunciones hechas sobre la naturaleza del problema y de los datos que están siendo usados, y restricciones impuestas al proyecto. Riesgos y contingencias Esta sección identifica los problemas que pueden ocurrir en el proyecto, describe las consecuencias, y declara que acciones pueden ser tomadas para reducir al mínimo tales riesgos. Terminología La sección de Terminología permite a la gente desconocida con los problemas que están siendo dirigidos por el proyecto hacerse más familiar con ellos. Costos y beneficios Esta sección describe los costos del proyecto y predice los beneficios del negocio si el proyecto es exitoso (por ejemplo, la vuelta en la Inversión). Otros beneficios menos tangibles (por ejemplo, la satisfacción del cliente) también deberían ser destacadas. Objetivos de minería de datos y criterios de éxito

Page 72: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 71 de287 Ing. Hugo Daniel Flores

La sección de Objetivos de Minería de datos declara los resultados del proyecto que permiten el logro de los objetivos de negocio. También como el listado de los accesos probables de minería de datos, los criterios de éxito para los resultados en términos de minería de datos también deberían ser puestos en una lista. Plan de proyecto Esta sección pone en una lista las etapas para ser ejecutadas en el proyecto, juntos con su duración, recursos requeridos, entradas, salidas, y dependencias. Donde sea posible, esto debería hacer explícitamente las iteraciones en gran escala en el proceso por ejemplo de minería de datos (por ejemplo, las repeticiones del modelado y fases de evaluación). Evaluación inicial de herramientas y técnicas Esta sección da una vista inicial de que herramientas y técnicas probablemente van a ser usadas y como. Esto describe los requerimientos para las herramientas y técnicas, ponen en una lista herramientas disponibles y técnicas, y los compara con los requerimientos.

4.4.2. Comprensión de Datos Los resultados de la fase Comprensión de Datos por lo general son documentados en varios informes. Idealmente, estos informes serían los escritos mientras se estaban realizando las respectivas tareas. Los informes describen el conjunto de datos que es explorado durante la Comprensión de Datos. Para el informe definitivo, un sumario de las partes más relevantes es suficiente. Informe de colección de datos iniciales Este informe describe como las diferentes fuentes de datos identificadas en el inventario fueron capturadas y extraídos. Temas a ser cubiertos:

• Contexto de datos. • Lista de fuentes de datos con amplia área de cobertura de datos requeridos por cada uno. • Para cada fuente de datos, método de adquisición o extracción. • Problemas encontrados en adquisición de datos o extracción.

Informe de descripción de datos Cada conjunto de datos adquirido es descrito en este informe. Temas a ser cubiertos:

• Cada fuente de datos descrita detalladamente. • Lista de tablas (puede ser sólo uno) u otros objetos de base de datos. • Descripción de cada campo, incluyendo unidades, códigos usados, etc.

Page 73: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 72 de287 Ing. Hugo Daniel Flores

Informe de exploración de datos Este informe describe la exploración de datos y sus resultados. Temas a ser cubiertos: Contexto, incluyendo los amplios objetivos de exploración de datos. Para cada área de exploración emprendida:

• Las regularidades esperadas o patrones. • Método de detección. • Regularidades o patrones encontrados, esperados e inesperados. • Cualquier otra sorpresa. • Conclusiones para transformación de datos, limpieza de datos, y cualquier otro proceso

previo. • Conclusiones relacionadas con datos que extraen objetivos u objetivos de negocio. • Sumario de conclusiones.

Informe de calidad de datos Este informe describe lo completo y la exactitud de los datos. Temas a ser cubiertos: Contexto, incluyendo amplias expectativas sobre calidad de datos. Para cada conjunto de datos:

• Acercar temas para evaluar la calidad de datos. • Los resultados de evaluación de calidad de datos. • Sumario de conclusiones de calidad de datos.

4.4.3. Preparación de Datos Los informes en la fase de Preparación de Datos se enfocan en los pasos de pre-proceso que producen los datos para ser minados. Informe de descripción de conjunto de datos Este informe proporciona una descripción del conjunto de datos (después del pre-proceso) y el proceso por el que fue producido. Temas a ser cubiertos: Contexto, incluyendo objetivos amplios y plan para el pre-proceso. Razonamiento para inclusión/exclusión de conjunto de datos. Para cada conjunto de datos incluir:

• La descripción del pre-proceso, incluyendo las acciones que fueron necesarias para dirigir cualquier cuestión de calidad de datos.

• Descripción detallada del conjunto de datos resultante, tabla por tabla y campo por campo.

Page 74: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 73 de287 Ing. Hugo Daniel Flores

• Razonamiento para inclusión/exclusión de atributos. • Descubrimientos de hechos durante el pre-proceso, y cualquier implicación para futuros

trabajos. • Sumario y conclusiones.

4.4.4. Modelado Las salidas producidas durante la fase Modelado pueden ser combinadas en un informe. Se sugieren las secciones siguientes. Modelado de presunciones Esta sección define cualquier presunción explícita hecha sobre los datos y cualquier presunción que está implícita en la técnica de modelado a ser usado. Diseño de prueba Esta sección describe como los modelos son construidos, probados, y evaluados. Temas a ser cubiertos: Contexto de fondo para la ocupación del modelo y su relación a los objetivos de minería de datos. Para cada tarea de modelado:

• Ampliación de la descripción del tipo de modelo y los datos que se entrenan para ser usado. • La explicación de como el modelo será probado o evaluado. • Descripción de cualquier dato requerido para las pruebas. • Plan para producción de los datos de prueba si hay. • Descripción de cualquier examen planeado de modelos por expertos en dominio o de datos. • Sumario de plan de prueba.

Descripción del modelo Este informe describe los modelos entregados y las descripciones del proceso por el que ellos fueron producidos. Temas a ser cubiertos: Descripción de modelos producidos. Para cada modelo:

• Tipo de modelo y la relación a los objetivos de minería de datos. • Los parámetros de ajustes usados para producir el modelo. • Descripción detallada del modelo y cualquier rasgo especial. Por ejemplo: para modelos

basados por regla, listar las reglas producidas más cualquier evaluación de precisión por regla o el modelo completo y el alcance; para modelos no transparentes, listar cualquier información técnica sobre el modelo (como la topología de red de los nervios) y algunas descripciones de comportamiento producidas por el proceso de modelado (como la precisión o la sensibilidad).

• Descripción del comportamiento del modelo e interpretación.

Page 75: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 74 de287 Ing. Hugo Daniel Flores

• Conclusiones en cuanto a los patrones en los datos (si hay). A veces el modelo revelará hechos importantes sobre los datos sin un proceso de evaluación separado (por ejemplo, que la salida o la conclusión están duplicadas en una de las entradas).

• Sumario de conclusiones. Evaluación del modelo Esta sección describe los resultados de prueba de los modelos según el diseño de prueba. Temas a ser cubiertos: Descripción de los procesos de evaluación y los resultados, incluyendo cualquier desviación del plan de prueba. Para cada modelo:

• Evaluación detallada, incluyendo medidas como precisión e interpretación del comportamiento.

• Cualquier comentario sobre los modelos por expertos en el dominio o de datos. • Evaluación resumida de modelos. • Ideas en por qué una cierta técnica de modelado y ciertos ajustes de parámetro conducen a

resultados buenos/malos. • Evaluación sumaria del conjunto de modelos completos.

4.4.5. Evaluación Evaluación de los resultados de minería de datos en lo que respecta a criterios de éxito de negocio Este informe compara los objetivos de minería de datos con los objetivos de negocio y los criterios de éxito de negocio. Temas a ser cubiertos: Revisión de objetivos de negocio y criterios de éxito de negocio (qué podría haberse cambiado durante y/o como consecuencia de la minería de datos). Para cada criterio de éxito de negocio:

• Comparación detallada entre criterio de éxito y resultados de minería de datos. • Conclusiones sobre aceptabilidad (achievability) de criterios de éxitos y conveniencia del

proceso de minería de datos. • Revisión del éxito de proyecto: • ¿El proyecto ha alcanzado los objetivos originales de negocio? • ¿Objetivos nuevos de negocio deben ser dirigidos después en el proyecto o en nuevos

proyectos? • Conclusiones para futuros proyectos de minería de datos.

Revisión de proceso Esta sección evalúa la eficacia del proyecto e identifica cualquier factor que podría haber sido pasado por alto y que debería ser tenido en cuenta si el proyecto es repetido.

Page 76: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 75 de287 Ing. Hugo Daniel Flores

Lista de posibles acciones Esta sección hace recomendaciones en cuanto a los siguientes pasos en el proyecto. 4.4.6. Desarrollo Plan de desarrollo Este informe especifica el desarrollo de los resultados de minería de datos. Temas a ser cubiertos:

• Resumen de los resultados desarrollados (derivado de los informes de Próximos Pasos). • Descripción de plan de desarrollo.

Supervisión y plan de mantenimiento La supervisión y el plan de mantenimiento especifican como los resultados desarrollados deben ser mantenidos. Temas a ser cubiertos: Descripción de los resultados de desarrollo y la indicación de que los resultados pueden requerir la actualización (y el por qué). Para cada resultado desarrollado:

• Descripción de como la actualización será provocada (por una normal actualización, por un acontecimiento de activación, por la ejecución de una supervisión).

• Descripción de cómo la actualización será realizada. • Resumen de los procesos de actualización de los resultados.

Informe definitivo El informe definitivo es usado para resumir el proyecto y sus resultados. Contenido:

• Resumen de la Comprensión del Negocio: contexto, objetivos, y criterios de éxito. • Sumario de proceso de minería de datos. • Resumen de los resultados de minería de datos. • Sumario de la evaluación de resultados. • Resumen del desarrollo y de los planes de mantenimiento. • Análisis Costo/Beneficio. • Conclusiones para el negocio. • Conclusiones para futura minería de datos.

4.4.7. Resumen de dependencias

Page 77: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 76 de287 Ing. Hugo Daniel Flores

La siguiente tabla (Tabla 3) resume las entradas principales para los operadores. Esto no significa que solo las listas de entradas puestas deberían ser consideradas, por ejemplo, los objetivos de negocio deberían ser distribuidos a todo los operadores. Sin embargo, el operador debería dirigir cuestiones específicas elevadas por sus entradas.

Frase Entregable Referido a Relacionado a Entender el negocio

Background

Objetivo de negocio Backgorund Terminología

Creterio de éxito de negocio Objetivo de negocio

Inventario de recursos

Requerimientos, asunciones y restricciones

Objetivo de negocio

Riesgos y contingencias Objetivo de negocio - Criterio de éxito de negocio

Terminología Backgorund Objetivo de negocio

Costos y beneficios Objetivo de negocio Plan de proyecto Metas de minería de datos Objetivo de negocio - Requerimientos, asunciones y

restricciones

Criterio de éxito de minería de datos Criterio de éxito de negocio - Requerimientos, asumciones y restricciones - Metas de minería de datos

Plan de proyecto Objetivo de negocio - Inventario de recursos - Requerimientos, asunciones y restricciones - Riesgos y contingencias

Costos y beneficios

Comprender datos

Reporte de colección inicial de datos Objetivo de negocio - Inventario de recursos - Objetivos de minería de datos

Reporte de descripción de datos Objetivo de negocio - Reporte de colección inicial de datos Reporte de calidad de datos

Reporte de exploración de datos Objetivo de negocio - Reporte de colección inicial de datos Reporte de descripción de datos

Reporte de calidad de datos Objetivo de negocio - Reporte de colección inicial de datos

Preparar datos Set de datos y descripción de set de datos

Objetivo de negocio - Objetivo de minería de datos - Reporte de descripción de datos - Reporte de calidad de datos - Reporte de exploración de datos

Modelar Diseño de test Objetivo de minería de datos - Criterio de éxito de minería de datos

Modelos Objetivo de minería de datos Setear parámetros Setear parámetros Objetivo de minería de datos Modelos

Descripción de modelo Modelos - Setear parámetros - Diseño de test

Evaluación de modelo Criterio de éxito de negocio - Diseño de test - Modelos

Evaluación Evaluar resultado de minería de datos - Criterio de éxito de negocio

Criterio de éxito de negocio - Terminología

Revisión de proceso Objetivo de negocio - Evaluación de resultado de minería de datos - Criterio de éxito de negocio

Pasos a seguir Plan de proyecto - Evaluación de resultado de minería de datos - Criterio de éxito de negocio

Desarrollo Desarrollo de plan Objetivo de negocio - Requerimientos, asunciones y restricciones

Plan de mantenimiento

Plan de mantenimiento Objetivo de negocio - Requerimientos, asunciones y restricciones

Desarrollo de plan

Reporte final y presentación Objetivo de negocio - Terminología - Evaluación de resultado de minería de datos - Criterio de éxito de negocio

Documentación de experiencia Plan de proyecto - Revisión de proceso

Tabla 3: Entradas principales de los operadores

Page 78: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 77 de287 Ing. Hugo Daniel Flores

4.5. Apéndice 4.5.1. Glosario/Terminología

• Actividad: Es parte de una tarea en la Guía de Usuario; describe las acciones para realizar una tarea.

• Metodología de CRISP-DM: El término general para todos los conceptos desarrollados y definidos en el CRISP-DM.

• Contexto de minería de datos: Un conjunto de restricciones y presunciones, tales como el tipo de problema, las técnicas o herramientas, el dominio de aplicación.

• Tipos de problemas de minería de datos: Una clase de típicos problemas de minería de datos, tales como la descripción de datos y el resumen, la segmentación, las descripciones de conceptos, la clasificación, la predicción, el análisis de dependencia.

• Genérico: Una tarea que mantiene un cruce con todos los proyectos de minería de datos posibles.

• Modelo: La capacidad de aplicar algoritmos a un conjunto de datos para predecir atributos objetivos; ejecutable.

• Salida: El resultado tangible de la ejecución de una tarea. • Fase: Un término para la parte de alto nivel del modelo de proceso CRISP-DM; consiste en

tareas relacionadas. • Caso del proceso: Un proyecto específico descrito en términos del modelo de proceso • Modelo de proceso: Define la estructura de proyectos de minería de datos y proporciona la

guía para su ejecución; consiste en el modelo de referencia y en la guía de usuario. • Modelo de referencia: Descomposición de proyectos de minería de datos en fases, tareas, y

salidas. • Especializado: Una tarea que hace presunciones específicas en contextos específicos de

minería de datos. • Tarea: Una serie de actividades para producir una o más salidas; parte de una fase • Guía de usuario: Asesoramiento específico sobre como realizar proyectos de minería de

datos.

4.5.2. Tipos de problemas de minería de datos Por lo general, los proyectos de minería de datos implican una combinación de diferentes tipos de problema, que juntos solucionan el problema de negocio. 4.5.2.1. Descripción de datos y resumen La descripción y el resumen de datos apuntan a la descripción concisa de las características de los datos, típicamente en forma elemental y agregada. Esto da al usuario una descripción de la estructura de los datos. A veces, una descripción y resumen de los datos solo puede ser un objetivo de un proyecto de minería de datos. Por ejemplo, un minorista podría estar interesado en el volumen de ventas de todas las salidas separado por categorías. Los cambios y diferencias de un período anterior podrían ser resumidos y destacados. Esta clase de problema estaría en lo mas bajo de la escala de problemas de minería de datos. En casi todos los proyectos de minería de datos, sin embargo, la descripción y resumen de los datos son un objetivo subordinado en el proceso, típicamente en sus tempranas etapas. En el principio de un proceso de minería de datos, el usuario a menudo no conoce, ni el objetivo preciso del análisis,

Page 79: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 78 de287 Ing. Hugo Daniel Flores

ni la naturaleza exacta de los datos. La exploración inicial del análisis de datos puede ayudar a los usuarios a entender la naturaleza de los datos y formar hipótesis potenciales de la información oculta. La estadística descriptiva simple y las técnicas de visualización proporcionan las primeras ideas sobre los datos. Por ejemplo, la distribución de clientes por edad y regiones geográficas sugiere que partes de un grupo de clientes necesita para ser dirigida para futuras estrategias de comercialización (marketing). La descripción y el resumen de datos típicamente ocurren en combinación con otros tipos de problemas de minería de datos. Por ejemplo, la descripción de datos puede conducir a la postulación (presunción) de segmentos interesantes en los datos. Una vez que los segmentos son identificados y definidos, una descripción y un resumen de estos segmentos son útiles. Es aconsejable llevar a cabo una descripción y resumen de datos antes de que cualquier otro tipo de problema de minería de dato sea especificado (dirigido). En este documento, esto se refleja en el hecho que la descripción y resumen de datos es una tarea en la fase de Comprensión de Datos. El resumen también juega un papel importante en la presentación de los resultados finales. Los resultados de otros tipos de problemas de minería de datos (por ejemplo, las descripciones de conceptos o los modelos de predicción) también pueden ser considerados resumen de datos, pero sobre un nivel conceptual más alto. Muchos sistemas de informe, paquetes estadísticos, OLAP, y sistemas EIS pueden cubrir la descripción y resumen de datos, pero hacerlo usualmente no proporciona algunos métodos para realizar modelado más avanzado. Si la descripción y resumen de datos son considerados un tipo de problema independiente y ningún modelado futuro es requerido, entonces estas herramientas pueden ser apropiadas para realizar los compromisos de minería de datos. 4.5.2.2. Segmentación La segmentación apunta a la separación de los datos en subgrupos o clase significativos e interesantes. Todos los miembros de un subgrupo comparten características comunes. Por ejemplo, en el análisis de cesta de compras, uno podría definir los segmentos de cestas según los artículos que ellos contienen. La segmentación puede ser realizada a mano o semi-automáticamente. El analista puede suponer ciertos subgrupos como relevantes para la pregunta de negocio, basada sobre un conocimiento previo o sobre el resultado de la descripción y el resumen de datos. En adición, hay también técnicas automáticas de agrupamiento (clustering) que pueden descubrir las estructuras antes insospechadas y ocultas en datos que permite la segmentación. La segmentación a veces puede ser un objetivo de minería de datos. Entonces la detección de segmentos sería el objetivo principal de un proyecto de minería de datos. Por ejemplo, todas las direcciones en áreas de código postal con la edad mas alta que el promedio y un ingreso podrían ser seleccionadas para enviar publicidad para seguro de clínica de ancianos. Muy a menudo, sin embargo, la segmentación es un paso hacia la solución de otros tipos de problema. Entonces, el objetivo es de guardar (mantener) el tamaño de los datos manejables o encontrar los subconjuntos de datos homogéneos que son más fáciles para analizar. Típicamente en grandes conjuntos de datos variados afectan el alcance de cada uno y obscurece los patrones interesantes. Entonces, la segmentación apropiada hace la tarea más fácil. Por ejemplo, analizar las dependencias entre artículos en millones de cestas de compras es muy difícil. Esto es mucho más

Page 80: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 79 de287 Ing. Hugo Daniel Flores

fácil (y más significativo, generalmente) para identificar dependencias en los segmentos interesantes de cestas de compras -por ejemplo, cestas de alto valor, cestas que contienen bienes de confort, o cestas de un día o de un periodo particular. Nota: En la literatura, hay algo de ambigüedad en el significado de ciertos términos. A veces llaman a la segmentación agrupamiento (clustering) o clasificación (classification). El último término es confuso porque algunas personas lo usan para referirse a la creación de clases, mientras que otros piensan en la creación de modelos para predecir las clases conocidas para casos antes no vistos. En este documento, restringimos el término de clasificación al último significado (ver más abajo) y usar el término segmentación con el antiguo significado, aunque las técnicas de clasificación puedan ser usadas para obtener descripciones de los segmentos descubiertos. Técnicas apropiadas:

• Técnicas de agrupamiento (clustering) • Redes Neuronales • Visualización

Ejemplo: Una empresa de venta de autos con regularidad recoge información sobre sus clientes acerca de sus características socioeconómicas como el ingreso, la edad, el sexo, la profesión, etc. Usando análisis de agrupamiento, la empresa puede dividir a sus clientes en subgrupos más comprensibles y analizar la estructura de cada subgrupo. Estrategias de control de comercialización (marketing) específicas son desarrolladas para cada grupo separado. 4.5.2.3. Descripciones de conceptos La descripción de concepto apunta a una descripción comprensible de conceptos o clases. El objetivo no es para completar el desarrollo de modelos con predicción de exactitud alta, sino para ganar ideas. Por ejemplo, una empresa puede estar interesada en el estudio sobre sus clientes más leales y desleales. De una descripción de concepto de estos conceptos (clientes leales y desleales) la compañía infiere que podría estar hecho para encontrar clientes leales o transformar clientes desleales a clientes leales. Una descripción de concepto tiene una conexión cercana tanto a la segmentación como a la clasificación. La segmentación puede conducir a una enumeración de objetos que pertenecen a un concepto o clase sin proporcionar cualquier descripción comprensible. Típicamente la segmentación es llevada a cabo antes de que la descripción de concepto sea realizada. Algunas técnicas -técnicas de agrupamiento conceptuales, por ejemplo-ejecutan la segmentación y descripción de concepto al mismo tiempo. Las descripciones de concepto también pueden ser usadas para objetivos de clasificación. Por otra parte, algunas técnicas de clasificación producen modelos de clasificación comprensibles, que pueden entonces ser consideradas descripciones de concepto. La distinción importante es que la clasificación apunta a ser completa en algún sentido. El modelo de clasificación tiene que aplicarse a todos los casos en la población seleccionada.

Page 81: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 80 de287 Ing. Hugo Daniel Flores

De otra manera, las descripciones de concepto no tienen que ser completas. Es suficiente si ellos describen las partes importantes de los conceptos o clases. En el ejemplo mencionado, puede ser suficiente conseguir las descripciones de conceptos de aquellos clientes que son claramente leales. Técnicas apropiadas:

• Métodos de inducción de reglas • Agrupamiento conceptual

Ejemplo: Usando datos sobre los compradores de coches nuevos y una técnica de inducción de regla, una empresa de coche podría generar las reglas que describen sus clientes leales y desleales. Debajo están los ejemplos de las reglas generadas:

• Si SEXO = macho y EDAD > 51 entonces CLIENTE = leal • Si SEXO = hembra y EDAD > 21 entonces CLIENTE = leal • Si PROFESIÓN = gerente y EDAD < 51 entonces CLIENTE = desleal • Si ESTADO CIVIL = soltero y EDAD < 51 entonces CLIENTE = desleal

4.5.2.4. Clasificación La clasificación asume que hay un conjunto de objetos caracterizados por algún atributo o rasgo que pertenece a diferentes clases. La etiqueta de clase es un valor (simbólico) discreto y es conocido para cada objeto. El objetivo es para construir los modelos de clasificación (a veces llamados clasificadores), que asigna la etiqueta de clase correcta a objetos antes no vistos y sin etiquetas. Los modelos de clasificación sobre todo son usados para el modelado predictivo. Las etiquetas de clase pueden ser presentadas en el avance -definida por el usuario, por ejemplo, o derivadas de la segmentación. La clasificación es uno de los tipos de problemas más importantes de minería de datos que ocurren en una amplia gama de aplicaciones. Muchos problemas de minería de datos pueden ser transformados a problemas de clasificación. Por ejemplo, intentando guardar créditos para evaluar el riesgo de acreditar a un cliente nuevo. Esto puede ser transformado a un problema de clasificación para crear dos clases, clientes buenos y clientes malos. Un modelo de clasificación puede ser generado de los datos de cliente existentes de acuerdo a su comportamiento crediticio. Este modelo de clasificación puede entonces ser usado para asignar a clientes nuevos a una de las dos clases y aceptarlo o rechazarlo. La clasificación tiene conexiones a casi todos los otros tipos de problemas. Los problemas de predicción pueden ser transformados a los problemas de clasificación por discretización de etiquetas de clase continuas, porque las técnicas de discretización permiten transformar rangos continuos en intervalos discretos. Estos intervalos discretos, más que los valores numéricos exactos, son usados como etiquetas de clase, y de ahí conducen a un problema de clasificación. Algunas técnicas de clasificación producen una clase comprensible o descripciones de concepto. Hay también una conexión al análisis de dependencia porque los modelos de clasificación típicamente usan (explotan) y aclaran las dependencias entre atributos.

Page 82: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 81 de287 Ing. Hugo Daniel Flores

La segmentación puede también proporcionar las etiquetas de clase o restringir el conjunto de datos para que buenos modelos de clasificación puedan ser construidos. Es útil analizar desviaciones antes de que un modelo de clasificación sea construido. Las desviaciones y contingencias (cosas fuera de lugar-outliers) pueden obscurecer el patrón que podría permitir un buen modelo de clasificación. De otro modo, un modelo de clasificación también puede ser usado para identificar desviaciones y otros problemas con los datos. Técnicas apropiadas:

• Análisis de discriminante • Métodos de inducción de regla • Aprendizaje por árboles de Decisión • Redes neuronales • La K más cercana • Razonamiento basado en caso • Algoritmos genéticos

Ejemplo: Los bancos generalmente tienen información sobre el comportamiento de pago de sus aspirantes de crédito. Combinando esta información financiera con otra información sobre los clientes, como el sexo, la edad, el ingreso, etc., es posible desarrollar un sistema para clasificar a clientes nuevos como clientes buenos o malos (esto es, el riesgo de crédito en la aceptación de un cliente es alto o bajo). 4.5.2.5. Predicción Otro tipo de problema importante que ocurre en una amplia gama de usos es la predicción. La predicción es muy similar a la clasificación. La única diferencia es que en la predicción el atributo objetivo (la clase) no es un atributo cualitativo discreto, sino es uno continuo. El objetivo de la predicción esta en encontrar el valor numérico del atributo objetivo para objetos no vistos. En la literatura, este tipo de problema es a veces llamado regresión. Si la predicción trata con datos de serie tiempo, entonces a menudo lo llaman pronosticación. Técnicas apropiadas:

• Análisis de regresión • Árboles de regresión • Redes neuronales • La K más cercana • Métodos de la Caja-Jenkins • Algoritmos genéticos

Ejemplo:

Page 83: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 82 de287 Ing. Hugo Daniel Flores

El rédito anual de una empresa internacional esta correlacionado con otros atributos como la promoción, la tasa de cambio, la tasa de inflación, etc. Teniendo estos valores (o estimaciones confiables), la empresa puede predecir su rédito esperado durante el próximo año. 4.5.2.6. Análisis de dependencia El análisis de dependencia consiste en encontrar un modelo que describe dependencias significativas (o asociaciones) entre artículos de datos o acontecimientos. Las dependencias pueden ser usadas para predecir el valor de unos datos de artículo dada la información sobre otros artículos de datos. Aunque las dependencias pueden ser usadas para el modelado predictivo, aquellos son mas usados por su comprensión. Las dependencias pueden ser estrictas o probabilísticas. Las asociaciones son un caso especial de dependencias, que recientemente se han hecho muy populares. Las asociaciones describen las afinidades de artículos de datos (esto es, artículos de datos o los acontecimientos que con frecuencia ocurren juntos). Un típico escenario de aplicación para asociaciones es el análisis de cestas que hacen compras. Allí, una regla como “en el 30 por ciento de todas las compras, la cerveza y cacahuetes han sido comprados juntos” es un ejemplo típico para una asociación. Los algoritmos para detectar asociaciones son muy rápidos y producen muchas asociaciones. Seleccionar el más interesante es un desafío. El análisis de dependencia tiene conexiones cercanas a la predicción y a la clasificación, ya que las dependencias implícitamente son usadas para la formulación de modelos predictivos. Hay también una conexión a descripciones de concepto, que a menudo destacan dependencias. En aplicaciones, el análisis de dependencia a menudo co-ocurre con la segmentación. En grandes conjunto de datos, las dependencias son raras veces significativas porque muchas influencias cubren el uno al otro. En tales casos, se aconseja realizar un análisis de dependencia sobre más segmentos homogéneos de datos. El modelo secuencial es una clase especial de dependencia en las que el orden de acontecimientos es considerado. En un análisis de cesta de compras, las asociaciones describen dependencias entre artículos en un tiempo dado. El patrón secuencial describe el modelo que hace compras de un cliente particular o un grupo de clientes en el tiempo. Técnicas Apropiadas:

• Análisis de correlación • Análisis de regresión • Reglas de asociación • Redes bayesianas • Programación de lógica inductiva • Técnicas de visualización

Ejemplo 1: Usando el análisis de regresión, un analista de negocio ha encontrado que hay dependencias significativas entre las ventas totales de un producto y tanto en su precio como en la cantidad de

Page 84: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 83 de287 Ing. Hugo Daniel Flores

gastos de publicidad. Este conocimiento permite al negocio alcanzar el nivel deseado de las ventas por cambio del precio del producto y/o el gasto de publicidad. Ejemplo 2: Aplicando algoritmos de regla de asociación a datos sobre accesorios de coche, una empresa de coches ha encontrado que en el 95 por ciento de casos, si un CD player es ordenado, una transmisión automática es ordenada también. Basado en esta dependencia, la empresa de coche decide ofrecer estos accesorios como un paquete, que conduce a la reducción del costo.

Page 85: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 84 de287 Ing. Hugo Daniel Flores

Page 86: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 85 de287 Ing. Hugo Daniel Flores

5. Descripción y desarrollo de la industria. 5.1. La industria automotriz y el control de daños y/o averías El nuevo orden internacional que comenzó a gestarse en la década del 70 y que luego fue impulsado por la terminación de la guerra fría y la oleada de internacionalización de las economías ha dado lugar a un nuevo paradigma en la división de trabajo. La especialización del trabajo no se realiza solo a nivel empresa o región sino a nivel mundial y puede involucrar tanto a regiones como a países e inclusive a continentes. Con el desarrollo de las tecnologías de las comunicaciones y los transportes desde hace dos décadas se asiste a un nuevo sistema de producción en la industria automotriz que se sostiene en base a la distribución de la producción de las diferentes marcas y modelos en masa al rededor del mundo. Todas las compañías automotrices hoy en día no producen todos sus modelos en una sola región o país sino que las mismas realizan acuerdos multinacionales para producir determinados modelos en determinados lugares para luego intercambiarlos entre los diferentes puntos de producción. De esta manera para asistir a cada mercado en cada región se realizan los convenios internacionales de intercambio de unidades necesarios para satisfacer las demandas. Este movimiento de intercambio de unidades entre las diferentes regiones del mundo ha llevado a esta industria a desarrollar un estricto control en el seguimiento e identificación del estado de las mismas a lo largo de su recorrido. Como consecuencia inmediata de este traslado de los productos surge que los costos por movimiento, reparación y puesta a punto de los automóviles es mayor a los costos de producción. Esto es, el costo por unidad producida es inferior al costo de la misma desde que sale de planta hasta que llega al cliente final. Las unidades pueden ser movilizados por diferentes tipos de transportes: aéreos, marítimos o terrestres (camiones o tren). El traslado de los autos puede ser con almacenamiento en contenedores o trincados independientemente uno de otro. También son estoqueados/almacenados en diferentes playas o patios con el objeto de ser reparados o simplemente por cuestiones comerciales previas a la distribución. Las cantidades transportadas en masa varían desde unos pocos (7, 11 o 13 unidades por transportes terrestre, por ejemplo bateas) a cientos (por ejemplo por tren) o inclusive a miles de unidades (por ejemplo buques equipados según normas internacionales para transportar desde cientos a miles de unidades). Para el control y la verificación del estado de cada unidad las diferentes empresas (marcas) han creado sus propios estándares de inspección o peritaje o verificación. Cada unidad es inspeccionada según los estándares impuesto por cada compañía en cada uno de los lugares por donde pasan o bien donde se estacionan. El camino que recorre cada unidad desde que sale de planta hasta que llega a un cliente final es lo que se denomina en la industria como “circuito logístico” o “cadena logística”. En cada circuito intervienen una o varias empresas denominadas operadoras logísticas. Cada operador logístico puede contratar (tercerizar) a otras empresas para el transporte de las unidades de punto a punto. Además también es frecuente la tercerización en el desarrollo de las inspecciones o peritajes que es realizado normalmente en los lugares donde se produce el intercambio de responsabilidad de una

Page 87: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 86 de287 Ing. Hugo Daniel Flores

empresa a otra. Así es que como ejemplos estándares de lugares o puntos de inspección se pueden nombrar:

• controles a la bajada o subida de buque; • controles dentro de los buques; • controles a la entrada o salida de un puerto; • controles dentro de los puertos (estiba); • controles a la salida de una planta de producción; • controles a la entrada o salida de un patio / playa (stock) comercial o por reparación; • controles a la subida o bajada de bateas (camiones).

5.2. Circuitos logísticos Los elementos que lo componen son los diferentes medios de transporte (podrían ser llamados enlaces) y los puntos (podrían ser denominados nodos) por donde transitan o se estacionan los autos. Tanto los transportes como los lugares por donde pasan pueden ser lugares de distintas compañías, transportes de distintas compañías e inclusive el traspaso de un trasporte a un lugar o a otro trasporte puede ser realizado por otra empresa. La verificación o control de una unidad en sus diferentes puntos se desarrolla en función de los estándares de cada empresa. Las empresas pueden ser certificadas según normas internacionales o no, esto todavía en esta industria es irrelevante para algunas compañías. Ejemplo 1: Exportación Argentina

Figura 1: Circuito exportación Ejemplo 2: Importación Argentina

Figura 2: Circuito importación

Page 88: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 87 de287 Ing. Hugo Daniel Flores

5.3. Transportes y lugares de almacenamiento Como se ha mencionado anteriormente cada transporte puede tener diferentes capacidades. Normalmente el transporte terrestre se realiza a través de camiones o bateas. Pero también existe la posibilidad de ser realizado a través de trenes para lo cual con frecuencia se utilizan contenedores para resguardar la estructura del auto. Los transportes marítimos son todavía el medio de transporte más rentable para este negocio. Todo buque o barcaza está equipada con la tecnología y herramientas necesarias para transportar algunos miles de autos (hasta 4.000 unidades). Para el transporte de las unidades en el interior de un barco se realiza lo que en el medio se denomina trincado que consiste en amarrar desde diferentes puntos del auto (ruedas o parte de la estructura del auto) al piso del buque. De esta forma se evita el movimiento de los productos cuando el transporte es movilizado a través de un océano o río. El trasporte por vía aérea es el menos frecuente por razones de costo. Pero al igual que con el transporte marítimo las unidades pueden ir trincadas o bien también se suele utilizar contenedores.

Page 89: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 88 de287 Ing. Hugo Daniel Flores

Page 90: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 89 de287 Ing. Hugo Daniel Flores

6. Procesos a analizar, límites y alcance 6.1. Puntos de Control

• Puntos de control y transporte

Para el desarrollo del presente proyecto se definirán y tomarán muestras de puntos y transportes estándares en la industria; esto es, se trabajará con muestras tomadas de inspecciones realizadas frecuentemente por cualquier marca.

A continuación se describen los puntos de control que intervienen en este proyecto.

• Despacho de planta de producción

Inspecciones realizadas sobre todas las unidades que salen de planta de producción y se dirigen por transporte terrestre (camiones) a patios o puertos. La imputabilidad de las observaciones notadas corresponde a planta de producción (normalmente denominada origen o averías de calidad).

• Ingreso a puerto

Procedente de diferentes lugares y trasladadas a través de camiones. La responsabilidad es imputada a transporte terrestre.

• Subida a buque

Luego de estadio en playa de puerto toda unidad es embarcada. Las inspecciones son realizadas previas a la entrada a rampa. La imputabilidad corresponde a patio de puerto.

• Descarga de buque

Unidades inspeccionadas a la descarga de un barco. Los daños y/o averías son imputados a las empresas de transporte marítimo.

• Salida de puerto

Luego de una determinada cantidad de tiempo las unidades son despachadas de puerto con destinos diferentes. Las unidades son cargadas a camiones.

6.2. Estándares de inspección Las observaciones realizadas son parametrizadas según los estándares impuestos por las compañías que intervienen como operadoras logísticas. Los daños y/o averías constan de tres partes claramente diferenciables: parte (área), avería (tipo de daño) y gravedad (severidad):

• Parte: o denominada frecuentemente área, es un código alfanumérico de dos dígitos que identifica una de las partes del auto.

Page 91: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 90 de287 Ing. Hugo Daniel Flores

• Avería: está compuesto por un código alfanumérico de dos dígitos y es utilizado para definir el tipo de daño.

• Gravedad: o severidad compuesto por un código alfanumérico definido para especificar la gravedad del daño o avería descubierto.

Un campo de observación es también considerado como parte de la codificación estándar. Sirve para realizar cualquier aclaración sobre un daño que no se ha podido parametrizar directamente debido a la falta de los códigos que lo pueden definir. Algunos estándares incluyen un cuarto código compuesto por tres o cuatro dígitos alfanuméricos definidos para realizar una observación referente a la avería y que sirve para especificar que la avería fue descubierta en un lugar dos o tres puntos antes de la inspección en ese CP (check point).

Page 92: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 91 de287 Ing. Hugo Daniel Flores

7. Información y datos 7.1. Proceso de inspección y captura de datos El proceso de inspección se realiza solo sobre las partes visibles de la unidad. El presente proyecto no incluye todas las fallas o desperfectos mecánicos del auto. Cada perito o inspector aplica la norma estándar para observar y recorrer el vehículo en búsqueda de daños y/o averías. Las inspecciones sobre cada unidad pueden ser realizadas por uno o más peritos. La cantidad de inspectores depende de los acuerdos realizados entre las empresas y de las verificaciones posteriores o anteriores que se realizan a cada unidad. Los automóviles transitan por las diferentes cadenas logísticas con la documentación correspondiente. Esta documentación incluye lo que se denomina VIN (Vehicle Identification Number) que es un código alfanumérico de 17 o 18 dígitos. El VIN tiene una estructura estándar en la industria y a partir de este se pueden conocer datos del vehículo como el origen, la marca, el modelo, el color, etc. Este número alfanumérico viene impreso en la documentación en código de barras. La gran mayoría de las marcas trabaja con el código de barras denominado 128. Pero también se usan otras normas como la 3 de 9 o 3 de 6. Siempre el auto tiene impreso el VIN en código de barras de 17 o 18 dígitos. Del procedimiento de inspección realizado surge un código de avería si es observada en la unidad. La misma, según un proceso estándar, hoy en día, es cargada manualmente por cada perito. Luego esta información es almacenada en una base de datos la cual es alimentada diariamente por todas las inspecciones realizadas. En algunos procesos de carga masiva de datos se utilizan colectores electrónicos de datos y en otros simplemente se transforma o procesa la información suministrada por la compañía interesada en verificar las unidades (entrega lo que se denomina parking list de vehículos). Los procesos de carga masiva se realizan en proceso batch o por radio frecuencia. Este último va almacenando on line en la base de datos unidad por unidad inspeccionada. 7.2. Sistema normalizado de codificación de daños y/o averías Los datos cargados (los cuales son utilizados en este proyecto) son: VIN, parte, avería, gravedad, observación y código de clave (o código que especifica el origen real de la avería). 7.3. Proceso de educción de requerimientos del proyecto Comprensión del dominio El objetivo del negocio es determinar comportamientos en la ocurrencia de daños y/o averías. Más detalles sobre la determinación de los objetivos se encontrarán en el módulo de “Comprensión del Negocio” de la metodología CRISP-DM detallada más adelante. Los actores involucrados para la obtención de los datos necesarios para el desarrollo del presente trabajo son:

Page 93: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 92 de287 Ing. Hugo Daniel Flores

• Especialistas en consultoría marítima y peritajes navales • Especialistas en inspección de unidades automotrices • Especialistas en desarrollo de tecnología para la captura de datos y desarrollo de base de

datos para el almacenamiento de los mismos. En referencia a los límites del proyecto se puede hacer referencia al hecho de explotar la información almacenada en las base de datos desde el período 2002 a 2008. Se cuenta con dos cadenas logísticas de exportación, dos cadenas logísticas de importación y puntos de control de carga y descarga de autos en puertos de Argentina y Brasil. Identificación de necesidades El objetivo del requisito es la búsqueda e identificación de los diferentes tipos de averías y/o daños en las unidades. Esta necesidad surge de las compañías que intervienen en el proceso como consecuencia del movimiento fluido de unidades de lugar en lugar. Es necesario también por cuestiones operacionales debido a que en toda la cadena de suministro es necesario poder establecer los recursos consumidos para el movimiento de las unidades. Con la posibilidad de asignar recursos es posible establecer los costos que demandará el sistema logístico. Con el establecimiento de los patrones buscado es posible para cada parte interesada poder presupuestar en función de las cantidades movilizadas los costos por reparación de los daños. El equipamiento de los sistemas de transporte es otro ítem a cubrir como consecuencia del descubrimiento de patrones de producción de daños y averías. Todo proveedor de servicio de transporte debe cumplir con determinadas condiciones para asegurar la conducción segura de las unidades. El origen de la información para este proyecto se encuentra en bases de datos normalizadas. Las mismas son alimentadas diariamente por personal capacitado y experto en la identificación de daños. Se cuenta con equipamiento electrónico para la captura automática de datos por lo que la posibilidad de errores en la información es mínima. Del mismo modo la consistencia de la información es controlada diariamente tanto por el personal responsable directamente de la misma como de los clientes que acceden para verificar el estado de las unidades movilizadas a los largo de los circuitos y/o en los diferentes puntos de control. Para la realización de la búsqueda de la información se cuenta con información detallada de:

• Cantidad de unidades transportadas • Lugares por donde pasan las unidades • Trasportes, tipos y compañías • Partes averiadas • Tipos de averías • Severidad de averías • Responsables de averías

Page 94: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 93 de287 Ing. Hugo Daniel Flores

Identificación de riesgos y contingencias Al momento de desarrollar el presente proyecto no se detectan riesgos para su desarrollo y por lo tanto no es necesario definir planes de contingencia. Se cuenta con la información electrónicamente tomada y con el personal capacitado para el análisis de la información. El hecho de no ver en este momento del proyecto riesgos potenciales no significa que no existan puesto que al tratarse específicamente de una minería de datos (definida como el intento por descubrir información oculta en los datos) es probable que los resultados obtenidos coincidan con trabajos relacionados por empresas privadas con el objetivo de reducir o presupuestar costos. En función de esto último se puede describir como plan de contingencia ante este probable riesgo el desarrollo de un informe parametrizado con datos precisos y/o la valorización de los patrones de daños y/o averías detectadas. Evaluación de herramientas de explotación de información Por cuestiones de índole práctico y a los efectos de llevar acabo el presente trabajo de tesis de maestría se utilizan herramientas de explotación de datos suministradas por los Directores de Tesis, las mismas son:

• Software para Construcción de Árboles de Decisión utilizando un Modelo de Clasificación. • Software para Agrupamiento usando Mapas Autoorganizados. • Software para Construcción de Modelos de Predicción.

Page 95: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 94 de287 Ing. Hugo Daniel Flores

Page 96: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 95 de287 Ing. Hugo Daniel Flores

8. Aplicación de la metodología propuesta. 8.1. Comprensión del Negocio 8.1.1. Objetivos del negocio El objetivo del negocio es determinar comportamientos en la ocurrencia de daños y/o averías. De esto último también se puede inferir que es de utilidad para la toma de decisiones el poder determinar o definir los lugares donde se producen los daños y las imputaciones de las mismas. Descubrir donde se producen los siniestro conduce a la definición de políticas para la prevención de las fallas en el sistema. De esto último surgen las medidas correctivas a llevar a cabo. Los objetivos pueden ser resumidos en:

• Identificar daños y/o averías. • Determinar responsabilidad de siniestralidad en función del tipo de avería y tipo de

transporte. • Imputar incidentes según el tipo de transporte. • Determinar tipos de averías y/o daños. • Determinar partes averiadas y/o dañadas que muestren algún tipo de comportamiento. • Especificar gravedad de daños y/o averías. • Especificar lugares donde se producen daños y/o averías tratando de definir patrones de

comportamiento. • Especificar estadísticamente: tipos de transporte que producen daños y/o averías como así

también, partes, tipos de averías, gravedades, lugares donde se producen. • Descubrir información “oculta” en función de los modelos generados a partir de los datos

disponibles. Contexto actual En referencia a la situación global del negocio se puede decir que toda la información necesaria para la explotación de datos se encuentra disponible electrónicamente pero en forma dispersa. Esto es, cada organización que interviene en cada circuito logístico tiene su propia sistema de análisis de daños y/o averías e inclusive los estándares con los cuales se parametriza la información es distinta una de otra. No hay en el medio un estudio en profundidad sobre el comportamiento de los estados por los que atraviesa una unidad automotriz en referencia al estudio de daños, averías, responsables e imputaciones. Departamentos involucrados en cada compañía Los departamentos involucrados en el desarrollo en el control y seguimiento de unidades automotrices de los cuales surge la información y hacia los cuales está destinado el resultado del proyecto son:

• Departamento de calidad • Departamento de ventas

Page 97: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 96 de287 Ing. Hugo Daniel Flores

• Departamento de operaciones • Departamento de sistemas • Departamento de logística y distribución

Área del problema La producción de daños y averías es prácticamente inevitable debido al movimiento de las unidades y al traspaso de empresa a empresa y de medio a medio de trasporte. Del mismo modo es vital para la industria la especificación y determinación clara de las responsabilidades por cada siniestro. De lo afinado que se encuentre el sistema depende el abastecimiento de unidades a los mercados objetivos. La minería de datos debe ser promovida en esta actividad debido a que no existen registros documentados de comportamientos estándares en la producción de siniestros. Todo lo relacionado con cantidades tanto de producción, como exportación o importación están claramente detalladas tanto para las compañías que intervienen en la industria como en los organismos gubernamentales y no gubernamentales. Todo análisis de siniestros y especificación de tiempos de abastecimiento y reparación de unidades se realiza individualmente y en forma reactiva. Solución actual Actualmente se recurre a las consultas manuales (por ejemplo SQL) para obtener los datos necesarios para tener conocimiento de la situación de las unidades. En el caso de que haya discrepancias en cuanto a las responsabilidades o imputabilidad de daños y/o averías se realiza un cruce de información entre las compañías que intervienen la operatoria logística. Objetivo primario de negocio El objetivo primario de negocio para el presente proyecto es la posibilidad de detectar el comportamiento de los daños y/o averías que se producen en las unidades automotrices 0 kilómetro a lo largo de su circuito logístico. Actividades Cumplir con los objetivos propuestos por la aplicación de la metodología de explotación de datos dará respuesta a las siguientes preguntas:

• ¿Cuáles son las partes de los vehículos con mayor y menor incidencia de daños? • ¿Cuáles son los tipos de daños de mayor y menor frecuencia? • ¿Qué gravedad tienen frecuentemente las averías producidas? • ¿Cuáles son la mayor y menor cantidad de partes faltantes? • ¿Cuáles son los lugares donde se producen la mayor y menor cantidad de daños? • ¿Cuáles son los trasportes que provocan la mayor y menor cantidad de daños? • ¿Qué marcas y modelos son dañados con mayor y menor frecuencia? • ¿Cuáles son las mayores y menores combinaciones de partes y averías producidas? • ¿Cuáles son los mayores y menores combinaciones de partes y faltantes producidos?

Page 98: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 97 de287 Ing. Hugo Daniel Flores

• ¿Cuáles son las mayores y menores combinaciones de partes, averías y gravedades producidas?

• ¿Cuáles son los periodos de mayor flujo de exportación e importación de unidades vía marítima?

• ¿Cuáles son los porcentajes de siniestralidad producidas por cantidad de unidades movilizadas?

• ¿Cuáles son los porcentajes de más de una averías en las unidades automotrices? • ¿Cuáles son los porcentajes de unidades dañadas por cantidad de unidades inspeccionadas?

Criterios de éxito Desde el punto de vista del negocio se establece como criterio de éxito el poder:

• Especificar daños y/o averías; cantidades, tipos y severidad. • Establecer responsabilidades específicas. • Especificar tipos de transportes que producen las averías y tipos de avería. • Establecer claramente averías y tipos de averías. • Definir comportamientos de averías y daños. • Especificar lugares de producción de daños. • Definir estadísticamente tipos de transportes, partes, tipos de averías, gravedades e

imputabilidad de daños y/o averías. El criterio de éxito del proyecto estará definido por personal experto en el desarrollo de las actividades de inspección, captura de datos, análisis de información y tecnología con experiencia comprobable en el negocio. Expertos en el proceso operativo y tecnológico llevarán adelante todo el proceso de establecimiento de criterio de éxito del proyecto. 8.1.2. Evaluación de la situación Situación Se cuenta con información detallada de las operaciones vinculadas a las inspecciones de unidades automotrices desde 2002 a la fecha. Todas las bases de información se encuentran normalizadas y con la documentación vinculada a las mismas. Actualmente las bases de datos se encuentran en línea y funcionando bajo un desarrollo Web. Está están siendo utilizadas y alimentadas diariamente. Recursos de software Se cuenta con los siguientes sistemas:

• Servidor de base de datos. • Software para la Construcción de un Árbol de Decisión utilizando un Modelo de

Clasificación. • Software para Agrupamiento usando Mapas Autoorganizados. • Software para la Construcción de un Modelo de Predicción.

Page 99: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 98 de287 Ing. Hugo Daniel Flores

Recursos de hardware Están a disposición los siguientes sistemas de hardware:

• Equipamiento para la producción y almacenamiento de la base de datos, y el entrenamiento de los modelos:

1. CPU Microprocesador Intel ® Core ™ 2, 1.7 GHz, 512 MB RAM, 60 GB HD. 2. CPU Microprocesador Intel ® Pentium ® 4, 1.7 GHz, 640 MB RAM, 80 GB HD. 3. Monitor 17’’. 4. Monitores 17’’. 5. Impresora Láser.

• Servidor de base de datos local instalado para el resguardo de las base de información en línea.

1. Servidor Microprocesador Intel ® Pentium ®, 3 GHz, 1 GB RAM, 160 GB HD. 2. Servidor Microprocesador Intel ® Pentium ®, Dual, 1.8 GHz, 1.5 GB RAM, 320GB

HD. 3. Monitor 15’’.

• Acceso irrestricto a las base de datos en línea y publicadas por Web. • Sistema de banda ancha 3 MB conectado directamente a los servicios publicados en

producción. Además se cuenta con personal experimentado en inspecciones a los cuales se puede acceder para realizar las consultas necesarias para aclarar cualquier inquietud. Fuentes de datos y conocimiento Se cuenta con la siguiente información:

• Base de datos con información vinculada a los movimientos de importación y exportación de vehículos (dos marcas del mercado argentino con destino y origen Brasil y Francia, año 2002 a 2008).

• Base de datos con información vinculada a los movimientos de exportación de vehículos (dos marcas del mercado brasileño con destino Argentina, año 2002 a 2008).

• Base de datos con información de empresa de transporte marítimo referida a los movimientos de unidades de importación y exportación de autos (varias marcas del mercado argentino con destino y origen de diferentes países, año 2006 a 2008).

• Base de datos con unidades de importación y exportación de empresa de transporte marítimo (varias marcas del mercado brasileño con destino y origen de diferentes países, año 2004 a 2008).

• Base de datos con información de movimientos de autos de una empresa de transporte terrestre (una marca del mercado argentino año 2004).

Fuentes de personal Se cuenta con personal experto en inspecciones y con acceso a los mismos si restricciones de tiempo. Hay contacto directo y permanente con los administradores de sistemas, de personal y de soporte técnico.

Page 100: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 99 de287 Ing. Hugo Daniel Flores

El proyecto cuenta con el apoyo técnico operativo y tecnológico en todo momento. Se tiene acceso inclusive a lugares donde se genera la información y se realiza su almacenamiento. Requerimientos, presunciones, y restricciones Los datos pueden ser usados transformando toda información relacionada directamente con:

• Marcas de vehículos. • Modelos de vehículos. • Nombres de buques y compañías marítimas. • Números de batea y nombre de compañías de transporte terrestre. • Nombres de todas las empresas vinculadas a las operaciones en cualquier punto de control.

Para el uso de la información se procederá a desarrollar un sistema de codificación alfanumérica para evitar inconvenientes legales. La validez de los resultados obtenidos puede ser verificada directamente consultando sobre las bases de datos. Terminología Ver Anexo 1: Glosario de terminología relevante de negocio. Ver Anexo 2: Glosario de terminología de minería de datos. 8.1.3. Objetivos de minería de datos Los objetivos en términos de minería de datos son:

• Determinar el comportamiento de partes de vehículos con mayor y menor incidencia de daños.

• Determinar el comportamiento de tipos de daños de mayor y menor frecuencia. • Determinar el comportamiento de gravedades que tienen frecuentemente las averías

producidas. • Especificar el comportamiento de partes faltantes con mayor y menor incidencia. • Determinar lugares donde se producen la mayor y menor cantidad de daños. • Especificar el comportamiento que provoca la mayor y menor cantidad de daños según los

tipos de transporte. • Definir el comportamiento de marcas y modelos dañados con mayor y menor frecuencia. • Definir el comportamiento de las mayores y menores combinaciones de partes y averías

producidas. • Definir el comportamiento de las mayores y menores combinaciones de partes y faltantes

producidos. • Determinar el comportamiento de las mayores y menores combinaciones de partes, averías y

gravedades producidas. • Determinar el comportamiento de los flujos de exportación e importación de unidades vía

marítima. • Determinar el comportamiento de siniestralidad producidas por cantidad de unidades

movilizadas. • Determinar el comportamiento de más de una avería en las unidades automotrices.

Page 101: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 100 de287 Ing. Hugo Daniel Flores

• Definir el comportamiento de unidades dañadas por cantidad de unidades inspeccionadas. Actividades Clasificación: Por año 2003, 2004, 2005, 2006, 2007, 2008.

• Mes de operación • Mes de producción • Puntos de control • Empresa de transporte marítimo • Empresa de almacenamiento • Empresa de producción de autos • Número de batea • Modelo de vehículos • Parte de vehículos • Tipo de averías • Gravedad

Agrupamiento: Por año 2003, 2004, 2005, 2006, 2007, 2008.

• Mes de operación • Mes de producción • Puntos de control • Empresa de transporte marítimo • Empresa de almacenamiento • Empresa de producción de autos • Número de batea • Modelo de vehículos • Parte de vehículos • Tipo de averías • Gravedad

Predicción: Por año 2003, 2004, 2005, 2006, 2007, 2008.

• Mes de operación • Mes de producción • Puntos de control • Empresa de transporte marítimo • Empresa de almacenamiento • Empresa de producción de autos • Número de batea • Modelo de vehículos • Parte de vehículos • Tipo de averías • Gravedad

Page 102: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 101 de287 Ing. Hugo Daniel Flores

Criterios de éxitos de la minería de datos Los resultados serán evaluados y controlados contra consultas SQL directas sobre la base de datos. En función de las muestras de consultas manuales a cada base de datos se establecerán los criterios de éxitos de cada resultado. Para cada resultado se especificará un patrón manual de consulta. 8.1.4. Producción del plan del proyecto Plan de proyecto Se tomarán muestras de las bases de datos en producción según los puntos descritos en los ítems del presente proyecto vistos anteriormente. A cada una de las muestras tomadas se analizará el contenido y se realizarán trabajos de normalización de información y adaptación para su mejor interpretación. En forma paralela se irá describiendo en detalle en diccionario de terminología de negocio (Anexo 1) todo el vocabulario usado en la industria.

• Etapa 1: Análisis de la estructura de datos e información de las bases de datos en producción. Tiempo estimado 3 semanas.

• Etapa 2: Ejecución de consultas para la captura de muestras representativas para lograr los

objetivos del proyecto. Tiempo estimado 1 semana.

• Etapa 3: Conversión y normalización de datos según estructura requerida por los sistemas donde los datos será procesados. Tiempo estimado 3 semanas.

• Etapa 4: Ejecución de los procesos de explotación de datos sobre toda la información

obtenida y parametrizada. Tiempo estimado 1 semana.

• Etapa 5: Análisis de los resultados obtenidos en función de los procesos ejecutados en el punto anterior. Tiempo estimado 2 semanas.

• Etapa 6: Según los resultados obtenidos se procederá a ejecutar nuevamente los procesos de

explotación de datos. Tiempo estimado 1 semana.

• Etapa 7: Desarrollo de reportes en función de los resultados obtenidos y considerando los objetivos de negocios del presente proyecto. Tiempo estimado 1 semana.

• Etapa 8: Análisis y desarrollo de las conclusiones obtenidas según los resultados de cada

proceso. Tiempo estimado 2 semanas.

• Etapa 9: Desarrollo de presentación de los resultados obtenidos a los participantes del proyecto. Tiempo estimado 1 semana.

Page 103: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 102 de287 Ing. Hugo Daniel Flores

Nota: Durante cada una de las etapas del proyecto se irá desarrollando en paralelo el diccionario de terminología de negocio (Anexo 1) y de minería de datos (Anexo 2). Evaluación inicial de herramientas y técnicas Construcción de árboles basado en modelo de clasificación. Los Árboles de clasificación, o también llamados modelos basados en árboles, se fundamentan en el principio de “divide y vencerás”, construyendo un árbol que en cada nodo establece unas condiciones sobre un atributo, dividiendo así el conjunto de casos en subconjuntos que cumplen cada condición. Los subconjuntos se vuelven a dividir añadiendo nuevos niveles al árbol hasta detenerse mediante algún criterio. Agrupamiento usando mapas autoorganizados Técnicas que agrupan los datos en función de una distancia sin utilizar ningún tipo de información externa para organizar los grupos. Clustering no supervisado. Conjunto de técnicas que agrupan los datos en función de una distancia sin utilizar ningún tipo de información externa para organizar los grupos. Dependiendo de la forma en la que los datos son agrupados, podemos distinguir dos tipos de clustering:

• Jerárquico: El clustering jerárquico aglomeratico es un método determinista basado en una matriz de distancias. Establece pequeños grupos de genes/condiciones que tienen un patrón de expresión común y posteriormente construye un dendograma (representación grafica de un grupo de relaciones basadas en la cercanía o similitud entre los datos) de forma secuencial. El árbol o dendograma, establece una relación ordenada de los grupos previamente definidos y la longitud de sus ramas es una representación de la distancia entre los distintos nodos del mismo. En el desarrollo del clustering jerárquico se han utilizado diferentes algoritmos (UPGMA, Ward, etc.) aunque todos siguen la misma estrategia en general: separan cada gen en un nodo diferente, calculan la distancia entre los dos genes más próximos y los juntan en un cluster. Entonces se vuelve a calcular la matriz de distancias sustituyendo los dos patrones que se han unido por el promedio de ambos. En cada paso, los algoritmos son capaces de juntar los genes no solo de dos en dos sino muchos más a la vez. Muchos de ellos simplemente se diferencian en la forma en la que calculan la distancia del nuevo cluster formado al resto de los elementos de la matriz, y en este sentido, la aproximación del “Average linkage” (algoritmo que opera agrupando iterativamente los genes o clusters que presentan la distancia media mas pequeña en cada paso sucesivo del calculo de la matriz de distancias) es la mas utilizada.

• Por otro lado existe el clustering jerárquico divisivo que es similar al anterior pero agrupa

los genes de forma inversa. Mientras que el clustering aglomerativo separa inicialmente todos los genes y posteriormente los va agrupando para construir clusters más grandes, el clustering divisivo agrupa inicialmente todos los genes en un único cluster y sucesivamente los va separando hasta que cada uno se encuentre aislado como una entidad. Es decir, el método divisivo va identificando aquellos genes con un patrón más diferente para separarlos en el espacio lo más posible. Este es el caso de SOTA (Self-Organizing Tree Algorithm). A pesar de que no esta exento de problemas, el clustering es una herramienta poderosa para la reducción de los datos obtenido de microarrays y para el estudio de posibles hipótesis que

Page 104: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 103 de287 Ing. Hugo Daniel Flores

relacionan los clusters de genes obtenidos con el fenotipo. Sin embargo, este tipo de relaciones deben ser formalmente validadas por otros experimentos adicionales.

• No jerárquico: En este caso los algoritmos comienzan a calcular la matriz de distancias a

partir de un numero predefinido de clusters y van recolocando de forma iterativa los genes en los diferentes grupos hasta minimizar la dispersión interna de cada cluster. Los dos algoritmos más representativos de este tipo de clustering son:

1. K-Medias: es un algoritmo que comienza con una muestra de “k” genes elegidos al azar

de la matriz original de datos. Cada uno de ellos se utiliza como el centroide inicial de los “k” clusters que se van a formar. La matriz de distancias se calcula desde dicho centroide hasta cada uno de los genes de la matriz de datos y cada uno de ellos será asignado de esta forma al centroide más cercano. Entonces la matriz de distancias se recalcula reemplazando cada centroide por la media de los genes asignados a él y el algoritmo repite entonces el proceso anterior. El mapa de clusters que ofrece este algoritmo carece de topología.

2. SOM: los mapas auto-organizados (Self-Organising Maps) son redes neuronales. El

algoritmo permite, de forma iterativa, que los patrones mas parecidos se vayan juntando entre si y alejándose de aquellos otros que son mas diferentes. Este tipo de algoritmos son más fiables y robustos puesto que se basan en redes neuronales que por definición son capaces de trabajar con grandes cantidades de datos con ruido. Sin embargo, no carece de ciertos inconvenientes. SOM es una herramienta particularmente útil en el tratamiento de datos procedentes de series temporales.

El gran problema que presentan estos métodos no jerárquicos es que al no generar un dendograma no permiten hacerse una idea de la representación espacial de los genes, la cual suele ofrecer un conocimiento intuitivo de cómo analizar los datos de microarrays.

Clustering supervisado: se basa en la idea de que para la clasificación de la mayoría de muestras biológicas ya existe información preliminar que puede utilizarse para agrupación de nuevos datos en clusters. Los métodos supervisados aprenden de esta información previa, generalmente ofrecida por un conjunto de datos de “entrenamiento”, la forma en que deben clasificar los nuevos datos (genes o condiciones) que se les presentan. SVM (Supported Vector Machines): es una técnica lineal que utiliza hiperplanos para separar los datos en el espacio como puntos negativos o positivos. Los datos de estudio son clasificados respecto de otro conjunto de datos previamente conocido. Preceptrones: están basados en redes neuronales. Tienen algunas ventajas sobre las SVM como por ejemplo la capacidad de clasificar muchas muestras al mismo tiempo y discriminar entre varias clases diferentes. Construcción de un modelo de predicción Otro tipo de problema importante que ocurre en una amplia gama de usos es la predicción. La predicción es muy similar a la clasificación. La única diferencia es que en la predicción el atributo objetivo (la clase) no es un atributo cualitativo discreto, sino es uno continuo.

Page 105: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 104 de287 Ing. Hugo Daniel Flores

El objetivo de la predicción esta en encontrar el valor numérico del atributo objetivo para objetos no vistos. En la literatura, este tipo de problema es a veces llamado regresión. Si la predicción trata con datos de serie tiempo, entonces a menudo lo llaman pronosticación.

8.2. Comprensión de Datos 8.2.1. Recolección de datos iniciales 8.2.1.1. Informe de la recolección de datos inicial

• Identificación de autos Cada unidad automotriz se identifica con un número el cual se específica en cada uno de los registros que componen el presente trabajo. Toda unidad está relacionada con una avería la cual es producida en un determinado lugar, por una determinada empresa responsable.

• Modelos

Los datos relacionados con el nombre real del modelo son reemplazados por códigos numéricos los cuales son extraídos directamente de cada consulta a la base de datos.

• Lugares

Los diferentes tipos de lugares están codificados. Los lugares están relacionados con los sitios donde las unidades son estacionadas transitoriamente.

• Tipos de transporte

Los transportes también están codificados por un número y los mismos son de diferente tipo. Esta información es referida a los transportes y tipos de transporte que trasladan los vehículos de un sitio a otro.

• Empresas

Cada empresa responsable por un siniestro es extraída con un código numérico. Todo sitio o transporte están vinculados a una empresa.

• Partes

Cada parte de una unidad automotriz es identificada con un número que usualmente está compuesto por dos dígitos alfanuméricos. Cada número representa una parte de un auto.

• Averías

Cada tipo de avería de cada siniestro está representado por un número. Normalmente es un código compuesto por dos dígitos alfanuméricos.

• Gravedades

Los diferentes niveles de avería son también extraídos con un número. Representan la severidad que tiene una avería en una determinada parte del auto.

• Observación También referida a cada avería y tiene como objetivo el describir un daño que no puede ser codificado en función del estándar de inspección especificado. Es un campo alfanumérico de N cantidad de caracteres.

Page 106: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 105 de287 Ing. Hugo Daniel Flores

• Fechas Las fechas son extraídas en formato numérico con el formato aaaammdd: 4 caracteres numéricos correspondientes al año, 2 al mes y 2 al día.

Requerimientos de información La información necesaria para el logro de los objetivos del proyecto son los descritos en el ítem anterior y lo mismos se encuentran disponibles en las bases de datos. Criterio de selección de los datos Los atributos específicos necesarios para la minería de datos son:

• Identificador de autos • Fecha de operación en la que se detecta el daño • Modelo de cada unidad • Lugar • Parte del auto donde se produce la avería • Tipo de avería producida en cada unidad • Severidad o gravedad de avería producida • Observaciones por cada unidad

Tablas seleccionadas para la extracción de datos:

• Autos • Operaciones • Daños • Autos – Operaciones • Modelos • Marcas • Lugares • Empresas • Partes • Averías • Gravedades • Compañías • Buques

Los datos se extraerán según la fecha de operación en la que se ha detectado cada avería. Los periodos establecidos para realizar las particiones de datos extraídos es anual des el año 2003 hasta el año 2008. Todos los datos son extraídos de un sistema estándar como lo es el SQL Server. La estructura de cada base de datos esta normalizada. Inserción y transformación de datos Los datos que contienen solo descripciones compuestas por caracteres alfanuméricos son los relacionados con las observaciones.

Page 107: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 106 de287 Ing. Hugo Daniel Flores

En cuanto a la transformación de datos se encuentra la necesidad de codificar los datos de modelos debido a que los mismos se encuentran (en dos de las marcas incluidas en el presente proyecto) en formato de caracteres. Para cada una de las consultas realizadas en la generación del código seleccionador se procede a la transformación automática de los modelos en códigos numéricos. 8.2.2. Descripción de datos En lineamientos generales todos los datos extraídos están codificados numéricamente por lo tanto la necesidad de manipulación de los mismos es mínima a la hora de llevarlos a los modelos a utilizar en el proyecto. Los tipos de datos extraídos son:

• Identificador de autos: numérico • Fecha de operación en la que se detecta el daño: numérico • Modelo de cada unidad: numérico • Lugar: numérico • Parte del auto donde se produce la avería: numérico • Tipo de avería producida en cada unidad: numérico • Severidad o gravedad de avería producida: numérico • Observaciones por cada unidad: alfanumérico

Análisis volumétrico de datos Datos y métodos de captura Los datos son extraídos realizando consultas con tecnología SQL. Luego la información estructurada es almacenada en planillas de cálculo y posteriormente se cargan en los modelos para ser analizados. Si es necesario algún tipo de transformación para cada grupo de datos capturado el proceso para transformar los mismos se realiza con sentencias SQL. La disponibilidad de datos es 100 % accesible. Fuentes de datos Como lo mencionado en párrafos anteriores la fuente de datos se obtiene por en línea desde los sistemas en producción las cuales son alimentadas diariamente. Tablas y relaciones Autos – Operaciones: Estas tablas se relacionan para identificar las operaciones que son realizadas diariamente y la cantidad de unidades que contienen las mismas. Daños – Autos – Operaciones: Esta relación permite al sistema relacionar las averías tomadas a cada auto y para una operación especifica. Daños – Partes: Relacionadas para obtener los códigos y la descripción con la que se identifica cada parte en un daño determinado.

Page 108: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 107 de287 Ing. Hugo Daniel Flores

Daños – Averías: Estas tablas están relacionadas para obtener los códigos y descripción de los diferentes tipos de averías contenidos en un daño. Daños – Gravedades: Relacionadas para detallar los códigos y la descripción de cada nivel de gravedad para un daño específico. Operaciones – Buques: Desde allí se obtienen los datos vinculados a los buques que forman parte de una operación determinada si la misma es realizada en puerto tanto a la bajada como a la subida de los autos a cada navío. Operaciones – Compañías: Relacionadas para obtener información vinculada a las empresas responsables por los daños u observaciones realizadas para cada unidad automotriz. Operaciones – Puntos de control: Toda operación está vinculada a un lugar específico en la cadena. Esta relación permite al sistema obtener información detallada de lugar donde se realizó la inspección del auto. Operaciones – Imputaciones: Estas tablas están relacionadas para poder saber cuales es el tipo de transporte o bien el tipo de lugar donde se produce una determinada avería. 8.2.3. Exploración de datos

• Árboles de Decisión con Modelo de Clasificación. El algoritmo de construcción de árboles de decisión trabaja sobre la cantidad de registros tomadas sin especificación de cantidad máxima y el objetivo inicial es el descubrimiento de patrones para el comportamiento de las averías en lugares, tipos de transporte, modelos y marcas. El procesamiento de datos se realiza según los periodos definidos. • Agrupamiento con Mapas Autoorganizados. El agrupamiento de información se realiza con 5000 registros como máximo y se toman matrices de 3 x 3, 4 x 4, y 10 x 10. Del mismo modo que en el algoritmo anterior el proceso de la información se realiza en función de los periodos establecidos. Los agrupamientos se realizan sobre modelos, lugares, partes, averías y severidades. • Modelos de Predicción. La construcción de los modelos de predicción se desarrolla sobre 2000 registros como cantidad máxima. Se procesan corridas para el análisis de datos de partes, averías, lugares, modelos, severidades y marcas. Con esta información se puede obtener el comportamiento de las averías en relación a determinadas partes, lugares, y tipos de transporte. En este caso también los registros son procesados según los periodos establecidos.

Informe de exploración de datos Se realiza la exploración de datos sobre información extraída desde el año 2003 al 2008. Los primeros resultados van a mostrar información estadística y principalmente sirve para determinar la consistencia y completitud de datos.

Page 109: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 108 de287 Ing. Hugo Daniel Flores

También en esta etapa se va ha poder ver la necesidad de extraer de la base de datos atributos que posiblemente fueron omitidos y los cuales a partir de esta primera exploración se pueden vislumbrar. De la exploración inicial de toda la información disponible para el presente estudio se define la división de los periodos de procesamiento de datos de la siguiente forma:

• Muestra 1: Año 2003, 16 modelos.

• Muestra 2: Primer semestre año 2004, 11 modelos.

• Muestra 3: Segundo semestre año 2004, 13 modelos.

• Muestra 4: Primer semestre año 2005, 19 modelos.

• Muestra 5: Segundo semestre año 2005, 18 modelos.

• Muestra 6: Primer semestre año 2006, 18 modelos.

• Muestra 7: Segundo semestre año 2006, 22 modelos.

• Muestra 8: Primer semestre año 2007, 20 modelos.

• Muestra 9: Segundo semestre año 2007, 22 modelos.

• Muestra 10: Primer semestre año 2008, 22 modelos. Para cada uno de los periodos establecidos el estudio comprende los siguientes lugares:

• Importación: salida de planta de origen, subida a buque puerto de origen, bajada de buque puerto de destino, salida de puerto de destino.

• Exportación: salida de planta, ingreso a puerto, subida a buque. En referencia a las empresas y tipos de transporte por cada lugar se encuentran:

• Transporte terrestre: 4 empresas. • Transporte marítimo: 92 buques correspondientes a 21 compañías. • Puertos: 3 empresas.

Para concluir con el presente informe de exploración de datos se detallan las diferentes cantidades de datos a analizar y los gráficos donde corresponden.

• Cantidad total de registros explotar: 50246 • Cantidad total de modelos que intervienen: 22 • Cantidad de partes de autos: 99 • Cantidad de tipos de averías: 11

Page 110: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 109 de287 Ing. Hugo Daniel Flores

En los gráfico siguientes se muestran resultados de la exploración de datos inicial sobre al totalidad de la información con la que se desarrolla el presente proyecto. Los gráficos muestran la información den dibujo de barras y de tortas para una mejor interpretación de los resultados. El Gráfico 1 muestra las cantidades de unidades producidas en función de los lugares donde se producen y del recorrido que realizan.

2390

22075

5070

1544

0

5000

10000

15000

20000

25000

Retiro Fábrica deOrigen

Subida BuquePuerto de Origen

Bajada de Buque Retiro de Puerto

Gráfico 1: Cantidad de averías por lugar (Importación de vehículos)

En el Gráfico 2 se muestran las mismas cantidades del gráfico 1 en dibujo de tortas. Allí también se puede observar el porcentaje de averías en función de los lugares en un circuito común de importación de vehículos.

Retiro Fábrica de Origen; 2390; 8%

Subida Buque Puerto de Origen; 22075; 71%

Bajada de Buque; 5070; 16%

Retiro de Puerto; 1544; 5%

Gráfico 2: Cantidad de averías por lugar, cantidades y porcentajes (Importación de vehículos)

El Gráfico 3 permite ver las cantidades por lugares de detección de averías en un circuito estándar de exportación de autos.

Page 111: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 110 de287 Ing. Hugo Daniel Flores

10137

6647

2383

0

2000

4000

6000

8000

10000

12000

Transferencia ubicación ylínea de carga

Ingreso a Puerto Subida a Buque

Gráfico 3: Cantidad de averías por lugar (Exportación de vehículos)

El Gráfico 4 detalla las cantidades de averías en función de los lugares y permite ver los porcentajes y cantidades en un circuito estándar de exportación.

Transferencia ubicación y línea de carga; 10137; 53%Ingreso a Puerto; 6647; 35%

Subida a Buque; 2383; 12%

Gráfico 4: Cantidad de averías por lugar, cantidades y porcentajes (Exportación de vehículos)

El Gráfico 5 muestra los 10 modelos de vehículos con mayor cantidad de dañados.

17 20 9 5 7 13 8 18 6 5

14060

11890

9129

48143734

26121577

798 434 2530

2000

4000

6000

8000

10000

12000

14000

16000

1 2 3 4 5 6 7 8 9 10

Gráfico 5: Los 10 modelos con mayor cantidad de averías

El Gráfico 6 permite ver los 10 modelos con mayor cantidad de averías especificando cantidades y porcentajes del total tomado como referencia.

Page 112: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 111 de287 Ing. Hugo Daniel Flores

1; 17; 16%

2; 20; 18%

3; 9; 8%4; 5; 5%5; 7; 6%

6; 13; 12%

7; 8; 7%

8; 18; 17%

9; 6; 6% 10; 5; 5%

Gráfico 6: Los 10 modelos con mayor cantidad de averías, porcentajes y cantidades

El Gráfico 7 muestra las 10 partes de vehículos dañadas más frecuentemente. Solo se toman estás 10 áreas para tener referencia y como consecuencia de la primera exploración de datos.

4403 4401 4286

3926

3568

3029

1975 19061744

1296

0

500

1000

1500

2000

2500

3000

3500

4000

4500

5000

Puerta delanteraDerecha

Parago lpetrasero / Spo iler

t rasero

Puerta delanteraizquierd a

Puerta traseraizquierda

Parago lpedelantero /Pro tecto rd elantero

Puerta traseraDerecha

Manual Otros Spo ilerd elantero

Llanta delanteraizq uierd a

Gráfico 7: Las 10 partes con mayor incidencia de averías

Concluyendo con la exploración de datos se muestra a continuación el Gráfico 8 con las 10 averías producidas en los vehículos con mayor frecuencia.

Page 113: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 112 de287 Ing. Hugo Daniel Flores

20061

17824

5219 5082

819 577 283 223 79 70 90

5000

10000

15000

20000

25000

Rayado -Ro zado

Abo llado P inturas a ltada

Faltante Arrancado -Ro to -

F is urado

Manchado Reventado -Es ta llado

Exces okilo metra je

P ro yecc ió n Des garrado -

Co rtado

Quemado

Gráfico 8: Las 10 partes con mayor incidencia de averías

8.2.4. Verificación de la calidad de datos En función de la exploración inicial de datos se concluye que estos son completos. Los datos cubren los casos requeridos para la obtención de los resultados necesarios para el logro de los objetivos del presente proyecto. Los datos provienen del mismo sistema de base datos el cual no contiene errores, con excepción de los errores gramaticales en los campos que permiten el ingreso de texto, pero esos campos no son requeridos para el presente proyecto. En referencia a los valores omitidos hasta este punto ellos no fueron encontrados. Del mismo modo hasta este ítemes del proyecto no se presentó la necesidad de excluir datos. 8.3. Preparación de Datos 8.3.1. Datos seleccionados Los datos seleccionados para el análisis son los siguientes:

• Número de chasis: tipo entero. • Modelo: tipo entero. • Fecha: tipo entero, formado año (4 dígitos), mes (2 dígitos) y día (2 dígitos). • Lugar: tipo entero. • Parte: tipo entero. • Tipo Avería: tipo entero. • Gravedad: tipo entero. • Observación: tipo carácter.

El volumen de datos a explotar varía en función del software a utilizar, esto es:

Page 114: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 113 de287 Ing. Hugo Daniel Flores

• Modelo de Clasificación: El software no tiene límite especificado por lo que los datos a extraer para el análisis depende exclusivamente del contenido en la base de datos en la división de períodos establecidos.

• Modelo de Clustering: El límite del software es 5000 registros. Si el grupo de datos tomados

en cada periodo supera la restricción establecida por el software se procede a tomar el grupo de valor fecha más bajo. Esto es, se toma la primera parte de los registros del periodo.

• Modelo de Predicción: El límite del software es de 2000 registros. En el caso de superar las

cantidades de datos restringidas por el software se toma como criterio de selección el mismo que para el punto anterior a los efectos de normalizar las consultas (SQL) de extracción de datos.

En referencia a importancia de datos se puede dividir en tres niveles:

• Primaria: Los datos de Modelo, Lugar, Parte, Avería. Estos son los datos en función de los cuales se realizar las explotaciones.

• Secundaria: Los atributos referidos a Fecha y Gravedad. En cuanto a las fechas solo son utilizadas a los efectos de la toma de datos y para establecer un criterio de normalización de las consultas para la extracción de los datos. En cuanto a los datos de gravedad los mismos no tienen variación significativa. Inclusive la variación más alta, que son cuatro, solo la presentan en los dos o tres primeros periodos de selección puesto que luego se achican solo a dos tipos.

• Terciaria: El atributo Observación entra en esta clasificación puesto que el mismo no interviene en la evaluación directa de los modelos.

8.3.2. Limpieza de datos La base de datos con la se cuenta para el presente trabajo contiene información relacionada con operaciones de 4 marcas de automóviles. Pero solo 2 de las marcas contienen información relevante y representativa por su cantidad y diversidad de movimientos. Por este motivo se procedió a eliminar del presente proyecto las otras dos marcas como así también los puntos por donde pasan los cuales no agregan valor al proyecto. Los datos de las marcas que quedan fuera del proyecto pueden ser objeto de un estudio posterior para continuar con esta línea de investigación en la industria automotriz. Los datos de las marcas que quedan excluías del proyecto no tienen importancia relevante para los períodos de distribución de las extracciones realizadas pero si pueden ser relevantes si los períodos establecidos son más prolongados (por ejemplo cada dos años). También por motivos de normalización para el ingreso de información a los modelos de software con los que se cuenta se ha realizado por SQL la codificación de los modelos puesto que los mismos están disponibles en la base de datos en formato de caracteres alfanuméricos. El campo Gravedad puede ser irrelevante en alguno de los períodos iniciales del presente estudio debido a la cantidad de variaciones. Inicialmente son 1, 2, 3 y 4 y al final se reduce solo a dos 1 y 2.

Page 115: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 114 de287 Ing. Hugo Daniel Flores

8.3.3. Construcción de datos Como se ha mencionado en el ítem anterior se ha realizado la transformación del atributo Modelo a formato numérico debido a que los mismos se encontraban en formato alfanumérico. Lo recomendable para el proceso de transformación es la programación de una consulta SQL con las sentencias correspondientes para la transformación de los datos. Todos los datos extraídos previos a la incorporación de los mismos en el software de análisis de datos pasan a un archivo de planilla de cálculo. La explotación de los datos se realizará sobre información codificada en formato numérico y luego de realizar el estudio del significado de los resultados se procede a la captura del significado en la base de datos. Las marcas y modelos excluidos según lo dicho previamente también son filtrados en las consultas estructuradas. Los números de VIN que contiene cada unidad permiten realizar el filtro apropiadamente puesto que es único y universal para cada uno. La estructura del número de identificación del auto permite saber dentro de si mismo a que marca y modelo pertenece, por lo tanto en cada consulta SQL se incorpora la sentencia correspondiente para efectivizar el filtro. 8.3.4. Integración de datos Los datos son extraídos y combinados a partir de tres tablas relacionadas por sus respectivas claves. Los atributos finales se obtienen de las siguientes tablas:

• Chasis Número de identificación de un auto Modelo del vehiculo

• Operaciones Fecha en que se realiza la operación donde interviene el vehículo que sufre la avería.

• Daños Código de parte averiada Código de avería Código de gravedad Observación

Las consultas SQL son capaces de integrar toda la información requerida para el presente proyecto. Todas las líneas de código para la generación de los archivos en función de los períodos establecidos quedan almacenadas en archivos con formato de query. Las consultas programadas se encuentran almacenadas en el Anexo 3.

8.3.5. Formateo de datos

Las herramientas exigen que los datos a explotar sean numéricos. En cuanto al orden en el que debe ir cada columna los programas no requieren una posición específica pero a los efectos de normalizar el presente proceso de trabajo se define el siguiente orden:

Page 116: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 115 de287 Ing. Hugo Daniel Flores

a. Chasis b. Modelo c. Fecha d. Lugar e. Parte f. Avería g. Gravedad h. Observación

8.4. Modelado 8.4.1. Selección de las técnicas de modelado

• Árboles de Clasificación

• Agrupamiento con Mapas Autoorganizados

• Modelo de Predicción La documentación necesaria para la utilización de las herramientas de software que se utilizan en este proyecto de tesis se encuentra disponible en la misma aplicación. La información brindada por cada herramienta es técnicamente precisa y detallada lo cual permite su aplicabilidad sin mayores inconvenientes. Las aplicaciones han sido desarrolladas con tecnologías de planilla de cálculos programadas con uno de los lenguajes de programación estándares en informática. 8.4.2. Generación de la prueba de diseño El conjunto de datos de entrenamiento es almacenado en archivos con formato de hoja de cálculo y se dividen en función de los períodos establecidos previamente para el presente proyecto. Se capturan y almacenan todos los datos según cada período preestablecido. Las cantidades de datos de entrenamiento para los respectivos modelos también es variable en función del software a usar, lo cual se especificó previamente en párrafos anteriores. Las pruebas se han realizado con muestras reducidas de los datos a ser explotados con el formato que se utilizará en los modelos reales. En referencia a la validación de la calidad de datos cada aplicación solicita como parámetros iniciales previos a cada proceso la especificación de los mismos. Cada validación especificada queda almacenada en la aplicación ejecutada. Durante las pruebas de diseño de los modelos se desestimaron los campos de identificación de chasis, fecha de producción de la avería y observación. La decisión fue tomada en función de lo que se conoce hasta este momento de desarrollo del proyecto y no se descarta la posibilidad de recurrir a esta información como consecuencia de un estudio o análisis futuro. De las pruebas también podemos concluir que en función de los resultados que se puedan llegar a obtener del presente estudio, se podría hacer necesario o bien podría ser caso de futuras líneas de

Page 117: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 116 de287 Ing. Hugo Daniel Flores

investigación el desarrollo de la detección de patrones específicamente en uno de los más importantes medios de transporte de autos como lo son los buques. 8.4.3. Construcción de los modelos A continuación se describe la parametrización y ejecución de los modelos en función de las tres herramientas utilizadas por el proyecto. 8.4.3.1. Modelo de Clasificación Construcción de un Modelo de Clasificación para el analizar el comportamiento de los Tipos de Averías. Variables de entrada:

• Código de Parte: Continuous Predictor. • Código de Gravedad: Continuous Predictor. Variables de salida: • Código de Avería: Categorical Predictor.

Construcción de un Modelo de Clasificación para el análisis del comportamiento donde (CP) se producen las averías en un automóvil.

Variables de entrada: • Código de Parte: Continuous Predictor. • Código de Avería: Continuous Predictor. • Código de Gravedad: Continuous Predictor. Variables de salida: • Código de lugar (punto de control): Categorical Predictor.

Construcción de un Modelo de Clasificación para analizar las averías producidas en modelos.

Variables de entrada: • Código de Parte: Continuous Predictor. • Código de Avería: Continuous Predictor. • Código de Gravedad: Continuous Predictor. Variables de salida: • Código de modelo de auto: Categorical Predictor.

El procesamiento de datos de estos modelos permite determinar los niveles de siniestralidad por lugar y modelos de unidades automotrices. Otra información que se obtiene a partir de estos modelos es la imputación de los incidentes y la determinación de los tipos de transportes que los provocan. 8.4.3.2. Modelo de Clustering Construcción de un Modelo de Clustering para establecer el agrupamiento de daños.

Page 118: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 117 de287 Ing. Hugo Daniel Flores

Variables de entrada: • Código de Parte. • Código de Avería. • Código de Gravedad. Variables de salida: • Formación de grupos.

Construcción de un Modelo de Clustering para el agrupamiento de datos en relación a daños y los lugares donde se producen sin considerar la gravedad del daño.

Variables de entrada: • Código de CP. • Código de Parte. • Código de Avería. Variables de salida: • Formación de grupos.

Construcción de un Modelo de Clustering para el agrupamiento de datos de averías en lugares considerando la severidad de los daños.

Variables de entrada: • Código de CP. • Código de Parte. • Código de Avería. • Código de Gravedad. Variables de salida: • Formación de grupos.

Construcción de un Modelo de Clustering para el agrupamiento de datos de averías producidas en modelos sin considerar la gravedad de los daños.

Variables de entrada: • Código de Modelo. • Código de Parte. • Código de Avería. Variables de salida: • Formación de grupos.

Construcción de un Modelo de Clustering para el agrupamiento de datos de averías producidas en modelos especificando la severidad de los daños.

Variables de entrada: • Código de Modelos. • Código de Parte. • Código de Avería.

Page 119: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 118 de287 Ing. Hugo Daniel Flores

• Código de Gravedad. Variables de salida: • Formación de grupos.

La ejecución de estos agrupamientos identifica los daños producidos relacionados con los lugares y modelos de unidades. También permite ver la relación entre las partes averiadas, los tipos de averías producidos y la severidad de los mismos. Del análisis de la relación entre los daños y los lugares se puede establecer el comportamiento de los daños en función del tipo de transporte. 8.4.3.3. Modelo de Predicción Construcción de un Modelo de Predicción para determinar el comportamiento de las partes en función del tipo de avería y gravedad de la misma.

Variables de entrada: • Código de Avería: Continuous. • Código de Gravedad: Continuous. Variables de salida: • Código de Parte: Output.

Construcción de un Modelo de Predicción para determinar el comportamiento de los tipos de avería en función de las partes donde se producen y la gravedad de la misma.

Variables de entrada: • Código de Parte: Continuous. • Código de Gravedad: Continuous. Variables de salida: • Código de Avería: Output.

Construcción de un Modelo de Predicción para establecer el comportamiento de las averías en función del lugar donde se producen.

Variables de entrada: • Código de Parte: Continuous. • Código de Avería: Continuous. • Código de Gravedad: Continuous. Variables de salida: • Código de CP: Output.

Construcción de un Modelo de Predicción para establecer el comportamiento de las averías en función de los modelos de vehículo.

Variables de entrada:

Page 120: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 119 de287 Ing. Hugo Daniel Flores

• Código de Parte: Continuous. • Código de Avería: Continuous. • Código de Gravedad: Continuous. Variables de salida: • Código de Modelo: Output.

Con el procesamiento del Modelo de Predicción es posible encontrar los daños, lugares, tipos de transportes, y modelos donde se producen las averías. Los modelos trabajan sobre los códigos numéricos de las variables introducidas. La traducción de los códigos empleados en el procesamiento de datos se encuentra disponible en el Anexo 4. En el Anexo 4 se encuentra el detalle descriptivo de los modelos, lugares, tipos de transporte, código de área de un auto, tipo de avería de un auto y gravedad de una avería en un automóvil. 8.4.4. Descripción de los modelos 8.4.4.1. Modelo de Clasificación Se trabaja sobre tres categorías: Averías, Lugares y Modelos. El modelo de minería de datos permite visualizar la ocurrencia de los tipos de averías producidos sobre todas las partes y especificando las gravedades. Se observan las cantidades y porcentajes de ocurrencia a lo largo de cada periodo. El análisis de la clase lugares permite visualizar el comportamiento de las averías en los diferentes lugares por donde transitan las unidades automotrices. También permite ver cantidades y porcentajes mostrando una clara relación entre los diferentes lugares donde se producen. Por último se analiza la ocurrencia de las averías por modelos de autos. Al final también es posible encontrar información sobre cantidades y porcentajes por cada período. Para los tres tipos de análisis mencionados se crean los árboles de decisión con sus respectivas reglas. Finalmente este modelo muestra un detalle de los resultados obtenidos como la cantidad de hojas de los árboles generados, la cantidad de nodos, el tiempo de proceso de la herramienta, etc. A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del primer período.

• Averías (Período 1 – Año 2003)

Avería CantidadArrancado - Roto – Fisurado 136Desgarrado – Cortado 23Reventado – Estallado 12Pintura saltada 935Abollado 5338

Page 121: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 120 de287 Ing. Hugo Daniel Flores

Faltante 494Proyección 9Rayado – Rozado 2023Manchado 84Exceso kilometraje 223

Tabla 4: Cantidad de daños y sus códigos correspondientes

Abollado59%

Faltante5%

Proyección0%

Exceso kilometraje2%

Manchado1%

Rayado - Rozado22%

Pintura saltada10%

Arrancado - Roto - Fisurado

1%Desgarrado - Cortado

0%Reventado - Estallado

0%

Gráfico 9: Porcentajes de ocurrencia de averías

• Lugares (Período 1 – Año 2003)

Lugar Cantidad

Retiro Fábrica de Origen 87Subida Buque Puerto de Origen 6925Bajada de Buque 942Retiro de Puerto 352Transferencia ubicación y línea de carga 424Ingreso a Puerto 443Subida a Buque 104

Tabla 5: Cantidad de averías por lugar

Page 122: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 121 de287 Ing. Hugo Daniel Flores

Subida Buque Puerto de Origen

74%

Bajada de Buque10%

Retiro de Puerto4%

Ingreso a Puerto5%

Subida a Buque1% Retiro Fábrica de

Origen1%

Transferencia ubicación y línea de

carga5%

Gráfico 10: Porcentajes de ocurrencia de avería en diferentes lugares

• Modelos (Período 1 – Año 2003)

Modelo Cantidad

Modelo 1 33Modelo 2 33Modelo 3 194Modelo 4 8Modelo 5 595Modelo 9 4143Modelo 11 33Modelo 12 13Modelo 13 436Modelo 14 67Modelo 15 12Modelo 16 13Modelo 17 2662Modelo 18 467Modelo 19 22Modelo 20 546

Tabla 6: Cantidad de averías por modelo

Page 123: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 122 de287 Ing. Hugo Daniel Flores

Modelo 946%

Modelo 1729%

Modelo 110%

Modelo 141%

Modelo 135%

Modelo 120%

Modelo 150%

Modelo 160%

Modelo 32%

Modelo 10%

Modelo 20%

Modelo 56%

Modelo 40%

Modelo 185%

Modelo 206%Modelo 19

0%

Gráfico 11: Porcentajes de ocurrencia de avería en modelos

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del segundo período.

• Averías (Período 2 – Semestre 1 Año 2004)

Avería CantidadQuemado 2Arrancado - Roto – Fisurado 31Desgarrado – Cortado 6Reventado – Estallado 14Pintura saltada 790Abollado 2855Faltante 184Proyección 2Rayado – Rozado 1628Manchado 155

Tabla 7: Cantidad de daños y sus códigos correspondientes

Page 124: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 123 de287 Ing. Hugo Daniel Flores

Pintura saltada14%

Abollado50%

Faltante3%

Manchado3%

Rayado - Rozado29%

Proyección0%

Reventado - Estallado0%

Quemado0%

Arrancado - Roto - Fisurado

1%Desgarrado - Cortado

0%

Gráfico 12: Porcentajes de ocurrencia de averías

• Lugares (Período 2 – Semestre 1 Año 2004)

Lugar Cantidad

Retiro Fábrica de Origen 87Subida Buque Puerto de Origen 6925Bajada de Buque 942Retiro de Puerto 352Transferencia ubicación y línea de carga 424Ingreso a Puerto 443Subida a Buque 104

Tabla 8: Cantidad de averías por lugar

Page 125: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 124 de287 Ing. Hugo Daniel Flores

Subida Buque Puerto de Origen

83%

Bajada de Buque6%

Retiro de Puerto2%

Ingreso a Puerto6%

Subida a Buque1% Retiro Fábrica de

Origen1%

Transferencia ubicación y línea de

carga1%

Gráfico 13: Porcentajes de ocurrencia de avería en diferentes lugares

• Modelos (Período 2 – Semestre 1 Año 2004)

Modelo 1 15Modelo 2 9Modelo 3 52Modelo 5 244Modelo 9 1785Modelo 11 5Modelo 13 562Modelo 14 10Modelo 16 22Modelo 17 2616Modelo 18 28Modelo 20 319

Tabla 9: Cantidad de averías por modelo

Page 126: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 125 de287 Ing. Hugo Daniel Flores

Modelo 110%

Modelo 54%

Modelo 932%

Modelo 20%

Modelo 10% Modelo 3

1%

Modelo 206%

Modelo 180%

Modelo 140%

Modelo 160%

Modelo 1747%

Modelo 1310%

Gráfico 14: Porcentajes de ocurrencia de avería en modelos

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del tercer período.

• Averías (Período 3 – Semestre 2 Año 2004)

Avería CantidadQuemado 4Arrancado - Roto - Fisurado 46Desgarrado - Cortado 8Reventado - Estallado 13Pintura saltada 812Abollado 2375Faltante 274Rayado - Rozado 1794Manchado 29

Tabla 10: Cantidad de daños y sus códigos correspondientes

Page 127: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 126 de287 Ing. Hugo Daniel Flores

Pintura saltada15%

Abollado44%Faltante

5%

Manchado1%

Rayado - Rozado34%

Reventado - Estallado0%

Quemado0%

Arrancado - Roto - Fisurado

1%

Desgarrado - Cortado0%

Gráfico 15: Porcentajes de ocurrencia de averías

• Lugares (Período 3 – Semestre 2 Año 2004)

Lugar Cantidad

Retiro Fábrica de Origen 33Subida Buque Puerto de Origen 4008Bajada de Buque 505Retiro de Puerto 71Transferencia ubicación y línea de carga 20Ingreso a Puerto 491Subida a Buque 228

Tabla 11: Cantidad de averías por lugar

Subida Buque Puerto de Origen

76%

Bajada de Buque9%

Retiro de Puerto1%

Ingreso a Puerto9%

Subida a Buque4% Retiro Fábrica de

Origen1%

Transferencia ubicación y línea de

carga0%

Page 128: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 127 de287 Ing. Hugo Daniel Flores

Gráfico 16: Porcentajes de ocurrencia de avería en diferentes lugares • Modelos (Período 3 – Semestre 2 Año 2004)

Modelo Cantidad

Modelo 1 30Modelo 2 8Modelo 3 6Modelo 5 252Modelo 6 14Modelo 8 2Modelo 9 833Modelo 11 8Modelo 13 457Modelo 14 4Modelo 16 29Modelo 17 3041Modelo 18 40Modelo 20 632

Tabla 12: Cantidad de averías por modelo

Modelo 915%

Modelo 140%

Modelo 139%

Modelo 110%

Modelo 161%Modelo 17

56%

Modelo 30%

Modelo 11%

Modelo 20% Modelo 6

0%

Modelo 55%

Modelo 2012%

Modelo 80%

Modelo 181%

Gráfico 17: Porcentajes de ocurrencia de avería en modelos

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del cuarto período.

• Averías (Período 4 – Semestre 1 Año 2005)

Avería CantidadArrancado - Roto - Fisurado 66Desgarrado - Cortado 2Reventado - Estallado 25Pintura saltada 598Abollado 1099

Page 129: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 128 de287 Ing. Hugo Daniel Flores

Faltante 264Rayado - Rozado 1792Manchado 61

Tabla 13: Cantidad de daños y sus códigos correspondientes

Abollado28%

Faltante7%

Rayado - Rozado45%

Manchado2%

Pintura saltada15%

Arrancado - Roto - Fisurado

2%

Desgarrado - Cortado0%

Reventado - Estallado1%

Gráfico 18: Torta especificando porcentajes de ocurrencia de averías

• Lugares (Período 4 – Semestre 1 Año 2005)

Lugar Cantidad

Retiro Fábrica de Origen 603Subida Buque Puerto de Origen 1849Bajada de Buque 570Retiro de Puerto 137Transferencia ubicación y línea de carga 39Ingreso a Puerto 510Subida a Buque 201

Tabla 14: Cantidad de averías por lugar

Page 130: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 129 de287 Ing. Hugo Daniel Flores

Subida Buque Puerto de Origen

47%

Bajada de Buque15%

Retiro de Puerto4%

Ingreso a Puerto13%

Subida a Buque5%

Retiro Fábrica de Origen15%

Transferencia ubicación y línea de

carga1%

Gráfico 19: Porcentajes de ocurrencia de avería en diferentes lugares

• Modelos (Período 4 – Semestre 1 Año 2005)

Modelo Cantidad

Modelo 1 20Modelo 2 3Modelo 5 200Modelo 6 72Modelo 8 465Modelo 9 433Modelo 13 35Modelo 16 18Modelo 17 2002Modelo 18 86Modelo 20 574

Tabla 15: Cantidad de averías por modelo

Page 131: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 130 de287 Ing. Hugo Daniel Flores

Modelo 131%

Modelo 182%

Modelo 1751%

Modelo 160%

Modelo 2015%

Modelo 55%

Modelo 11%

Modelo 20%

Modelo 812%

Modelo 62%

Modelo 911%

Gráfico 20: Porcentajes de ocurrencia de avería en modelos

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del quinto período.

• Averías (Período 5 – Semestre 2 Año 2005)

Avería CantidadArrancado - Roto - Fisurado 67Desgarrado - Cortado 6Reventado - Estallado 28Pintura saltada 490Abollado 1126Faltante 240Proyección 6Rayado - Rozado 1887Manchado 21

Tabla 16: Cantidad de daños y sus códigos correspondientes

Abollado29%

Faltante6%Proyección

0%

Manchado1%

Rayado - Rozado48%

Pintura saltada13%

Arrancado - Roto - Fisurado

2%

Desgarrado - Cortado0%

Reventado - Estallado1%

Gráfico 21: Porcentajes de ocurrencia de averías

Page 132: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 131 de287 Ing. Hugo Daniel Flores

• Lugares (Período 5 – Semestre 2 Año 2005)

Lugar Cantidad

Retiro Fábrica de Origen 909Subida Buque Puerto de Origen 1208Bajada de Buque 758Retiro de Puerto 248Transferencia ubicación y línea de carga 94Ingreso a Puerto 550Subida a Buque 104

Tabla 17: Cantidad de averías por lugar

Subida Buque Puerto de Origen

32%

Bajada de Buque20%

Retiro de Puerto6%

Ingreso a Puerto14%

Subida a Buque3%

Retiro Fábrica de Origen23%

Transferencia ubicación y línea de

carga2%

Gráfico 22: Porcentajes de ocurrencia de avería en diferentes lugares

• Modelos (Período 5 – Semestre 2 Año 2005)

Modelo Cantidad

Modelo 1 48Modelo 2 8Modelo 5 398Modelo 6 85Modelo 8 608Modelo 9 469Modelo 13 70Modelo 16 4Modelo 17 1795Modelo 18 39Modelo 19 80Modelo 20 266

Tabla 18: Cantidad de averías por modelo

Page 133: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 132 de287 Ing. Hugo Daniel Flores

Modelo 13

Modelo 181%

Modelo 1747%

Modelo 160%

Modelo 192%

Modelo 207% Modelo 5

10%

Modelo 11%

Modelo 20%

Modelo 816%

Modelo 62%

Modelo 912%

Gráfico 23: Porcentajes de ocurrencia de avería en modelos

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del sexto período.

• Averías (Período 6 – Semestre 1 Año 2006)

Avería CantidadArrancado - Roto - Fisurado 34Reventado - Estallado 17Pintura saltada 271Abollado 1681Faltante 247Rayado - Rozado 1499Manchado 4

Tabla 19: Cantidad de daños y sus códigos correspondientes

Faltante7%

Rayado - Rozado40%

Manchado0%

Abollado45%

Arrancado - Roto - Fisurado

1%Reventado - Estallado

0%

Pintura saltada7%

Gráfico 24: Porcentajes de ocurrencia de averías

Page 134: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 133 de287 Ing. Hugo Daniel Flores

• Lugares (Período 6 – Semestre 1 Año 2006)

Lugar CantidadRetiro Fábrica de Origen 631Subida Buque Puerto de Origen 1585Bajada de Buque 580Retiro de Puerto 187Transferencia ubicación y línea de carga 136Ingreso a Puerto 497Subida a Buque 138

Tabla 20: Cantidad de averías por lugar

Subida Buque Puerto de Origen

42%

Bajada de Buque15%

Retiro de Puerto5%

Ingreso a Puerto13%

Subida a Buque4%

Retiro Fábrica de Origen17%

Transferencia ubicación y línea de

carga4%

Gráfico 25: Porcentajes de ocurrencia de avería en diferentes lugares

• Modelos (Período 6 – Semestre 1 Año 2006)

Modelo Cantidad

Modelo 1 4Modelo 2 4Modelo 5 533Modelo 6 69Modelo 8 285Modelo 9 789Modelo 11 2Modelo 13 125Modelo 16 8Modelo 17 1482Modelo 18 10Modelo 19 2Modelo 20 441

Tabla 21: Cantidad de averías por modelo

Page 135: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 134 de287 Ing. Hugo Daniel Flores

Modelo 110%

Modelo 1740%

Modelo 160%

Modelo 133%

Modelo 180%

Modelo 190%

Modelo 514%

Modelo 10%

Modelo 20%

Modelo 88%

Modelo 62%

Modelo 921%

Modelo 2012%

Gráfico 26: Porcentajes de ocurrencia de avería en modelos

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del séptimo período.

• Averías (Período 7 – Semestre 2 Año 2006)

Avería CantidadArrancado - Roto - Fisurado 80Desgarrado - Cortado 5Reventado - Estallado 18Pintura saltada 140Abollado 781Faltante 353Proyección 2Rayado - Rozado 1208Manchado 11

Tabla 22: Cantidad de daños y sus códigos correspondientes

Page 136: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 135 de287 Ing. Hugo Daniel Flores

Abollado30%

Faltante14%

Proyección0%

Manchado0%

Rayado - Rozado47%

Pintura saltada5%

Arrancado - Roto - Fisurado

3%

Desgarrado - Cortado0%

Reventado - Estallado1%

Gráfico 27: Porcentajes de ocurrencia de averías

• Lugares (Período 7 – Semestre 2 Año 2006)

Lugar Cantidad

Retiro Fábrica de Origen 39Subida Buque Puerto de Origen 144Bajada de Buque 547Retiro de Puerto 119Transferencia ubicación y línea de carga 415Ingreso a Puerto 1069Subida a Buque 265

Tabla 23: Cantidad de averías por lugar

Subida Buque Puerto de Origen

6%Bajada de Buque

21%

Retiro de Puerto5%

Ingreso a Puerto40%

Subida a Buque10%

Retiro Fábrica de Origen

2%

Transferencia ubicación y línea de

carga16%

Gráfico 28: Porcentajes de ocurrencia de avería en diferentes lugares

Page 137: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 136 de287 Ing. Hugo Daniel Flores

• Modelos (Período 7 – Semestre 2 Año 2006)

Modelo CantidadModelo 1 21Modelo 2 12Modelo 5 565Modelo 6 76Modelo 7 2Modelo 8 28Modelo 9 170Modelo 10 4Modelo 11 2Modelo 13 106Modelo 15 32Modelo 16 3Modelo 17 260Modelo 18 29Modelo 20 1288

Tabla 24: Cantidad de averías por modelo

Modelo 97%

Modelo 134%

Modelo 110%

Modelo 100%

Modelo 151%Modelo 16

0%

Modelo 522%

Modelo 11%

Modelo 20%

Modelo 70%

Modelo 63%

Modelo 181%

Modelo 2050%

Modelo 81%

Modelo 1710%

Gráfico 29: Porcentajes de ocurrencia de avería en modelos

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del octavo período.

• Averías (Período 8 – Semestre 1 Año 2007)

Avería CantidadArrancado - Roto - Fisurado 62Desgarrado - Cortado 4

Page 138: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 137 de287 Ing. Hugo Daniel Flores

Reventado - Estallado 21Pintura saltada 237Abollado 761Faltante 605Proyección 40Rayado - Rozado 1278Manchado 11

Tabla 25: Cantidad de daños y sus códigos correspondientes

Abollado25%

Faltante20%Proyección

1%

Manchado0%

Rayado - Rozado43%

Pintura saltada8%

Arrancado - Roto - Fisurado

2%

Desgarrado - Cortado0%

Reventado - Estallado1%

Gráfico 30: Porcentajes de ocurrencia de averías

• Lugares (Período 8 – Semestre 1 Año 2007)

Lugar Cantidad

Retiro Fábrica de Origen 20Subida Buque Puerto de Origen 517Bajada de Buque 219Retiro de Puerto 156Transferencia ubicación y línea de carga 1437Ingreso a Puerto 575Subida a Buque 95

Tabla 26: Cantidad de averías por lugar

Page 139: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 138 de287 Ing. Hugo Daniel Flores

Subida Buque Puerto de Origen

17%

Bajada de Buque7%

Retiro de Puerto5%

Ingreso a Puerto19%

Subida a Buque3%

Retiro Fábrica de Origen

1%

Transferencia ubicación y línea de

carga48%

Gráfico 31: Porcentajes de ocurrencia de avería en diferentes lugares

• Modelos (Período 8 – Semestre 1 Año 2007)

Modelo Cantidad

Modelo 1 5Modelo 5 712Modelo 6 43Modelo 7 94Modelo 8 88Modelo 9 209Modelo 13 270Modelo 15 11Modelo 16 22Modelo 17 125Modelo 18 37Modelo 20 1403

Tabla 27: Cantidad de averías por modelo

Page 140: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 139 de287 Ing. Hugo Daniel Flores

Modelo 139%

Modelo 174%

Modelo 161%

Modelo 150%

Modelo 181%

Modelo 2047%

Modelo 61%

Modelo 10%

Modelo 524%

Modelo 83%

Modelo 73%

Modelo 97%

Gráfico 32: Porcentajes de ocurrencia de avería en modelos

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del noveno período.

• Averías (Período 9 – Semestre 2 Año 2007)

Avería CantidadQuemado 2Arrancado - Roto - Fisurado 146Desgarrado - Cortado 10Reventado - Estallado 59Pintura saltada 609Abollado 1016Faltante 641Proyección 2Rayado - Rozado 4689Manchado 14

Tabla 28: Cantidad de daños y sus códigos correspondientes

Page 141: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 140 de287 Ing. Hugo Daniel Flores

Pintura saltada8%

Abollado14%

Faltante9%

Manchado0%

Rayado - Rozado66%

Proyección0%

Reventado - Estallado1%

Quemado0%

Arrancado - Roto - Fisurado

2%

Desgarrado - Cortado0%

Gráfico 33: Porcentajes de ocurrencia de averías

• Lugares (Período 9 – Semestre 2 Año 2007)

Lugar Cantidad

Retiro Fábrica de Origen 18Subida Buque Puerto de Origen 635Bajada de Buque 282Retiro de Puerto 60Transferencia ubicación y línea de carga 4503Ingreso a Puerto 1167Subida a Buque 523

Tabla 29: Cantidad de averías por lugar

Subida Buque Puerto de Origen

9%Bajada de Buque

4%

Retiro de Puerto1%

Ingreso a Puerto16%

Subida a Buque7%

Retiro Fábrica de Origen

0%

Transferencia ubicación y línea de

carga63%

Gráfico 34: Porcentajes de ocurrencia de avería en diferentes lugares

Page 142: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 141 de287 Ing. Hugo Daniel Flores

• Modelos (Período 9 – Semestre 2 Año 2007)

Modelo CantidadModelo 2 1Modelo 5 839Modelo 6 18Modelo 7 1747Modelo 8 75Modelo 9 156Modelo 13 358Modelo 15 100Modelo 16 9Modelo 17 30Modelo 18 36Modelo 20 3819

Tabla 30: Cantidad de averías por modelo

Modelo 135%

Modelo 170%

Modelo 160%

Modelo 151%Modelo 18

1%

Modelo 2054%

Modelo 60%

Modelo 20%

Modelo 512%

Modelo 81%

Modelo 724%

Modelo 92%

Gráfico 35: Porcentajes de ocurrencia de avería en modelos

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del décimo período.

• Averías (Período 10 – Semestre 1 Año 2008)

Avería CantidadArrancado - Roto - Fisurado 144Desgarrado - Cortado 5Reventado - Estallado 76Pintura saltada 334Abollado 751Faltante 1771Proyección 16

Page 143: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 142 de287 Ing. Hugo Daniel Flores

Rayado - Rozado 2223Manchado 187

Tabla 31: Cantidad de daños y sus códigos correspondientes

Abollado14%

Faltante32%

Proyección0%

Manchado3%

Rayado - Rozado41%

Pintura saltada6%

Arrancado - Roto - Fisurado

3%

Desgarrado - Cortado0%

Reventado - Estallado1%

Gráfico 36: Porcentajes de ocurrencia de averías

• Lugares (Período 10 – Semestre 1 Año 2008)

Lugar Cantidad

Retiro Fábrica de Origen 12Subida Buque Puerto de Origen 454Bajada de Buque 318Retiro de Puerto 124Transferencia ubicación y línea de carga 3008Ingreso a Puerto 958Subida a Buque 633

Tabla 32: Cantidad de averías por lugar

Page 144: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 143 de287 Ing. Hugo Daniel Flores

Subida Buque Puerto de Origen

8%

Bajada de Buque6%

Retiro de Puerto2%

Ingreso a Puerto17%

Subida a Buque11%

Retiro Fábrica de Origen

0%

Transferencia ubicación y línea de

carga56%

Gráfico 37: Porcentajes de ocurrencia de avería en diferentes lugares

• Modelos (Período 10 – Semestre 1 Año 2008)

Modelo Cantidad

Modelo 2 46Modelo 5 433Modelo 6 57Modelo 7 1883Modelo 8 26Modelo 9 142Modelo 13 190Modelo 15 74Modelo 16 26Modelo 17 38Modelo 18 21Modelo 20 2571

Tabla 33: Cantidad de averías por modelo

Page 145: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 144 de287 Ing. Hugo Daniel Flores

Modelo 133%

Modelo 171%

Modelo 160%

Modelo 151%

Modelo 180%

Modelo 2048%

Modelo 61%

Modelo 21%

Modelo 58%

Modelo 80%

Modelo 734%

Modelo 93%

Gráfico 38: Porcentajes de ocurrencia de avería en modelos

8.4.4.2. Modelo de Clustering El análisis es realizado agrupando: Parte – Avería – Gravedad, Lugar – Parte – Avería, Lugar – Parte – Avería – Gravedad, Modelo – Parte – Avería, Modelo – Parte – Avería – Gravedad. El agrupamiento de partes, averías y gravedades permite visualizar el comportamiento de los siniestros ocurridos separando los daños en función del formato establecido por el estándar utilizado. El análisis es realizado por cada período en el presente proyecto. Para el segundo caso se toman el agrupamiento considerando el lugar donde se produce una avería, el tipo de avería y la parte del automóvil que es afectado. Al igual que para el anterior agrupamiento este análisis se realiza para cada uno de los periodos. En el siguiente proceso al agrupamiento se suma la gravedad del siniestro. Luego, el análisis posterior de los datos tiene en cuenta el agrupamiento de la información considerando el modelo averiado y la parte del auto y tipo de avería producido. Finalmente al agrupamiento anterior y al igual que en el caso de los lugares el agrupamiento de los modelos incluye la gravedad de cada siniestro. Cada uno de los procesos realizados muestra al final el resultado estadístico logrado. Allí se especifican cantidades por grupos, cantidad de grupos formados, porcentajes, etc. El proceso de agrupamiento es realizado con matrices cuadradas de 10 x 10 en todos los casos. A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del primer período.

• Parte – Avería – Gravedad (Período 1 – Año 2003)

Parte Avería Gravedad Cantidad Fila ColumnaOverall Tapa acceso gancho

remolque Faltante Mediano

Page 146: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 145 de287 Ing. Hugo Daniel Flores

Cluster 1 Puerta delantera derecha

Arrancado - Roto - Fisurado

Intolerable 99 1 1

Cluster 2 Escape Abollado Grave 779 1 2

Cluster 3 Alfombra suplementarias

Rayado - Rozado Grave 455 1 3

Cluster 4 Parabrisa Proyección Mediano 362 1 4

Cluster 5 Luz trasera izquierda Faltante Mediano 626 1 5

Cluster 6 Puerta delantera derecha

Faltante Leve 1130 1 6

Cluster 7 Cubierta delantera izquierda

Rayado - Rozado Mediano 138 1 7

Cluster 8 Panel lateral izquierdo

Abollado Leve 1057 1 9

Cluster 9 Panel lateral derecho Abollado Mediano 354 1 10

Tabla 7: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad

• Lugar – Parte – Avería (Período 1 – Año 2003)

Lugar Parte Avería Cantidad Fila ColumnaOverall Retiro de Puerto Tapa acceso gancho

remolque Faltante

Cluster 1 Transferencia ubicación y línea de carga

Manijas externas de puertas delanteras

Rayado – Rozado

1 1 1

Cluster 2 Transferencia ubicación y línea de carga

Panel trasero bajo baúl

Rayado – Rozado

12 1 2

Cluster 3 Transferencia ubicación y línea de carga

Capot Rayado – Rozado

11 1 3

Cluster 4 Ingreso a Puerto Paragolpe delantero / Superior

Rayado – Rozado

38 1 4

Cluster 5 Ingreso a Puerto Techo corredizo Faltante 55 1 5Cluster 6 Ingreso a Puerto Cubierta delantera

derecha Abollado 111 1 6

Cluster 7 Transferencia ubicación y línea de carga

Luz de neblina trasera

Exceso kilometraje

299 1 7

Cluster 8 Ingreso a Puerto Luz trasera izquierda

Abollado 63 1 8

Cluster 9 Transferencia ubicación y línea de carga

Luz de neblina trasera

Abollado 76 1 9

Cluster 10 Subida Buque Puerto de Origen

Bolsa de herramientas

Faltante 4334 1 10

Tabla 8: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería

• Lugar – Parte – Avería – Gravedad (Período 1 – Año 2003)

Lugar Parte Avería Gravedad Cantidad Fila Columna

Page 147: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 146 de287 Ing. Hugo Daniel Flores

Overall Retiro de Puerto

Tapa acceso gancho remolque

Faltante Mediano

Cluster 1 Bajada de Buque

Tapizado interno puerta delantera izquierda

Rayado - Rozado

Mediano 596 1 1

Cluster 2 Retiro de Puerto

Cristales de parante delantero

Abollado Grave 1007 1 2

Cluster 3 Subida Buque Puerto de Origen

Sistema de navegación

Proyección Grave 15 1 3

Cluster 4 Ingreso a Puerto

Moldura protectora lateral derecha

Rayado - Rozado

Leve 488 1 4

Cluster 5 Subida Buque Puerto de Origen

Cable de carga Faltante Mediano 582 1 5

Cluster 6 Transferencia ubicación y línea de carga

Insignia Faltante Leve 99 1 6

Cluster 7 Subida Buque Puerto de Origen

Llave Abollado Leve 2120 1 7

Cluster 8 Subida Buque Puerto de Origen

Guardabarro delantero izquierdo

Rayado - Rozado

Leve 14 1 8

Cluster 9 Subida Buque Puerto de Origen

Guardabarro delantero izquierdo

Rayado - Rozado

Mediano 79 1 9

Tabla 9: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad

• Modelo – Parte – Avería (Período 1 – Año 2003)

Modelo Parte Avería Cantidad Fila Columna

Overall Modelo 12 Tapa acceso gancho remolque Faltante

Cluster 1 Modelo 4 Moldura protectora lateral derecha

Faltante 636 1 1

Cluster 2 Modelo 10 Manual Abollado 1267 1 2

Cluster 3 Modelo 18 Cubierta delantera derecha Rayado – Rozado

879 1 3

Cluster 4 Modelo 10 Giro Delantero (derecho / izquierdo)

Rayado – Rozado

121 1 4

Cluster 5 Modelo 10 Panel lateral izquierdo Abollado 1113 1 5

Cluster 6 Modelo 9 Cerraduras de puertas Rayado – Rozado

295 1 6

Cluster 7 Modelo 17 Cubierta delantera izquierda Abollado 689 1 8

Tabla 10: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería

• Modelo – Parte – Avería – Gravedad (Período 1 – Año 2003)

Modelo Parte Avería Gravedad Cantidad Fila ColumnaOverall Modelo 12 Tapa acceso gancho

remolque Faltante Mediano

Page 148: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 147 de287 Ing. Hugo Daniel Flores

Cluster 1 Modelo 5 Giro Delantero (derecho / izquierdo)

Faltante Intolerable 389 1 1

Cluster 2 Modelo 15 Puerta trasera derecha Faltante Grave 792 1 2

Cluster 3 Modelo 18 Paragolpe trasero / Spoiler trasero

Faltante Mediano 110 1 3

Cluster 4 Modelo 16 Bolsa de herramientas Abollado Mediano 231 1 4

Cluster 5 Modelo 17 Panel lateral derecho Rayado - Rozado

Mediano 290 1 5

Cluster 6 Modelo 9 Manijas externas de puertas traseras

Rayado - Rozado

Mediano 168 1 6

Cluster 7 Modelo 15 Apoya cabezas delantero / izquierdo / derecho

Faltante Mediano 8 1 7

Cluster 8 Modelo 11 Luz de neblina trasera Faltante Leve 2945 1 8

Cluster 9 Modelo 13 Faro delantero izquierdo / derecho

Abollado Mediano 2 1 9

Cluster 10 Modelo 14 Retrovisor externo derecho

Pintura saltada

Mediano 65 1 10

Tabla 11: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del segundo período.

• Parte – Avería – Gravedad (Período 2 – Semestre 1 Año 2004)

Parte Avería Gravedad Cantidad Fila Columna Overall Tapa acceso

gancho remolque Faltante Mediano

Cluster 1 Cristales de parante delantero

Faltante Intolerable 317 1 1

Cluster 2 Guardabarro trasero derecho

Faltante Grave 756 1 2

Cluster 3 Cerraduras de puertas

Rayado - Rozado Mediano 374 1 3

Cluster 4 Otros Abollado Leve 1864 1 4Cluster 5 Cable de carga Rayado - Rozado Leve 223 1 5Cluster 6 Antena Rayado - Rozado Mediano 520 1 7Cluster 7 Bolsa de

herramientas Abollado Mediano 932 1 9

Cluster 8 Tapa de Baúl o Puerta Trasera

Abollado Mediano 14 1 10

Tabla 12: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad

• Lugar – Parte – Avería (Período 2 – Semestre 1 Año 2004)

Lugar Parte Avería Cantidad Fila Columna Overall Retiro de Puerto Tapa acceso

gancho remolque Faltante

Page 149: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 148 de287 Ing. Hugo Daniel Flores

Cluster 1 Transferencia ubicación y línea de carga

Llanta trasera izquierda

Faltante 9 1 1

Cluster 2 Transferencia ubicación y línea de carga

Puerta delantera izquierda

Rayado - Rozado

31 1 2

Cluster 3 Transferencia ubicación y línea de carga

Techo corredizo Rayado - Rozado

17 1 3

Cluster 4 Ingreso a Puerto Techo corredizo Rayado - Rozado

97 1 4

Cluster 5 Ingreso a Puerto Puerta trasera derecha

Rayado - Rozado

62 1 5

Cluster 6 Ingreso a Puerto Tapa posterior de techo

Pintura saltada

23 1 6

Cluster 7 Transferencia ubicación y línea de carga

Otros Abollado 167 1 7

Cluster 8 Ingreso a Puerto Llanta delantera derecha

Abollado 14 1 8

Cluster 9 Subida Buque Puerto de Origen

Bolsa de herramientas

Faltante 4580 1 10

Tabla 13: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería

• Lugar – Parte – Avería – Gravedad (Período 2 – Semestre 1 Año 2004)

Lugar Parte Avería Gravedad Cantidad Fila ColumnaOverall Retiro de Puerto Tapa acceso

gancho remolque

Faltante Mediano

Cluster 1 Bajada de Buque Cristales de parante delantero

Faltante Intolerable 259 1 1

Cluster 2 Retiro de Puerto Guardabarro trasero derecho

Faltante Grave 627 1 2

Cluster 3 Bajada de Buque Panel lateral izquierdo

Faltante Leve 1961 1 3

Cluster 4 Ingreso a Puerto Tapa posterior de techo

Pintura saltada

Mediano 82 1 4

Cluster 5 Bajada de Buque Llanta delantera derecha

Abollado Leve 1642 1 5

Cluster 6 Transferencia ubicación y línea de carga

Parrilla delantera

Abollado Leve 15 1 6

Cluster 7 Bajada de Buque Llanta delantera derecha

Faltante Grave 405 1 7

Cluster 8 Retiro de Puerto Techo (inclusive convertible)

Proyección Mediano 9 1 10

Tabla 14: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad

Page 150: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 149 de287 Ing. Hugo Daniel Flores

• Modelo – Parte – Avería (Período 2 – Semestre 1 Año 2004)

Modelo Parte Avería Cantidad Fila ColumnaOverall Modelo 14 Tapa acceso gancho

remolque Faltante

Cluster 1 Modelo 17 Aerosol antipinchazos Proyección 1010 1 1

Cluster 2 Modelo 10 Guardabarro delantero izquierdo

Abollado 1695 1 2

Cluster 3 Modelo 17 Puerta delantera derecha Abollado 614 1 3

Cluster 4 Modelo 8 Panel lateral izquierdo Rayado - Rozado

243 1 4

Cluster 5 Modelo 13 Manual Rayado - Rozado

12 1 5

Cluster 6 Modelo 6 Limpiador y lavador de parabrisas

Abollado 192 1 6

Cluster 7 Modelo 7 Zócalo interno puerta delantera izquierda

Rayado - Rozado

131 1 7

Cluster 8 Modelo 17 Cubierta delantera izquierda

Rayado - Rozado

382 1 8

Cluster 9 Modelo 12 Paragolpe trasero / Spoiler trasero

Pintura saltada

8 1 9

Cluster 10 Modelo 17 Alfombra baúl / caja de carga

Faltante 713 1 10

Tabla 15: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería

• Modelo – Parte – Avería – Gravedad (Período 2 - Semestre 1 Año 2004)

Modelo Parte Avería Gravedad Cantidad Fila Columna

Overall Modelo 14 Tapa acceso gancho remolque

Faltante Mediano

Cluster 1 Modelo 16 Guardabarro trasero derecho

Faltante Grave 800 1 1

Cluster 2 Modelo 8 Cristales de parante delantero

Faltante Grave 273 1 2

Cluster 3 Modelo 10 Barras de techo Proyección Mediano 111 1 3

Cluster 4 Modelo 12 Alfombra suplementarias

Rayado - Rozado

Mediano 7 1 4

Cluster 5 Modelo 13 Puerta delantera izquierda

Faltante Leve 2341 1 5

Cluster 6 Modelo 8 Giro Delantero (derecho / izquierdo)

Faltante Mediano 350 1 6

Cluster 7 Modelo 9 Cubierta delantera derecha

Pintura saltada

Mediano 11 1 7

Cluster 8 Modelo 17 Aleron Faltante Mediano 1085 1 8

Cluster 9 Modelo 17 Otros Rayado - Rozado

Mediano 22 1 10

Tabla 16: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del tercer período.

Page 151: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 150 de287 Ing. Hugo Daniel Flores

• Parte – Avería – Gravedad (Período 3 – Semestre 2 Año 2004)

Parte Avería Gravedad Cantidad Fila ColumnaOverall Tapa acceso gancho

remolque Faltante Leve

Cluster 1 Paragolpe delantero /

Superior Rayado - Rozado Mediano 4 1 1

Cluster 2 Paragolpe delantero / Protector delantero

Rayado - Rozado Mediano 4 1 3

Cluster 3 Capot Rayado - Rozado Grave 23 1 4Cluster 4 Paragolpe trasero / Zona

contacto Rayado - Rozado Grave 58 1 5

Cluster 5 Aleron Proyección Grave 78 1 6Cluster 6 Luz de neblina trasera Abollado Grave 401 1 7Cluster 7 Tapa acceso gancho

remolque Faltante - 4432 1 10

Tabla 17: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad

• Lugar – Parte – Avería (Período 3 – Semestre 2 Año 2004)

Lugar Parte Avería Cantidad Fila ColumnaOverall Retiro de Puerto Tapa acceso gancho

remolque Faltante

Cluster 1 Ingreso a Puerto Barras de techo Pintura

saltada 46 1 1

Cluster 2 Ingreso a Puerto Guardabarro trasero derecho

Pintura saltada

40 1 2

Cluster 3 Ingreso a Puerto Luz de neblina trasera

Abollado 147 1 3

Cluster 4 Ingreso a Puerto Bolsa de herramientas

Faltante 6 1 4

Cluster 5 Ingreso a Puerto Luz de patente trasera

Rayado - Rozado

72 1 5

Cluster 6 Ingreso a Puerto Tapa acceso gancho remolque

Faltante 10 1 6

Cluster 7 Subida a Buque Retrovisor externo izquierdo

Rayado - Rozado

36 1 7

Cluster 8 Ingreso a Puerto Paragolpe trasero / Zona contacto

Rayado - Rozado

299 1 8

Cluster 9 Transferencia ubicación y línea de carga

Taza Proyección 13 1 9

Cluster 10 Transferencia ubicación y línea de carga

Bolsa de herramientas

Faltante 4331 1 10

Tabla 18: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería

• Lugar – Parte – Avería – Gravedad (Período 3 – Semestre 2 Año 2004)

Page 152: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 151 de287 Ing. Hugo Daniel Flores

Lugar Parte Avería Gravedad Cantidad Fila ColumnaOverall Retiro de Puerto Tapa acceso

gancho remolque

Faltante Leve

Cluster 1 Subida a Buque Spoiler

delantero Rayado - Rozado

Mediano 3 1 1

Cluster 2 Ingreso a Puerto Parante delantero

Rayado - Rozado

Grave 15 1 3

Cluster 3 Ingreso a Puerto Alfombra suplementarias

Proyección Grave 48 1 4

Cluster 4 Ingreso a Puerto Luz de neblina trasera

Faltante Grave 54 1 5

Cluster 5 Subida Buque Puerto de Origen

Giro Delantero (derecho / izquierdo)

Faltante Grave 448 1 6

Cluster 6 Ingreso a Puerto Retrovisor externo derecho

Proyección - 548 1 8

Cluster 7 Transferencia ubicación y línea de carga

Moldura protctora lateral izquierda

Pintura saltada

- 1 1 9

Cluster 8 Subida Buque Puerto de Origen

Otros Faltante - 3883 1 10

Tabla 19: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad

• Modelo – Parte – Avería (Período 3 – Semestre 2 Año 2004)

Modelo Parte Avería Cantidad Fila Columna

Overall Modelo 15 Tapa acceso gancho remolque

Faltante

Cluster 1 Modelo 17 Llave de rueda Faltante 556 1 1

Cluster 2 Modelo 17 Cubierta delantera izquierda

Faltante 1084 1 2

Cluster 3 Modelo 9 Giro Delantero (derecho / izquierdo)

Abollado 1409 1 3

Cluster 4 Modelo 13 Puerta trasera izquierda Abollado 89 1 4

Cluster 5 Modelo 17 Guardabarro trasero derecho

Abollado 849 1 6

Cluster 6 Modelo 17 Luz de neblina trasera Desgarrado - Cortado

15 1 7

Cluster 7 Modelo 18 Limpiador y lavador de parabrisas

Proyección 712 1 8

Cluster 8 Modelo 17 Tapa posterior de techo Faltante 286 1 9

Tabla 20: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería

• Modelo – Parte – Avería – Gravedad (Período 3 – Semestre 2 Año 2004)

Modelo Parte Avería Gravedad Cantidad Fila Columna

Overall Modelo 15 Tapa acceso gancho remolque

Faltante Leve

Page 153: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 152 de287 Ing. Hugo Daniel Flores

Cluster 1 Modelo 5 Capot Rayado - Rozado

Grave 11 1 1

Cluster 2 Modelo 4 Retrovisor externo derecho

Faltante Grave 63 1 2

Cluster 3 Modelo 7 Insignia Rayado - Rozado

Grave 23 1 3

Cluster 4 Modelo 15 Plip Rayado - Rozado

Grave 12 1 4

Cluster 5 Modelo 10 Faro de stop luneta

Abollado Grave 128 1 5

Cluster 6 Modelo 17 Puerta trasera izquierda

Faltante Grave 72 1 6

Cluster 7 Modelo 17 Manual Faltante Grave 259 1 7

Cluster 8 Modelo 15 Tapa acceso gancho remolque

Faltante - 4432 1 10

Tabla 21: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del cuarto período.

• Parte – Avería – Gravedad (Período 4 – Semestre 2 Año 2005)

Parte Avería Gravedad Cantidad Fila ColumnaOverall Guardabarro trasero

derecho Faltante -

Cluster 1 Spoiler delantero Manchado Observada 1 1 1Cluster 2 Paragolpe delantero /

Protector delantero Manchado Observada 4 1 2

Cluster 3 Paragolpe delantero / Superior

Manchado Observada 2 1 3

Cluster 4 Capot Rayado - Rozado Observada 77 1 4Cluster 5 Panel trasero bajo baúl Rayado - Rozado Observada 134 1 5Cluster 6 Aleron Proyección Observada 172 1 6Cluster 7 Panel trasero bajo baúl Pintura saltada Observada 16 1 7Cluster 8 Llanta delantera izquierda Abollado Observada 703 1 8Cluster 9 Zócalo izquierdo Manchado Observada 31 1 9Cluster 10 Zócalo derecho Faltante - 2779 1 10

Tabla 22: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad

• Lugar – Parte – Avería (Período 4 – Semestre 1 Año 2005)

Lugar Parte Avería Cantidad Fila ColumnaOverall Retiro de

Puerto Guardabarro trasero derecho Faltante

Cluster 1 Ingreso a

Puerto Paragolpe trasesro / Zona contacto

Rayado - Rozado

3 1 1

Cluster 2 Ingreso a Puerto

Paragolpe trasero / Spoiler trasero

Rayado - Rozado

6 1 4

Cluster 3 Subida a Buque Paragolpe delantero / Protector delantero

Rayado - Rozado

9 1 5

Cluster 4 Ingreso a Capot Rayado - 72 1 6

Page 154: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 153 de287 Ing. Hugo Daniel Flores

Puerto Rozado Cluster 5 Subida Buque

Puerto de Origen

Tapa posterior de techo Rayado - Rozado

131 1 7

Cluster 6 Retiro de Puerto

Taza Faltante 226 1 8

Cluster 7 Retiro de Puerto

Llanta delantera izquierda Faltante 311 1 9

Cluster 8 Retiro de Puerto

Puerta trasera derecha Faltante 3161 1 10

Tabla 23: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería

• Lugar – Parte – Avería – Gravedad (Período 4 – Semestre 1 Año 2005)

Lugar Parte Avería Gravedad Cantidad Fila ColumnaOverall Retiro de

Puerto Guardabarro trasero derecho

Faltante -

Cluster 1 Subida a Buque

Zócalo interno puerta delantera izquierda

Rayado - Rozado

Observada 3 1 1

Cluster 2 Subida a Buque

Paragolpe trasero / Spoiler trasero

Rayado - Rozado

Observada 10 1 3

Cluster 3 Ingreso a Puerto

Capot Rayado - Rozado

Observada 64 1 4

Cluster 4 Ingreso a Puerto

Parabrisa Faltante Observada 43 1 5

Cluster 5 Ingreso a Puerto

Luz de neblina trasera

Proyección Observada 165 1 6

Cluster 6 Ingreso a Puerto

Cubierta delantera derecha

Faltante - 436 1 7

Cluster 7 Bajada de Buque

Zócalo derecho Faltante - 2342 1 8

Cluster 8 Subida Buque Puerto de Origen

Escape Faltante Observada 855 1 9

Cluster 9 Subida Buque Puerto de Origen

Luneta trasera / Cristal puerta trasera

Arrancado - Roto - Fisurado

- 1 1 10

Tabla 24: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad

• Modelo – Parte – Avería (Período 4 – Semestre 1 Año 2005)

Modelo Parte Avería Cantidad Fila Columna

Overall Modelo 15 Guardabarro trasero derecho

Faltante

Cluster 1 Modelo 9 Parante delantero Rayado - Rozado 42 1 1

Cluster 2 Modelo 6 Limpiador de Faros (derecho / izquierdo)

Proyección 380 1 2

Cluster 3 Modelo 8 Llanta delantera izquierda

Abollado 812 1 3

Cluster 4 Modelo 18 Panel trasero bajo baúl Rayado - Rozado 1250 1 4

Cluster 5 Modelo 15 Capot Reventado - Estallado

13 1 5

Page 155: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 154 de287 Ing. Hugo Daniel Flores

Cluster 6 Modelo 17 Paragolpe trasero / Spoiler trasero

Arrancado - Roto - Fisurado

4 1 6

Cluster 7 Modelo 18 Escape Proyección 583 1 7

Cluster 8 Modelo 17 Guardabarro delantero izquierdo

Pintura saltada 533 1 8

Cluster 9 Modelo 17 Separador interno de carga

Proyección 237 1 9

Cluster 10 Modelo 17 Llanta delantera derecha

Pintura saltada 65 1 10

Tabla 25: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería

• Modelo – Parte – Avería – Gravedad (Período 4 – Semestre 1 Año 2005)

Modelo Parte Avería Gravedad Cantidad Fila Columna

Overall Modelo 15 Guardabarro trasero derecho

Faltante -

Cluster 1 Modelo 16 Batería Rayado - Rozado

Observada 22 1 1

Cluster 2 Modelo 18 Luz de patente trasera

Proyección Observada 146 1 2

Cluster 3 Modelo 8 Tapa acceso gancho remolque

Abollado Observada 382 1 3

Cluster 4 Modelo 18 Alfombra suplementarias

Faltante Observada 518 1 4

Cluster 5 Modelo 9 Zócalo derecho Manchado Observada 67 1 6Cluster 6 Modelo 12 Parante delantero Faltante Observada 5 1 8Cluster 7 Modelo 15 Zócalo derecho Faltante - 2779 1 10

Tabla 26: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del quinto período.

• Parte – Avería – Gravedad (Período 5 – Semestre 2 Año 2005)

Parte Avería Gravedad Cantidad Fila ColumnaOverall Guardabarro delantero

derecho Faltante -

Cluster 1 Capot Abollado Observada 14 1 1

Cluster 2 Barras de techo Pintura saltada Observada 38 1 3

Cluster 3 Barras de techo Rayado - Rozado Observada 108 1 4

Cluster 4 Retrovisor externo izquierdo

Pintura saltada Observada 146 1 6

Cluster 5 Tapa tanque combustible

Rayado - Rozado Observada 30 1 7

Cluster 6 Bolsa de herramientas Rayado - Rozado Observada 81 1 8

Cluster 7 Guardabarro delantero derecho

Faltante - 3464 1 10

Page 156: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 155 de287 Ing. Hugo Daniel Flores

Tabla 27: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad

• Lugar – Parte – Avería (Período 5 – Semestre 2 Año 2005)

Lugar Parte Avería Cantidad Fila ColumnaOverall Retiro de Puerto Guardabarro delantero

derecho Faltante

Cluster 1

Subida Buque Puerto de Origen

Paragolpe delantero / Superior

Rayado - Rozado

13 1 1

Cluster 2

Subida Buque Puerto de Origen

Paragolpe delantero / Protector delantero

Rayado - Rozado

29 1 5

Cluster 3

Bajada de Buque Paragolpe delantero / Protector delantero

Rayado - Rozado

63 1 6

Cluster 4

Bajada de Buque Paragolpe delantero / Superior

Rayado - Rozado

44 1 7

Cluster 5

Retiro Fábrica de Origen

Paragolpe trasero / Spoiler trasero

Rayado - Rozado

993 1 8

Cluster 6

Bajada de Buque Antena Proyección 177 1 9

Cluster 7

Retiro de Puerto Cristales de parante delantero

Faltante 2562 1 10

Tabla 28: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería

• Lugar – Parte – Avería – Gravedad (Período 5 – Semestre 2 Año 2005)

Lugar Parte Avería Gravedad Cantidad Fila ColumnaOverall Retiro de

Puerto Guardabarro delantero derecho

Faltante -

Cluster 1 Ingreso a Puerto

Techo (inclusive convertible)

Pintura saltada

- 67 1 1

Cluster 2 Ingreso a Puerto

Otros Abollado - 177 1 2

Cluster 3 Ingreso a Puerto

Techo (inclusive convertible)

Rayado - Rozado

- 142 1 3

Cluster 4 Subida a Buque

Bolsa de herramientas

Proyección - 12 1 4

Cluster 5 Ingreso a Puerto

Llanta delantera izquierda

Proyección - 111 1 5

Cluster 6 Subida Buque Puerto de Origen

Guardabarro delantero derecho

Faltante - 2955 1 6

Cluster 7 Bajada de Buque

Zócalo derecho Faltante Observada 168 1 7

Cluster 8 Ingreso a Puerto

Llanta delantera derecha

Proyección Observada 249 1 8

Tabla 29: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad

• Modelo – Parte – Avería (Período 5 – Semestre 2 Año 2005)

Modelo Parte Avería Cantidad Fila Columna

Overall Modelo 13 Guardabarro delantero derecho

Faltante

Cluster 1 Modelo 18 Guardabarros y parante Rayado – 269 1 1

Page 157: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 156 de287 Ing. Hugo Daniel Flores

trasero izquierdo Rozado Cluster 2 Modelo 17 Faro de stop luneta Abollado 669 1 2Cluster 3 Modelo 7 Tapa acceso gancho

remolqueAbollado 1290 1 3

Cluster 4 Modelo 17 Tapa de Baúl o Puerta Trasera

Rayado - Rozado

1307 1 5

Cluster 5 Modelo 13 Techo (inclusive convertible)

Abollado 24 1 6

Cluster 6 Modelo 6 Paragolpe trasero / Zona contacto

Rayado - Rozado

263 1 8

Cluster 7 Modelo 9 Paragolpe delantero / Superior

Rayado - Rozado

59 1 10

Tabla 30: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería

• Modelo – Parte – Avería – Gravedad (Período 5 – Semestre 2 Año 2005)

Modelo Parte Avería Gravedad Cantidad Fila Columna

Overall Modelo 13 Guardabarro delantero derecho

Faltante -

Cluster 1 Modelo 20 Paragolpe delantero / Protector delantero

Rayado - Rozado

Observada 7 1 1

Cluster 2 Modelo 19 Tapizado interno puerta delantera izquierda

Rayado - Rozado

Observada 53 1 2

Cluster 3 Modelo 18 Llave Abollado Observada 123 1 3Cluster 4 Modelo 9 Parrilla delantera Proyección Observada 6 1 4Cluster 5 Modelo 6 Taza Proyección Observada 167 1 5Cluster 6 Modelo 13 Techo (inclusive

convertible) Abollado Observada 11 1 7

Cluster 7 Modelo 8 Guardabarro delantero izquierdo

Abollado Observada 50 1 8

Cluster 8 Modelo 13 Guardabarro delantero derecho

Faltante - 3464 1 10

Tabla 31: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del sexto período.

• Parte – Avería – Gravedad (Período 6 – Semestre 1 Año 2006)

Overall Retiro de Puerto Zócalo derecho Faltante Cluster 1 Transferencia ubicación y

línea de carga Spoiler delantero Rayado -

Rozado 42 1 2

Cluster 2 Transferencia ubicación y línea de carga

Paragolpe delantero / Protector delantero

Rayado - Rozado

27 1 5

Cluster 3 Ingreso a Puerto Paragolpe delantero / Protector delantero

Rayado - Rozado

74 1 6

Cluster 4 Ingreso a Puerto Zócalo interno puerta delantera izquierda

Rayado - Rozado

114 1 7

Cluster 5 Ingreso a Puerto Tapa acceso gancho remolque Faltante 470 1 8Cluster 6 Transferencia ubicación y

línea de carga Llave Abollado 53 1 9

Cluster 7 Subida Buque Puerto de Origen

Guardabarro trasero derecho Faltante 2983 1 10

Page 158: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 157 de287 Ing. Hugo Daniel Flores

Tabla 32: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad

• Lugar – Parte – Avería (Período 6 – Semestre 1 Año 2006)

Lugar Parte Avería Cantidad Fila ColumnaOverall Retiro de Puerto Zócalo derecho Faltante

Cluster 1 Transferencia ubicación y línea de carga

Spoiler delantero Rayado - Rozado

42 1 2

Cluster 2 Transferencia ubicación y línea de carga

Paragolpe delantero / Protector delantero

Rayado - Rozado

27 1 5

Cluster 3 Ingreso a Puerto Paragolpe delantero / Protector delantero

Rayado - Rozado

74 1 6

Cluster 4 Ingreso a Puerto Zócalo interno puerta delantera izquierda

Rayado - Rozado

114 1 7

Cluster 5 Ingreso a Puerto Tapa acceso gancho remolque

Faltante 470 1 8

Cluster 6 Transferencia ubicación y línea de carga

Llave Abollado 53 1 9

Cluster 7 Subida Buque Puerto de Origen

Guardabarro trasero derecho

Faltante 2983 1 10

Tabla 33: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería

• Lugar – Parte – Avería – Gravedad (Período 6 – Semestre 1 Año 2006)

Lugar Parte Avería Gravedad Cantidad Fila ColumnaOverall Retiro de Puerto Zócalo derecho Faltante -

Cluster 1 Bajada de Buque

Spoiler delantero Rayado - Rozado

Observada 7 1 1

Cluster 2 Retiro de Puerto Paragolpe delantero / Protector delantero

Rayado - Rozado

Observada 1 1 4

Cluster 3 Bajada de Buque

Spoiler delantero Rayado - Rozado

Observada 9 1 5

Cluster 4 Ingreso a Puerto Tapa posterior de techo

Rayado - Rozado

Observada 35 1 6

Cluster 5 Bajada de Buque

Moldura protectora lateral derecha

Faltante Observada 103 1 7

Cluster 6 Transferencia ubicación y línea de carga

Puerta trasera izquierda

Abollado Observada 33 1 8

Cluster 7 Bajada de Buque

Tapa acceso gancho remolque

Abollado Observada 274 1 9

Cluster 8 Bajada de Buque

Zócalo derecho Faltante - 3301 1 10

Tabla 34: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad

• Modelo – Parte – Avería (Período 6 – Semestre 1 Año 2006)

Modelo Parte Avería Cantidad Fila Columna

Page 159: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 158 de287 Ing. Hugo Daniel Flores

Overall Modelo 13 Zócalo derecho Faltante Cluster 1 Modelo 20 Paragolpe delantero /

Protector delantero Rayado - Rozado

124 1 1

Cluster 2 Modelo 17 Panel trasero bajo baúl Rayado - Rozado

901 1 2

Cluster 3 Modelo 7 Escape Faltante 1695 1 3Cluster 4 Modelo 17 Otros Rayado -

Rozado110 1 6

Cluster 5 Modelo 18 Giro Delantero (derecho / izquierdo)

Abollado 577 1 7

Cluster 6 Modelo 16 Guardabarros y parante trasero izquierdo

Abollado 318 1 8

Cluster 7 Modelo 13 Barras de techo Abollado 38 1 9

Tabla 35: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería

• Modelo – Parte – Avería – Gravedad (Período 6 – Semestre 1 Año 2006)

Modelo Parte Avería Gravedad Cantidad Fila ColumnaOverall Modelo 13 Zócalo derecho Faltante - Cluster 1 Modelo 20 Paragolpe delantero /

Superior Rayado - Rozado

Observada 1 1 1

Cluster 2 Modelo 20 Spoiler delantero Rayado - Rozado

Observada 20 1 2

Cluster 3 Modelo 19 Paragolpe trasero / Spoiler trasero

Proyección Observada 45 1 3

Cluster 4 Modelo 19 Bolsa de herramientas Proyección Observada 57 1 4Cluster 5 Modelo 7 Bolsa de herramientas Faltante Observada 260 1 5Cluster 6 Modelo 11 Manijas externas de

puertas delanterasPintura saltada

Observada 5 1 6

Cluster 7 Modelo 16 Parrilla delantera Pintura saltada

Observada 74 1 8

Cluster 8 Modelo 13 Zócalo derecho Faltante - 3301 1 10

Tabla 36: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del séptimo período.

• Parte – Avería – Gravedad (Período 7 – Semestre 2 Año 2006)

Parte Avería Gravedad Cantidad Fila ColumnaOverall Guardabarro delantero

derecho Faltante -

Cluster 1 Llanta trasera derecha Pintura saltada Observada 1 1 1Cluster 2 Cubierta trasera

derecha Reventado - Estallado Observada 1 1 2

Cluster 3 Bajo chasis delantero Arrancado - Roto - Fisurado

Observada 2 1 3

Cluster 4 Bolsa de herramientas Arrancado - Roto - Fisurado

Observada 15 1 4

Cluster 5 Luz de neblina trasera Abollado Observada 94 1 5Cluster 6 Faro de stop luneta Rayado - Rozado Observada 94 1 6

Page 160: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 159 de287 Ing. Hugo Daniel Flores

Cluster 7 Tapa posterior de techo

Proyección Observada 128 1 7

Cluster 8 Alfombra suplementarias

Abollado Observada 22 1 8

Cluster 9 Guardabarro delantero derecho

Faltante - 2271 1 10

Tabla 37: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad

• Lugar – Parte – Avería (Período 7 – Semestre 2 Año 2006)

Lugar Parte Avería Cantidad Fila ColumnaOverall Transferencia

ubicación y línea de carga

Guardabarro delantero derecho

Faltante

Cluster 1 Retiro de Puerto Paragolpe delantero / Protector delantero

Rayado - Rozado

11 1 1

Cluster 2 Bajada de Buque Paragolpe delantero / Protector delantero

Rayado - Rozado

41 1 2

Cluster 3 Bajada de Buque Manijas externas de puertas traseras

Proyección 326 1 3

Cluster 4 Ingreso a Puerto Parabrisa Proyección 865 1 4

Cluster 5 Bajada de Buque Guardabarro delantero izquierdo

Abollado 473 1 5

Cluster 6 Ingreso a Puerto Faro de stop luneta Abollado 483 1 7

Cluster 7 Ingreso a Puerto Llave Rayado - Rozado

429 1 8

Tabla 38: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería

• Lugar – Parte – Avería – Gravedad (Período 7 – Semestre 2 Año 2006)

Lugar Parte Avería Gravedad Cantidad Fila ColumnaOverall Transferencia

ubicación y línea de carga

Guardabarro delantero derecho

Faltante -

Cluster 1 Bajada de Buque

Spoiler delantero Rayado - Rozado

Observada 1 1 1

Cluster 2 Bajada de Buque

Paragolpe delantero / Protector delantero

Rayado - Rozado

Observada 3 1 3

Cluster 3 Retiro de Puerto

Paragolpe delantero / Protector delantero

Rayado - Rozado

Observada 1 1 4

Cluster 4 Bajada de Buque

Panel trasero bajo baúl

Rayado - Rozado

Observada 14 1 5

Cluster 5 Bajada de Buque

Alfombra suplementarias

Proyección Observada 21 1 6

Cluster 6 Bajada de Buque

Parrilla delantera Abollado Observada 67 1 7

Cluster 7 Ingreso a Puerto

Guardabarro delantero derecho

Faltante Observada 250 1 8

Page 161: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 160 de287 Ing. Hugo Daniel Flores

Cluster 8 Transferencia ubicación y línea de carga

Guardabarro delantero derecho

Faltante - 2271 1 10

Tabla 39: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad

• Modelo – Parte – Avería (Período 7 – Semestre 2 Año 2006)

Modelo Parte Avería Cantidad Fila Columna

Overall Modelo 15 Guardabarro delantero derecho

Faltante

Cluster 1 Modelo 20 Parrilla delantera Rayado - Rozado

252 1 1

Cluster 2 Modelo 19 Retrovisor externo izquierdo

Abollado 553 1 2

Cluster 3 Modelo 6 Puerta delantera derecha

Faltante 868 1 3

Cluster 4 Modelo 11 Barras de techo Proyección 91 1 4Cluster 5 Modelo 20 Barras de techo Proyección 714 1 5Cluster 6 Modelo 13 Tapa acceso gancho

remolqueRayado - Rozado

4 1 6

Cluster 7 Modelo 18 Retrovisor externo derecho

Reventado - Estallado

114 1 7

Cluster 8 Modelo 13 Llanta delantera derecha

Abollado 32 1 10

Tabla 40: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería

• Modelo – Parte – Avería – Gravedad (Período 7 – Semestre 2 Año 2006)

Modelo Parte Avería Gravedad Cantidad Fila Columna

Overall Modelo 15 Guardabarro delantero derecho

Faltante -

Cluster 1 Modelo 5 Otros Manchado Observada 2 1 1

Cluster 2 Modelo 5 Zócalo izquierdo Rayado - Rozado

Observada 22 1 3

Cluster 3 Modelo 7 Zócalo izquierdo Abollado Observada 42 1 4

Cluster 4 Modelo 6 Manijas externas de puertas traseras

Proyección Observada 42 1 5

Cluster 5 Modelo 8 Retrovisor externo derecho

Pintura saltada

Observada 20 1 6

Cluster 6 Modelo 19 Retrovisor externo derecho

Faltante Observada 224 1 7

Cluster 7 Modelo 13 Giro Delantero (derecho / izquierdo)

Abollado Observada 5 1 8

Cluster 8 Modelo 15 Guardabarro delantero derecho

Faltante - 2271 1 10

Tabla 41: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del octavo período.

• Parte – Avería – Gravedad (Período 8 – Semestre 1 Año 2007)

Page 162: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 161 de287 Ing. Hugo Daniel Flores

Parte Avería Gravedad Cantidad Fila Columna

Overall Zócalo derecho Faltante - Cluster 1

Spoiler delantero Rayado - Rozado

Observada2 1 1

Cluster 2

Paragolpe delantero / Protector delantero

Rayado - Rozado

Observada64 1 4

Cluster 3

Paragolpe trasero / Spoiler trasero

Rayado - Rozado

Observada68 1 5

Cluster 4

Tapa posterior de techo Abollado Observada76 1 6

Cluster 5

Manual Pintura saltada

Observada5 1 7

Cluster 6

Luz de neblina trasera Faltante Observada437 1 8

Cluster 7

Zócalo derecho Faltante - 2377 1 10

Tabla 42: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad

• Lugar – Parte – Avería (Período 8 – Semestre 1 Año 2007)

Lugar Parte Avería Cantidad Fila ColumnaOverall Transferencia

ubicación y línea de carga

Zócalo derecho Faltante

Cluster 1 Ingreso a Puerto Puerta trasera izquierda

Proyección 599 1 1

Cluster 2 Transferencia ubicación y línea de carga

Guardabarro trasero derecho

Pintura saltada

288 1 2

Cluster 3 Bajada de Buque Moldura protectora lateral derecha

Faltante 910 1 3

Cluster 4 Transferencia ubicación y línea de carga

Techo (inclusive convertible)

Rayado - Rozado

510 1 4

Cluster 5 Transferencia ubicación y línea de carga

Manual Faltante 722 1 5

Tabla 43: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería

• Lugar – Parte – Avería – Gravedad (Período 8 – Semestre 1 Año 2007)

Lugar Parte Avería Gravedad Cantidad Fila ColumnaOverall Transferencia

ubicación y línea de carga

Zócalo derecho Faltante -

Cluster 1 Ingreso a Puerto

Paragolpe delantero / Protector delantero

Pintura saltada

Observada 2 1 1

Cluster 2 Transferencia ubicación y línea de carga

Faldillas para barro Pintura saltada

Observada 6 1 3

Cluster 3 Ingreso a Puerto

Zócalo izquierdo Abollado Observada 57 1 4

Cluster 4 Transferencia Puerta trasera Rayado - Observada 68 1 5

Page 163: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 162 de287 Ing. Hugo Daniel Flores

ubicación y línea de carga

izquierda Rozado

Cluster 5 Transferencia ubicación y línea de carga

Tapizado interno puerta delantera izquierda

Rayado - Rozado

Observada 160 1 6

Cluster 6 Bajada de Buque

Capot Rayado - Rozado

Observada 10 1 7

Cluster 7 Subida Buque Puerto de Origen

Panel lateral derecho Abollado Observada 349 1 8

Cluster 8 Transferencia ubicación y línea de carga

Zócalo derecho Faltante - 2377 1 10

Tabla 44: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad

• Modelo – Parte – Avería (Período 8 – Semestre 1 Año 2007)

Modelo Parte Avería Cantidad Fila Columna

Overall Modelo 14 Zócalo derecho Faltante Cluster 1 Modelo 5 Capot Rayado -

Rozado 105 1 1

Cluster 2 Modelo 5 Manijas externas de puertas traseras

Proyección 316 1 2

Cluster 3 Modelo 7 Parrilla delantera Faltante 730 1 3Cluster 4 Modelo 13 Retrovisor externo

izquierdo Rayado - Rozado

1 1 4

Cluster 5 Modelo 19 Zócalo izquierdo Abollado 455 1 5Cluster 6 Modelo 13 Guardabarro delantero

izquierdo Abollado 206 1 6

Cluster 7 Modelo 13 Tapa de Baúl o Puerta Trasera

Abollado 15 1 7

Cluster 8 Modelo 20 Limpiador y lavador de parabrisas

Proyección 1110 1 8

Cluster 9 Modelo 14 Techo corredizo Faltante 90 1 9Cluster 10 Modelo 13 Puerta delantera derecha Rayado -

Rozado 1 1 10

Tabla 45: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería

• Modelo – Parte – Avería – Gravedad (Período 8 – Semestre 1 Año 2007)

Modelo Parte Avería Gravedad Cantidad Fila Columna

Overall Modelo 14 Zócalo derecho Faltante - Cluster 1 Modelo 20 Paragolpe delantero /

Superior Rayado - Rozado

Observada 1 1 1

Cluster 2 Modelo 20 Paragolpe delantero / Protector delantero

Rayado - Rozado

Observada 20 1 2

Cluster 3 Modelo 20 Tapa de Baúl o Puerta Trasera

Rayado - Rozado

Observada 45 1 3

Cluster 4 Modelo 17 Manijas externas de puertas traseras

Proyección Observada 57 1 4

Cluster 5 Modelo 20 Cubierta delantera izquierda

Rayado - Rozado

Observada 260 1 5

Cluster 6 Modelo 11 Panel lateral derecho Faltante Observada 5 1 6

Page 164: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 163 de287 Ing. Hugo Daniel Flores

Cluster 7 Modelo 14 Zócalo derecho Faltante - 74 1 8

Tabla 46: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del noveno período.

• Parte – Avería – Gravedad (Período 9 – Semestre 2 Año 2007)

Parte Avería Gravedad Cantidad Fila ColumnaOverall Taza Proyección - Cluster 1 Conjunto carrocería Manchado Observada 2 1 1Cluster 2 Llanta trasera izquierda Rayado -

Rozado Observada

67 1 5Cluster 3 Cubierta trasera derecha Rayado -

Rozado Observada

76 1 6Cluster 4 Guardabarros y parante trasero

izquierdo Rayado - Rozado

Observada 176 1 7

Cluster 5 Panel lateral derecho Faltante Observada 438 1 8Cluster 6 Techo corredizo Proyección Observada 275 1 9Cluster 7 Limpiador y lavador de

parabrisas Proyección -

3966 1 10

Tabla 47: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad

• Lugar – Parte – Avería (Período 9 – Semestre 2 Año 2007)

Lugar Parte Avería Cantidad Fila Columna Overall Transferencia

ubicación y línea de carga

Taza Proyección

Cluster 1 Retiro de Puerto Capot Rayado - Rozado

1 1 1

Cluster 2 Bajada de Buque Spoiler delantero Rayado - Rozado

3 1 3

Cluster 3 Bajada de Buque Capot Rayado - Rozado

27 1 4

Cluster 4 Bajada de Buque Zócalo interno puerta delantera izquierda

Rayado - Rozado

30 1 5

Cluster 5 Bajada de Buque Barras de techo Abollado 147 1 6Cluster 6 Bajada de Buque Tapa acceso gancho

remolque Abollado 520 1 7

Cluster 7 Transferencia ubicación y línea de carga

Llanta trasera izquierda Abollado 21 1 8

Cluster 8 Ingreso a Puerto Manijas externas de puertas delanteras

Proyección 3082 1 9

Cluster 9 Transferencia ubicación y línea de carga

Faro de stop luneta Rayado - Rozado

1169 1 10

Tabla 48: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería

• Lugar – Parte – Avería – Gravedad (Período 9 – Semestre 2 Año 2007)

Page 165: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 164 de287 Ing. Hugo Daniel Flores

Lugar Parte Avería Gravedad Cantidad Fila ColumnaOverall Transferencia

ubicación y línea de carga

Taza Proyección -

Cluster 1 Bajada de Buque

Zócalo izquierdo Rayado - Rozado

Observada 11 1 1

Cluster 2 Transferencia ubicación y línea de carga

Llanta trasera izquierda

Rayado - Rozado

Observada 72 1 2

Cluster 3 Ingreso a Puerto

Tapizado interno puerta delantera izquierda

Proyección Observada 239 1 3

Cluster 4 Transferencia ubicación y línea de carga

Tapa tanque combustible

Rayado - Rozado

Observada 233 1 4

Cluster 5 Ingreso a Puerto

Escape Rayado - Rozado

Observada 51 1 5

Cluster 6 Transferencia ubicación y línea de carga

Zócalo derecho Rayado - Rozado

Observada 100 1 6

Cluster 7 Subida Buque Puerto de Origen

Puerta delantera izquierda

Abollado Observada 62 1 7

Cluster 8 Subida Buque Puerto de Origen

Limpiador y lavador de parabrisas

Abollado Observada 266 1 8

Cluster 9 Transferencia ubicación y línea de carga

Limpiador y lavador de parabrisas

Proyección - 3966 1 10

Tabla 49: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad

• Modelo – Parte – Avería (Período 9 – Semestre 2 Año 2007)

Modelo Parte Avería Cantidad Fila Columna

Overall Modelo 14

Taza Proyección

Cluster 1 Modelo 7 Cable de carga Rayado - Rozado

356 1 1

Cluster 2 Modelo 6 Tapizado interno puerta delantera izquierda

Rayado - Rozado

782 1 2

Cluster 3 Modelo 7 Guardabarro trasero derecho Pintura saltada

704 1 3

Cluster 4 Modelo 14

Luz de neblina trasera Abollado 112 1 4

Cluster 5 Modelo 20

Limpiador y lavador de parabrisas

Proyección 2716 1 5

Cluster 6 Modelo 9 Techo corredizo Proyección 15 1 6Cluster 7 Modelo

13 Faro de stop luneta Faltante 27 1 7

Cluster 8 Modelo 13

Guardabarro trasero derecho Abollado 144 1 10

Cluster 8 Modelo 13

Techo (inclusive convertible) Abollado 144 1 10

Tabla 50: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería

Page 166: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 165 de287 Ing. Hugo Daniel Flores

• Modelo – Parte – Avería – Gravedad (Período 9 – Semestre 2 Año 2007)

Modelo Parte Avería Gravedad Cantidad Fila Columna

Overall Modelo 14 Taza Proyección - Cluster 1 Modelo 20 Llanta trasera

izquierda Rayado - Rozado

Observada65 1 1

Cluster 2 Modelo 20 Alfombra baúl / caja de carga

Rayado - Rozado

Observada165 1 3

Cluster 3 Modelo 8 Alfombra suplementarias

Proyección Observada450 1 4

Cluster 4 Modelo 16 Llanta delantera derecha

Faltante Observada354 1 5

Cluster 5 Modelo 15 Techo (inclusive convertible)

Proyección - 22 1 7

Cluster 6 Modelo 7 Llanta delantera derecha

Faltante - 1598 1 8

Cluster 7 Modelo 20 Transponder Proyección - 2346 1 9

Tabla 51: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del décimo período.

• Parte – Avería – Gravedad (Período 10 – Semestre 1 Año 2008)

Parte Avería Gravedad Cantidad Fila ColumnaOverall Zócalo derecho Faltante - Cluster 1 Spoiler delantero Rayado - Rozado Observada 5 1 1Cluster 2 Paragolpe delantero /

Protector delantero Rayado - Rozado Observada 75 1 5

Cluster 3 Paragolpe delantero / Superior

Rayado - Rozado Observada 15 1 6

Cluster 4 Paragolpe trasero / Spoiler trasero

Proyección Observada 145 1 7

Cluster 5 Moldura protctora lateral izquierda

Rayado - Rozado Observada 828 1 8

Cluster 6 Retrovisor externo derecho

Faltante - 3932 1 10

Tabla 52: Agrupamiento con especificación de cantidades por cluster: Parte - Avería - Gravedad

• Lugar – Parte – Avería (Período 10 – Semestre 1 Año 2008)

Lugar Parte Avería Cantidad Fila Columna Overall Transferencia

ubicación y línea de carga

Zócalo derecho Faltante

Cluster 1 Transferencia

ubicación y línea de carga

Paragolpe delantero / Protector delantero

Rayado - Rozado

176 1 1

Cluster 2 Transferencia ubicación y línea de carga

Tapa posterior de techo Rayado - Rozado

717 1 2

Page 167: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 166 de287 Ing. Hugo Daniel Flores

Cluster 3 Bajada de Buque Panel lateral derecho Faltante 834 1 3

Cluster 4 Transferencia ubicación y línea de carga

Manijas externas de puertas traseras

Reventado - Estallado

204 1 4

Cluster 5 Transferencia ubicación y línea de carga

Giro Delantero (derecho / izquierdo)

Faltante 3031 1 5

Cluster 6 Transferencia ubicación y línea de carga

Llanta trasera izquierda Rayado - Rozado

38 1 6

Tabla 53: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería

• Lugar – Parte – Avería – Gravedad (Período 10 – Semestre 1 Año 2008)

Lugar Parte Avería Gravedad Cantidad Fila ColumnaOverall Transferencia

ubicación y línea de carga

Zócalo derecho Faltante -

Cluster 1

Transferencia ubicación y línea de carga

Paragolpe delantero / Protector delantero

Arrancado - Roto - Fisurado

Observada 1 1 1

Cluster 2

Subida a Buque Paragolpe delantero / Protector delantero

Arrancado - Roto - Fisurado

Observada 3 1 3

Cluster 3

Subida a Buque Bolsa de herramientas

Arrancado - Roto - Fisurado

Observada 12 1 4

Cluster 4

Ingreso a Puerto Giro Delantero (derecho / izquierdo)

Pintura saltada

Observada 44 1 5

Cluster 5

Ingreso a Puerto Paragolpe trasero / Spoiler trasero

Rayado - Rozado

Observada 255 1 6

Cluster 6

Bajada de Buque Moldura protectora lateral derecha

Abollado Observada 116 1 7

Cluster 7

Transferencia ubicación y línea de carga

Llanta delantera izquierda

Rayado - Rozado

Observada 402 1 8

Cluster 8

Ingreso a Puerto Encendedor Manchado Observada 235 1 9

Cluster 9

Transferencia ubicación y línea de carga

Retrovisor externo derecho

Faltante - 3932 1 10

Tabla 54: Agrupamiento con especificación de cantidades por cluster: Lugar - Parte - Avería - Gravedad

• Modelo – Parte – Avería (Período 10 – Semestre 1 Año 2008)

Modelo Parte Avería Cantidad Fila Columna

Overall Modelo 13 Zócalo derecho Faltante Cluster 1 Modelo 20 Paragolpe delantero /

Protector delantero Rayado - Rozado

181 1 1

Cluster 2 Modelo 20 Manijas externas de puertas delanteras

Proyección 290 1 2

Cluster 3 Modelo 15 Cable de carga Proyección 5 1 3

Page 168: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 167 de287 Ing. Hugo Daniel Flores

Cluster 4 Modelo 13 Techo corredizo Pintura saltada 186 1 4Cluster 5 Modelo 8 Capot Faltante 35 1 5Cluster 6 Modelo 10 Cristales de parante

delantero Reventado - Estallado

60 1 6

Cluster 7 Modelo 19 Puerta trasera derecha Faltante 2040 1 7Cluster 8 Modelo 13 Faro de stop luneta Rayado -

Rozado 4 1 9

Cluster 9 Modelo 7 Panel lateral derecho Proyección 2199 1 10

Tabla 55: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería

• Modelo – Parte – Avería – Gravedad (Período 9 – Semestre 2 Año 2007)

Modelo Parte Avería Gravedad Cantidad Fila ColumnaOverall Modelo 13 Zócalo derecho Faltante - Cluster 1 Modelo 20 Llanta trasera

izquierda Rayado - Rozado

Observada 11 1 1

Cluster 2 Modelo 20 Conjunto carrocería Manchado Observada 18 1 2Cluster 3 Modelo 20 Guardabarro

delantero izquierdo Rayado - Rozado

Observada 102 1 3

Cluster 4 Modelo 6 Luz de patente trasera Rayado - Rozado

Observada 12 1 4

Cluster 5 Modelo 7 Conjunto carrocería Manchado Observada 163 1 5Cluster 6 Modelo 7 Giro Delantero

(derecho / izquierdo) Rayado - Rozado

Observada 560 1 6

Cluster 7 Modelo 16 Limpiador y lavador de parabrisas

Faltante Observada 202 1 7

Cluster 8 Modelo 14 Retrovisor externo derecho

Faltante - 3932 1 10

Tabla 56: Agrupamiento con especificación de cantidades por cluster: Modelo - Parte - Avería - Gravedad

8.4.4.3. Modelo de Predicción Al igual que con el análisis del modelo anterior este se realiza sobre diferentes variables de ingreso: Parte – Avería – Gravedad con predicción de la Parte, Parte – Avería – Gravedad con predicción de la Avería, Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar, y finalmente Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el Modelo. El primer análisis permite ver o predecir la ocurrencia que una avería sea producida en una determinada parte. Del análisis del segundo grupo se obtiene información sobre la ocurrencia de una determinada avería teniendo en cuenta la parte de un auto y la gravedad del daño. El siguiente proceso permite ver la ocurrencia de una avería en un determinado lugar. Para finalizar esta etapa se toma como referencia de predicción el modelo de auto que es averiado. La herramienta nos permite ver por cada análisis y procesamiento de datos la respectiva curva de entrenamiento para cada modelo y la correspondiente curva de validación de datos de cada modelo.

Page 169: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 168 de287 Ing. Hugo Daniel Flores

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del primer período.

• Parte – Avería – Gravedad con predicción de la Parte (Período 1 – Año 2003)

Variable Tipo de Avería Parte predictiva: Puerta delantera Derecha Tipo de Avería: Exceso kilometraje Gravedad: Mediano Partes predictivas:

Puerta delantera Derecha Puerta trasera Derecha Panel lateral derecho Moldura protector lateral derecha Giro Delantero (D/I) Cristales de parante delantero. Escape Tapa acceso gancho remolque Bolsa de herramientas Otros

Variable Gravedad Parte predictiva: Tapa acceso gancho remolque Tipo Avería: Faltante Gravedad: Leve Partes predictivas: Moldura protector lateral derecha Giro Delantero (D/I) Cristales de parante delantero Escape Tapa acceso gancho remolque

• Parte – Avería – Gravedad con predicción de la Avería (Período 1 – Año 2003)

Variable Parte Avería predictiva: Faltante Parte: Rueda de Auxilio Gravedad: Mediano Averías predictivas:

Abollado Faltante Proyección

Variable Gravedad Avería predictiva: Techo corredizo Parte: Exceso kilometraje Gravedad: Leve Averías predictivas: Abollado Faltante

Page 170: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 169 de287 Ing. Hugo Daniel Flores

• Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar (Período 1 – Año 2003)

Variable Parte

Lugar predictivo: Retiro de Puerto Parte: Rueda de Auxilio

Tipo de avería: Faltante Gravedad: Mediano Variable Tipo de Avería Lugar predictivo: Transferencia ubicación y línea de carga Parte: Tapa acceso gancho remolque Tipo Avería: Exceso kilometraje Gravedad: Mediano Variable Gravedad Lugar predictivo: Retiro de Puerto Parte: Tapa acceso gancho remolque Tipo Avería: Faltante Gravedad: Leve

• Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el

Modelo (Período 1 – Año 2003)

Variable Parte Modelo predictivo: Modelo 9 Parte: Rueda de Auxilio Tipo de avería: Faltante Gravedad: Mediano Modelos predictivos:

Modelo 8 Modelo 9 Modelo 10 Modelo 11 Modelo 12

Variable Avería Modelo predictivo: Modelo 11 Parte: Tapa acceso gancho remolque Tipo de avería: Exceso kilometraje Gravedad: Mediano Modelos predictivos:

Modelo 8 Modelo 9 Modelo 10 Modelo 11

Modelo 12

Variable Gravedad Modelo predictivo: Modelo 10

Page 171: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 170 de287 Ing. Hugo Daniel Flores

Parte: Tapa acceso gancho remolque Tipo de avería: Faltante Gravedad: Leve Modelos predictivos:

Modelo 9 Modelo 10

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del segundo período.

• Parte – Avería – Gravedad con predicción de la Parte (Período 2 – Semestre 1 Año 2004)

Variable Tipo de Avería Parte predictiva: Escape Tipo de Avería: Abollado Gravedad: Mediano Partes predictivas:

Cristales de parante delantero Escape Tapa acceso gancho remolque Bolsa de herramientas Otros Llave Parrilla delantera Luz de neblina trasera Faro de stop luneta Retrovisor externo izquierdo Guardabarro delantero izquierdo

Variable Gravedad Parte predictiva: Llave Tipo Avería: Abollado Gravedad: Mediano Partes predictivas:

Giro Delantero (derecho / izquierdo) Cristales de parante delantero Escape Tapa acceso gancho remolque Bolsa de herramientas Otros Llave

• Parte – Avería – Gravedad con predicción de la Avería (Período 1 – Semestre 1 Año 2004)

Variable Parte Avería predictiva: Abollado Parte: Llave Gravedad: Mediano

Page 172: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 171 de287 Ing. Hugo Daniel Flores

Averías predictivas: Abollado

Variable Gravedad Avería predictiva: Abollado Parte: Llave Gravedad: Mediano Averías predictivas: Abollado Faltante

• Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar

(Período 2 – Semestre 1 Año 2004) Variable Parte

Lugar predictivo: Bajada de Buque Parte: Llave

Tipo de avería: Abollado Gravedad: Mediano Variable Tipo de Avería Lugar predictivo: Retiro de Puerto Parte: Llave Tipo Avería: Abollado Gravedad: Mediano Variable Gravedad Lugar predictivo: Bajada de buque Parte: Llave Tipo Avería: Abollado Gravedad: Mediano

• Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el

Modelo (Período 2 – Semestre 1 Año 2004)

Variable Parte Modelo predictivo: Modelo 11 Parte: Llave Tipo de avería: Abollado Gravedad: Mediano Modelos predictivos:

Modelo 11 Variable Avería Modelo predictivo: Modelo 11 Parte: Llave Tipo de avería: Abollado Gravedad: Mediano Modelos predictivos:

Modelo 11

Page 173: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 172 de287 Ing. Hugo Daniel Flores

Variable Gravedad Modelo predictivo: Modelo 11 Parte: Llave Tipo de avería: Abollado Gravedad: Mediano Modelos predictivos:

Modelo 11 A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del tercer período.

• Parte – Avería – Gravedad con predicción de la Parte (Período 3 – Semestre 2 Año 2004)

Variable Tipo de Avería Parte predictiva: Llanta delantera derecha Tipo de Avería: Faltante Gravedad: Observada Partes predictivas:

Guardabarro delantero derecho Llanta delantera derecha Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho Puerta delantera derecha Puerta trasera derecha Panel lateral derecho Moldura protectora lateral derecha Giro Delantero (derecho / izquierdo) Cristales de parante delantero Escape Tapa acceso gancho remolque Bolsa de herramientas

Variable Gravedad Parte predictiva: Puerta trasera derecha Tipo Avería: Faltante Gravedad: Observada Partes predictivas:

Puerta delantera derecha

• Parte – Avería – Gravedad con predicción de la Avería (Período 3 – Semestre 2 Año 2004)

Variable Parte Avería predictiva: Abollado Parte: Giro Delantero (D/I) Gravedad: Observada Averías predictivas:

Abollado

Page 174: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 173 de287 Ing. Hugo Daniel Flores

Faltante Variable Gravedad Avería predictiva: Abollado Parte: Giro Delantero (D/I) Gravedad: Observada Averías predictivas: Abollado Faltante

• Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar

(Período 3 – Semestre 2 Año 2004) Variable Parte

Lugar predictivo: Bajada de Buque Parte: Giro Delantero (D/I)

Tipo de avería: Faltante Gravedad: Observada Variable Tipo de Avería Lugar predictivo: Retiro de Puerto Parte: Giro Delantero (D/I) Tipo Avería: Faltante Gravedad: Observada Variable Gravedad Lugar predictivo: Retiro de Puerto Parte: Giro Delantero (D/I) Tipo Avería: Faltante Gravedad: Observada

• Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el

Modelo (Período 3 – Semestre 2 Año 2004)

Variable Parte Modelo predictivo: Modelo 14 Parte: Giro Delantero (D/I) Tipo de avería: Abollado Gravedad: Observada Modelos predictivos:

Modelo 14 Variable Avería Modelo predictivo: Modelo 16 Parte: Giro Delantero (D/I) Tipo de avería: Abollado Gravedad: Observada Modelos predictivos:

Modelo 12 Modelo 13

Page 175: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 174 de287 Ing. Hugo Daniel Flores

Modelo 14 Modelo 15

Variable Gravedad Modelo predictivo: Modelo 14 Parte: Giro Delantero (D/I) Tipo de avería: Abollado Gravedad: Observada Modelos predictivos:

Modelo 13 Modelo 14

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del cuarto período.

• Parte – Avería – Gravedad con predicción de la Parte (Período 4 – Semestre 1 Año 2005)

Variable Tipo de Avería Parte predictiva: Alerón Tipo de Avería: Faltante Gravedad: - Partes predictivas:

Limpiador y lavador de vidrios traseros Alerón Taza Alfombra suplementarias Manual Retrovisor externo derecho Guardabarro delantero derecho Llanta delantera derecha Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho Puerta delantera derecha Puerta trasera derecha Panel lateral derecho Moldura protectora lateral derecha Giro Delantero (derecho / izquierdo) Cristales de parante delantero

Variable Gravedad Parte predictiva: Cubierta delantera derecha Tipo Avería: Faltante Gravedad: - Partes predictivas:

Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho Puerta delantera derecha

Page 176: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 175 de287 Ing. Hugo Daniel Flores

Puerta trasera derecha Panel lateral derecho Moldura protectora lateral derecha Giro Delantero (derecho / izquierdo) Cristales de parante delantero Escape

• Parte – Avería – Gravedad con predicción de la Avería (Período 4 – Semestre 1 Año 2005)

Variable Parte Avería predictiva: Abollado Parte: Panel lateral derecho Gravedad: - Averías predictivas:

Abollado Faltante Proyección

Variable Gravedad Avería predictiva: Faltante Parte: Panel lateral derecho Gravedad: - Averías predictivas: Abollado

• Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar (Período 4 – Semestre 1 Año 2005)

Variable Parte

Lugar predictivo: Retiro de Puerto Parte: Panel lateral derecho

Tipo de avería: Faltante Gravedad: - Variable Tipo de Avería Lugar predictivo: Retiro de Puerto Parte: Panel lateral derecho Tipo Avería: Faltante Gravedad: - Variable Gravedad Lugar predictivo: Retiro de Puerto Parte: Panel lateral derecho Tipo Avería: Faltante Gravedad: -

• Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el

Modelo (Período 4 – Semestre 1 Año 2005)

Variable Parte

Page 177: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 176 de287 Ing. Hugo Daniel Flores

Modelo predictivo: Modelo 15 Parte: Panel lateral derecho Tipo de avería: Faltante Gravedad: - Modelos predictivos:

Modelo 14 Modelo 15

Variable Avería Modelo predictivo: Modelo 17 Parte: Panel lateral derecho Tipo de avería: Faltante Gravedad: - Modelos predictivos:

Modelo 13 Modelo 14 Modelo 15 Modelo 16

Variable Gravedad Modelo predictivo: Modelo 15 Parte: Panel lateral derecho Tipo de avería: Faltante Gravedad: - Modelos predictivos:

Modelo 10 Modelo 11 Modelo 12 Modelo 13 Modelo 14 Modelo 15

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del quinto período.

• Parte – Avería – Gravedad con predicción de la Parte (Período 5 – Semestre 2 Año 2005)

Variable Tipo de Avería Parte predictiva: Aerosol antipinchazos Tipo de Avería: Faltante Gravedad: - Partes predictivas:

Aerosol antipinchazos Transponder Antena Faldillas para barro Limpiador de Faros (derecho / izquierdo) Limpiador y lavador de parabrisas Limpiador y lavador de vidrios traseros

Page 178: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 177 de287 Ing. Hugo Daniel Flores

Alerón Taza Alfombra suplementarias Manual Retrovisor externo derecho Guardabarro delantero derecho Llanta delantera derecha Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho Puerta delantera derecha Puerta trasera derecha Panel lateral derecho Moldura protectora lateral derecha Giro Delantero (derecho / izquierdo) Cristales de parante delantero Escape Tapa acceso gancho remolque Bolsa de herramientas Otros Llave Parrilla delantera Luz de neblina trasera Faro de stop luneta

Variable Gravedad Parte predictiva: Guardabarro trasero derecho Tipo Avería: Faltante Gravedad: - Partes predictivas:

Zócalo derecho Guardabarro trasero derecho

• Parte – Avería – Gravedad con predicción de la Avería (Período 5 – Semestre 2 Año 2005)

Variable Parte Avería predictiva: Abollado Parte: Zócalo derecho Gravedad: - Averías predictivas:

Abollado Faltante Proyección

Variable Gravedad Avería predictiva: Proyección Parte: Zócalo derecho Gravedad: - Averías predictivas:

Page 179: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 178 de287 Ing. Hugo Daniel Flores

Faltante

• Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar (Período 5 – Semestre 2 Año 2005)

Variable Parte

Lugar predictivo: Retiro de Puerto Parte: Zócalo derecho

Tipo de avería: Faltante Gravedad: - Variable Tipo de Avería Lugar predictivo: Retiro de Puerto Parte: Zócalo derecho Tipo Avería: Faltante Gravedad: - Variable Gravedad Lugar predictivo: Ingreso a Puerto Parte: Zócalo derecho Tipo Avería: Faltante Gravedad: -

• Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el

Modelo (Período 5 – Semestre 2 Año 2005)

Variable Parte Modelo predictivo: Modelo 14 Parte: Zócalo derecho Tipo de avería: Faltante Gravedad: - Modelos predictivos:

Modelo 13

Variable Avería Modelo predictivo: Modelo 16 Parte: Zócalo derecho Tipo de avería: Faltante Gravedad: - Modelos predictivos:

Modelo 10 Modelo 11 Modelo 12 Modelo 13 Modelo 14 Modelo 15

Variable Gravedad Modelo predictivo: Modelo 13 Parte: Zócalo derecho

Page 180: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 179 de287 Ing. Hugo Daniel Flores

Tipo de avería: Faltante Gravedad: - Modelos predictivos:

Modelo 12 Modelo 13 Modelo 14

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del sexto período.

• Parte – Avería – Gravedad con predicción de la Parte (Período 6 – Semestre 1 Año 2006)

Variable Tipo de Avería Parte predictiva: Panel trasero bajo baúl Tipo de Avería: Faltante Gravedad: - Partes predictivas:

Panel trasero bajo baúl Paragolpe trasero / Zona contacto Tapizado interno puerta delantera izquierda Zócalo interno puerta delantera izquierda Manijas externas de puertas delanteras Manijas externas de puertas traseras Aerosol antipinchazos Transponder Antena Faldillas para barro Limpiador de Faros (derecho / izquierdo) Limpiador y lavador de parabrisas Limpiador y lavador de vidrios traseros Alerón Taza Alfombra suplementarias Manual Retrovisor externo derecho Guardabarro delantero derecho Llanta delantera derecha Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho Puerta delantera derecha Puerta trasera derecha Panel lateral derecho Moldura protectora lateral derecha Giro Delantero (derecho / izquierdo) Cristales de parante delantero Escape Tapa acceso gancho remolque Bolsa de herramientas

Page 181: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 180 de287 Ing. Hugo Daniel Flores

Otros Llave Parrilla delantera Luz de neblina trasera

Variable Gravedad Parte predictiva: Puerta delantera derecha Tipo Avería: Faltante Gravedad: - Partes predictivas:

Guardabarro trasero derecho Puerta delantera derecha

• Parte – Avería – Gravedad con predicción de la Avería (Período 6 – Semestre 1 Año 2006)

Variable Parte Avería predictiva: Abollado Parte: Cubierta delantera derecha Gravedad: - Averías predictivas:

Abollado Faltante Proyección

Variable Gravedad Avería predictiva: Faltante Parte: Cubierta delantera derecha Gravedad: - Averías predictivas: Abollado

• Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar

(Período 6 – Semestre 1 Año 2006) Variable Parte

Lugar predictivo: Retiro de Puerto Parte: Cubierta delantera derecha

Tipo de avería: Faltante Gravedad: - Variable Tipo de Avería Lugar predictivo: Retiro de Puerto Parte: Cubierta delantera derecha Tipo Avería: Faltante Gravedad: - Variable Gravedad Lugar predictivo: Retiro de Puerto Parte: Cubierta delantera derecha

Page 182: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 181 de287 Ing. Hugo Daniel Flores

Tipo Avería: Faltante Gravedad: -

• Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el

Modelo (Período 6 – Semestre 1 Año 2006)

Variable Parte Modelo predictivo: Modelo 11 Parte: Cubierta delantera derecha Tipo de avería: Faltante Gravedad: - Modelos predictivos:

Modelo 10 Modelo 11 Modelo 12 Modelo 13 Modelo 14

Variable Avería Modelo predictivo: Modelo 14 Parte: Cubierta delantera derecha Tipo de avería: Faltante Gravedad: - Modelos predictivos:

Modelo 10 Modelo 11 Modelo 12 Modelo 13 Modelo 14

Variable Gravedad Modelo predictivo: Modelo 12 Parte: Cubierta delantera derecha Tipo de avería: Faltante Gravedad: - Modelos predictivos:

Modelo 10 Modelo 11 Modelo 12

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del séptimo período.

• Parte – Avería – Gravedad con predicción de la Parte (Período 7 – Semestre 2 Año 2006)

Variable Tipo de Avería Parte predictiva: Manijas externas de puertas traseras Tipo de Avería: Faltante Gravedad: -

Page 183: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 182 de287 Ing. Hugo Daniel Flores

Partes predictivas: Manijas externas de puertas traseras Aerosol antipinchazos Transponder Antena Faldillas para barro Limpiador de Faros (derecho / izquierdo) Limpiador y lavador de parabrisas Limpiador y lavador de vidrios traseros Alerón Taza Alfombra suplementarias Manual Retrovisor externo derecho Guardabarro delantero derecho Llanta delantera derecha Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho Puerta delantera derecha Puerta trasera derecha Panel lateral derecho Moldura protectora lateral derecha Giro Delantero (derecho / izquierdo) Cristales de parante delantero Escape Tapa acceso gancho remolque Bolsa de herramientas Otros

Variable Gravedad Parte predictiva: Cubierta delantera derecha Tipo Avería: Faltante Gravedad: - Partes predictivas:

Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho

• Parte – Avería – Gravedad con predicción de la Avería (Período 7 – Semestre 2 Año 2006)

Variable Parte Avería predictiva: Faltante Parte: Guardabarro delantero derecho Gravedad: - Averías predictivas:

Abollado Faltante

Page 184: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 183 de287 Ing. Hugo Daniel Flores

Variable Gravedad Avería predictiva: Faltante Parte: Guardabarro delantero derecho Gravedad: - Averías predictivas: Abollado

• Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar

(Período 7 – Semestre 2 Año 2006) Variable Parte

Lugar predictivo: Transferencia ubicación y línea de carga Parte: Guardabarro delantero derecho

Tipo de avería: Faltante Gravedad: - Variable Tipo de Avería Lugar predictivo: Transferencia ubicación y línea de carga Parte: Guardabarro delantero derecho Tipo Avería: Faltante Gravedad: - Variable Gravedad Lugar predictivo: Transferencia ubicación y línea de carga Parte: Guardabarro delantero derecho Tipo Avería: Faltante Gravedad: -

• Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el

Modelo (Período 7 – Semestre 2 Año 2006)

Variable Parte Modelo predictivo: Modelo 15 Parte: Guardabarro delantero derecho Tipo de avería: Faltante Gravedad: - Modelos predictivos:

Modelo 14 Modelo 15 Modelo 16

Variable Avería Modelo predictivo: Modelo 16 Parte: Guardabarro delantero derecho Tipo de avería: Faltante Gravedad: - Modelos predictivos:

Modelo 15

Variable Gravedad

Page 185: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 184 de287 Ing. Hugo Daniel Flores

Modelo predictivo: Modelo 15 Parte: Guardabarro delantero derecho Tipo de avería: Faltante Gravedad: - Modelos predictivos:

Modelo 15 A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del octavo período.

• Parte – Avería – Gravedad con predicción de la Parte (Período 8 – Semestre 1 Año 2007)

Variable Tipo de Avería Parte predictiva: Manual Tipo de Avería: Faltante Gravedad: - Partes predictivas:

Manual Retrovisor externo derecho Guardabarro delantero derecho Llanta delantera derecha Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho Puerta delantera derecha

Variable Gravedad Parte predictiva: Guardabarro delantero derecho Tipo Avería: Faltante Gravedad: - Partes predictivas:

Retrovisor externo derecho Guardabarro delantero derecho Llanta delantera derecha Cubierta delantera derecha

• Parte – Avería – Gravedad con predicción de la Avería (Período 8 – Semestre 1 Año 2007)

Variable Parte Avería predictiva: Faltante Parte: Zócalo derecho Gravedad: - Averías predictivas:

Faltante Variable Gravedad Avería predictiva: Faltante Parte: Zócalo derecho

Page 186: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 185 de287 Ing. Hugo Daniel Flores

Gravedad: - Averías predictivas: Faltante

• Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar

(Período 8 – Semestre 1 Año 2007) Variable Parte

Lugar predictivo: Retiro de Puerto Parte: Zócalo derecho

Tipo de avería: Faltante Gravedad: - Variable Tipo de Avería Lugar predictivo: Transferencia ubicación y línea de carga Parte: Zócalo derecho Tipo Avería: Faltante Gravedad: - Variable Gravedad Lugar predictivo: Transferencia ubicación y línea de carga Parte: Zócalo derecho Tipo Avería: Faltante Gravedad: -

• Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el

Modelo (Período 8 – Semestre 1 Año 2007)

Variable Parte Modelo predictivo: Modelo 13 Parte: Zócalo derecho Tipo de avería: Faltante Gravedad: - Modelos predictivos:

Modelo 13 Modelo 14 Modelo 15

Variable Avería Modelo predictivo: Modelo 16 Parte: Zócalo derecho Tipo de avería: Faltante Gravedad: - Modelos predictivos:

Modelo 11 Modelo 12 Modelo 13 Modelo 14 Modelo 15 Modelo 16

Page 187: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 186 de287 Ing. Hugo Daniel Flores

Variable Gravedad Modelo predictivo: Modelo 15 Parte: Zócalo derecho Tipo de avería: Faltante Gravedad: - Modelos predictivos:

Modelo 13 Modelo 14 Modelo 15

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del noveno período.

• Parte – Avería – Gravedad con predicción de la Parte (Período 9 – Semestre 2 Año 2007)

Variable Tipo de Avería Parte predictiva: Cubierta delantera derecha Tipo de Avería: Proyección Gravedad: - Partes predictivas:

Guardabarro delantero derecho Llanta delantera derecha

Variable Gravedad Parte predictiva: Cubierta delantera derechacho Tipo Avería: Proyección Gravedad: - Partes predictivas:

Guardabarro delantero derecho Llanta delantera derecha

• Parte – Avería – Gravedad con predicción de la Avería (Período 9 – Semestre 2 Año 2007)

Variable Parte Avería predictiva: Faltante Parte: Cubierta delantera derecha Gravedad: - Averías predictivas:

Faltante Variable Gravedad Avería predictiva: Faltante Parte: Cubierta delantera derecha Gravedad: - Averías predictivas: Faltante

Page 188: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 187 de287 Ing. Hugo Daniel Flores

• Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar (Período 9 – Semestre 2 Año 2007)

Variable Parte

Lugar predictivo: Transferencia ubicación y línea de carga Parte: Cubierta delantera derecha

Tipo de avería: Proyección Gravedad: - Variable Tipo de Avería Lugar predictivo: Transferencia ubicación y línea de carga Parte: Cubierta delantera derecha Tipo Avería: Proyección Gravedad: - Variable Gravedad Lugar predictivo: Transferencia ubicación y línea de carga Parte: Cubierta delantera derecha Tipo Avería: Proyección Gravedad: -

• Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el

Modelo (Período 9 – Semestre 2 Año 2007)

Variable Parte Modelo predictivo: Modelo 12 Parte: Cubierta delantera derecha Tipo de avería: Proyección Gravedad: - Modelos predictivos:

Modelo 12

Variable Avería Modelo predictivo: Modelo 13 Parte: Cubierta delantera derecha Tipo de avería: Proyección Gravedad: - Modelos predictivos:

Modelo 10 Modelo 11 Modelo 12 Modelo 13

Variable Gravedad Modelo predictivo: Modelo 13 Parte: Cubierta delantera derecha Tipo de avería: Proyección Gravedad: - Modelos predictivos:

Modelo 13

Page 189: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 188 de287 Ing. Hugo Daniel Flores

A continuación se muestra resumen de los resultados obtenidos a partir la ejecución del décimo período.

• Parte – Avería – Gravedad con predicción de la Parte (Período 10 – Semestre 1 Año 2008)

Variable Tipo de Avería Parte predictiva: Manual Tipo de Avería: Proyección Gravedad: - Partes predictivas:

Taza Alfombra suplementarias Manual

Variable Gravedad Parte predictiva: Taza Tipo Avería: Proyección Gravedad: - Partes predictivas:

Taza Alfombra suplementarias Manual Retrovisor externo derecho Guardabarro delantero derecho Llanta delantera derecha Cubierta delantera derecha Zócalo derecho Guardabarro trasero derecho Puerta delantera derecha

• Parte – Avería – Gravedad con predicción de la Avería (Período 10 – Semestre 1 Año 2008)

Variable Parte Avería predictiva: Faltante Parte: Puerta delantera derecha Gravedad: - Averías predictivas:

Faltante Abollado

Variable Gravedad Avería predictiva: Faltante Parte: Puerta delantera derecha Gravedad: - Averías predictivas: Faltante Abollado

Page 190: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 189 de287 Ing. Hugo Daniel Flores

• Lugar – Parte – Avería – Gravedad considerando como variable de predicción el Lugar (Período 10 – Semestre 1 Año 2008)

Variable Parte

Lugar predictivo: Transferencia ubicación y línea de carga Parte: Puerta delantera derecha

Tipo de avería: Proyección Gravedad: - Variable Tipo de Avería Lugar predictivo: Transferencia ubicación y línea de carga Parte: Puerta delantera derecha Tipo Avería: Proyección Gravedad: - Variable Gravedad Lugar predictivo: Transferencia ubicación y línea de carga Parte: Puerta delantera derecha Tipo Avería: Proyección Gravedad: -

• Modelo – Parte – Avería – Gravedad donde se toma como variable de predicción el

Modelo (Período 10 – Semestre 1 Año 2008)

Variable Parte Modelo predictivo: Modelo 10 Parte: Puerta delantera derecha Tipo de avería: Proyección Gravedad: - Modelos predictivos:

Modelo 9 Modelo 10

Variable Avería Modelo predictivo: Modelo 10 Parte: Puerta delantera derecha Tipo de avería: Proyección Gravedad: - Modelos predictivos:

Modelo 9 Modelo 10

Variable Gravedad Modelo predictivo: Modelo 10 Parte: Puerta delantera derecha Tipo de avería: Proyección Gravedad: - Modelos predictivos:

Modelo 9 Modelo 10

Page 191: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 190 de287 Ing. Hugo Daniel Flores

8.4.5. Dificultades encontradas La única dificultad encontrada en el procesamiento de los modelos desarrollados fue que en cuatro de los diez períodos ejecutados se encontraron cuatro eventos que se producían una sola vez en el período respectivo. Por lo tanto en la ejecución del Modelo de Clasificación al contener una sola clasificación para poder correr la aplicación esos registros debían ser eliminados. 8.5. Evaluación Los modelos generados y los resultados obtenidos para cada período han sido satisfactorios. Los modelos de Predicción y Clasificación han tenido un tiempo promedio de proceso de algunos minutos (entre 5 y 10 minutos). En cuanto al modelo de Agrupamiento el tiempo insumido fue de 7 u 8 horas en promedio. Los resultados obtenidos de los diferentes modelos tienen relación entre si y en un primer análisis aproximado se puede deducir que los mismos has sido los esperados especialmente en lo que respecta a cantidades y promedios. La ejecución de los modelos ha generado los datos esperados en función de los objetivos de negocio establecidos previamente para el presente proyecto. Si bien en este primer análisis se puede decir que se han cubierto todas las alternativas para lograr los objetivos de negocio y de minería de datos no se descarta la posibilidad de arribar a nuevas preguntas de negocio o nuevas aproximaciones de resultados. Podemos concluir que los modelos están conectados directamente a los objetivos de negocio y de minería de datos. 8.5.1. Evaluación de los resultados en términos de minería de datos A continuación se desarrolla un resumen de los resultados obtenidos para cada período y para cada modelo de minería de datos. 8.5.1.1. Período 1: Año 2003. Clasificación Averías: 59 % de averías “Abollado”. 22 % de averías “Rayado – Rozado”. 10 % de averías “Pintura saltada”. Lugares: 74 % de averías en “Subida a Buque Puerto de Origen”. Imputación transporte terrestre. 10 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 5 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 5 % de averías en “Transferencia Ubicación y Línea de Carga”. Imputación planta de producción. Modelos: 46 % de averías en Modelo 9. 29 % de averías en Modelo 17. 6 % de averías en Modelo 5.

Page 192: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 191 de287 Ing. Hugo Daniel Flores

6 % de averías en Modelo 20. 5 % de averías en Modelo 18. 5 % de averías en Modelo 13. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Area - Avería – Gravedad: Puerta delantera derecha, Arrancado - Roto – Fisurado, Intolerable: 99 - 2 % Escape, Abollado, Grave: 779 - 16 %. Alfombra suplementarias, Rayado – Rozado, Grave: 455 - 9 % Parabrisa, Proyección, Mediano: 362 – 7 %.

Luz trasera izquierda, Faltante, Mediano: 626 – 13 %. Puerta delantera derecha, Faltante, Leve: 1130 – 23 %. Cubierta delantera izquierda, Rayado – Rozado, Mediano: 138 – 3 %. Panel lateral izquierdo, Abollado, Leve: 1057 - 21 %. Panel lateral derecho, Abollado, Mediano: 354 – 7 %.

General: Tapa acceso gancho remolque, Faltante, Mediano. Lugar - Parte – Avería:

Ingreso a Puerto, Paragolpe delantero / Superior, Rayado – Rozado: 38 – 1 %. Ingreso a Puerto, Techo corredizo, Faltante: 55 – 1 %. Ingreso a Puerto, Cubierta delantera derecha, Abollado: 111 – 2 %. Transferencia ubicación y línea de carga, Luz de neblina trasera, Exceso kilometraje: 299 – 6 %. Ingreso a Puerto, Luz trasera izquierda, Abollado: 63 – 1 %. Transferencia ubicación y línea de carga, Luz de neblina trasera, Abollado: 76 – 2 %. Subida Buque Puerto de Origen, Bolsa de herramientas, Faltante: 4334 – 87 %.

General: Retiro de Puerto, Tapa acceso gancho remolque, Faltante. Lugar - Parte - Avería – Gravedad: Bajada de Buque, Tapizado interno puerta delantera izquierda, Rayado – Rozado, Mediano: 596 – 12 %. Retiro de Puerto, Cristales de parante delantero, Abollado, Grave: 1007 – 20 %. Ingreso a Puerto, Moldura protectora lateral derecha, Rayado – Rozado, Leve: 488 – 10 %. Subida Buque Puerto de Origen, Cable de carga, Faltante, Mediano: 582 – 12 %. Transferencia ubicación y línea de carga, Insignia, Faltante, Leve: 99 – 2 %. Subida Buque Puerto de Origen, Llave, Abollado, Leve: 2120 – 42 %. Subida Buque Puerto de Origen, Guardabarro delantero izquierdo, Rayado – Rozado, Mediano: 79 – 2 %. General: Retiro de Puerto, Tapa acceso gancho remolque, Faltante, Mediano.

Page 193: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 192 de287 Ing. Hugo Daniel Flores

Modelo - Area – Avería: Modelo 4, Moldura protectora lateral derecha, Faltante: 636 – 13 %. Modelo 10, Manual, Abollado: 1267 – 25 %. Modelo 18, Cubierta delantera derecha, Rayado – Rozado: 879 – 18 %. Modelo 10, Giro Delantero (derecho / izquierdo), Rayado – Rozado: 121 – 2 %. Modelo 10, Panel lateral izquierdo, Abollado: 1113 – 22 %. Modelo 9, Cerraduras de puertas, Rayado – Rozado: 295 – 6 %. Modelo 17, Cubierta delantera izquierda, Abollado: 689 – 14 %.

General: Modelo 12, Tapa acceso gancho remolque, Faltante. Modelo - Area - Avería – Gravedad:

Modelo 5, Giro Delantero (derecho / izquierdo), Faltante, Intolerable: 389 – 8 %. Modelo 15, Puerta trasera derecha, Faltante, Grave: 792 – 16 %. Modelo 18, Paragolpe trasero / Spoiler trasero, Faltante, Mediano: 110 – 2 %. Modelo 16, Bolsa de herramientas, Abollado, Mediano: 231 – 5 %. Modelo 17, Panel lateral derecho, Rayado – Rozado, Mediano: 290 – 6 %. Modelo 9, Manijas externas de puertas traseras, Rayado – Rozado, Mediano: 168 - 3 %. Modelo 11, Luz de neblina trasera, Faltante, Leve: 2945 – 59 %. Modelo 14, Retrovisor externo derecho, Pintura saltada, Mediano: 65 – 1 %.

General: Modelo 12, Tapa acceso gancho remolque, Faltante, Mediano. Predicción Parte: Con variación de Avería los valores predictivos resultan: Parte: Puerta delantera derecha

Avería: Exceso kilometraje Gravedad: Mediano

Con variación de Gravedad los valores predictivos resultan: Parte: Tapa acceso gancho remolque Avería: Faltante Gravedad: Leve

Avería: Con variación de Parte los valores predictivos resultan: Avería: Faltante Parte: Rueda de auxilio Gravedad: Mediano Con variación de Gravedad los valores predictivos resultan: Avería: Faltante Parte: Tapa acceso gancho remolque Gravedad: Leve Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Rueda de auxilio Avería: Faltante

Page 194: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 193 de287 Ing. Hugo Daniel Flores

Gravedad: Mediano Con variación de Avería los valores predictivos resultan:

Lugar: Transferencia ubicación y línea de carga Parte: Tapa acceso gancho remolque Avería: Exceso kilometraje Gravedad: Mediano

Con variación de Gravedad los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Tapa acceso gancho remolque Avería: Faltante Gravedad: Leve

Modelos: Con variación de Parte los valores predictivos resultan:

Modelo: Modelo 9 Parte: Rueda de auxilio Avería: Faltante Gravedad: Mediano

Con variación de Avería los valores predictivos resultan: Modelo: Modelo 11 Parte: Tapa acceso gancho remolque Avería: Exceso kilometraje Gravedad: Mediano

Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 10 Parte: Tapa acceso gancho remolque Avería: Faltante Gravedad: Leve

8.5.1.2. Período 2: Año 2004 semestre 1. Clasificación Averías: 50 % de averías “Abollado”. 29 % de averías “Rayado – Rozado”. 14 % de averías “Pintura saltada”. 3 % de averías “Faltante” 3 % de averías “Manchado”. Lugares: 83 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 6 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 6 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 2 % de averías en “Retiro de Puerto”. Imputación puerto. Modelos: 47 % de averías en Modelo 17. 32 % de averías en Modelo 9. 10 % de averías en Modelo 13. 6 % de averías en Modelo 20.

Page 195: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 194 de287 Ing. Hugo Daniel Flores

4 % de averías en Modelo 18. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Área - Avería – Gravedad:

Cristales de parante delantero, Faltante, Intolerable: 317 – 6 %. Guardabarro trasero derecho, Faltante, Grave: 756 – 15 %. Cerraduras de puertas, Rayado – Rozado, Mediano: 374 – 7 %. Otros, Abollado, Leve: 1864 – 37 %. Cable de carga, Rayado – Rozado, Leve: 223 – 4 %. Antena, Rayado – Rozado, Mediano: 520 – 10 %. Bolsa de herramientas, Abollado, Mediano: 932 – 19 %.

General: Tapa acceso gancho remolque, Faltante, Mediano. Lugar - Parte – Avería: Transferencia ubicación y línea de carga, Puerta delantera izquierda, Rayado – Rozado: 31 – 1 %. Ingreso a Puerto, Techo corredizo, Rayado – Rozado: 97 - 2 %. Ingreso a Puerto, Puerta trasera derecha, Rayado – Rozado: 62 – 1 %. Transferencia ubicación y línea de carga, Otros, Abollado: 167 – 3 %. Subida Buque Puerto de Origen, Bolsa de herramientas, Faltante: 4580 – 92 %. General: Retiro de Puerto, Tapa acceso gancho remolque, Faltante. Lugar - Parte - Avería – Gravedad: Bajada de Buque, Cristales de parante delantero, Faltante, Intolerable: 259 – 5 %. Retiro de Puerto, Guardabarro trasero derecho, Faltante, Grave: 627 – 13 %. Bajada de Buque, Panel lateral izquierdo, Faltante, Leve: 1961 – 39 %. Ingreso a Puerto, Tapa posterior de techo, Pintura saltada, Mediano: 82 – 2 %. Bajada de Buque, Llanta delantera derecha, Abollado, Leve: 1642 – 33 % Bajada de Buque, Llanta delantera derecha, Faltante, Grave: 405 – 8 %. General: Retiro de Puerto, Tapa acceso gancho remolque, Faltante, Mediano. Modelo - Parte – Avería:

Modelo 17, Aerosol antipinchazos, Proyección: 1010 – 20 %. Modelo 10, Guardabarro delantero izquierdo, Abollado: 1695 – 34 %. Modelo 17, Puerta delantera derecha, Abollado: 614 – 12 %. Modelo 8, Panel lateral izquierdo, Rayado – Rozado: 243 – 5 %. Modelo 6, Limpiador y lavador de parabrisas, Abollado: 192 – 4 %. Modelo 7, Zócalo interno puerta delantera izquierda, Rayado – Rozado: 131 – 3 %. Modelo 17, Cubierta delantera izquierda, Rayado – Rozado: 382 – 8 %. Modelo 17, Alfombra baúl / caja de carga, Faltante: 713 – 14 %.

Page 196: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 195 de287 Ing. Hugo Daniel Flores

General: Modelo 14, Tapa acceso gancho remolque, Faltante. Modelo - Parte - Avería – Gravedad:

Modelo 16, Guardabarro trasero derecho, Faltante, Grave: 800 – 16 %. Modelo 8, Cristales de parante delantero, Faltante, Grave: 273 – 5 %. Modelo 10, Barras de techo, Proyección, Mediano: 111 – 2 %. Modelo 13, Puerta delantera izquierda, Faltante, Leve: 2341 – 47 %. Modelo 8, Giro Delantero (derecho / izquierdo), Faltante, Mediano: 350 – 7 %. Modelo 17, Aleron, Faltante, Mediano: 1085 – 22 %.

General: Modelo 14, Tapa acceso gancho remolque, Faltante, Mediano. Predicción Parte: Con variación de Avería los valores predictivos resultan: Parte: Escape

Avería: Abollado Gravedad: Mediano

Con variación de Gravedad los valores predictivos resultan: Parte: Llave Avería: Abollado Gravedad: Mediano

Avería: Con variación de Parte los valores predictivos resultan: Avería: Abollado Parte: Llave Gravedad: Mediano Con variación de Gravedad los valores predictivos resultan: Avería: Abollado Parte: Llave Gravedad: Mediano Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Baja de Buque Parte: Llave Avería: Abollado Gravedad: Mediano Con variación de Avería los valores predictivos resultan:

Lugar: Retiro de Puerto Parte: Llave Avería: Abollado Gravedad: Mediano

Con variación de Gravedad los valores predictivos resultan: Lugar: Bajada de Buque Parte: Llave Avería: Abollado Gravedad: Mediano

Page 197: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 196 de287 Ing. Hugo Daniel Flores

Modelos: Con variación de Parte los valores predictivos resultan:

Modelo: Modelo 11 Parte: Llave Avería: Abollado Gravedad: Mediano

Con variación de Avería los valores predictivos resultan: Modelo: Modelo 11 Parte: Llave Avería: Abollado Gravedad: Mediano

Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 11 Parte: Llave Avería: Abollado Gravedad: Mediano

8.5.1.3. Período 3: Año 2004 semestre 2. Clasificación Averías: 44 % de averías “Abollado”. 34 % de averías “Rayado – Rozado”. 15 % de averías “Pintura saltada”. 5 % de averías “Faltante” Lugares: 76 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 9 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 9 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 4 % de averías en “Subida a Buque”. Imputación puerto. Modelos: 56 % de averías en Modelo 17. 15 % de averías en Modelo 9. 12 % de averías en Modelo 20. 9 % de averías en Modelo 13. 5 % de averías en Modelo 5. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Área - Avería – Gravedad:

Paragolpe trasero / Zona contacto, Rayado – Rozado, Grave: 58 – 1 %. Alerón, Proyección, Grave: 78 – 2 %. Luz de neblina trasera, Abollado, Grave: 401 – 8 %. Tapa acceso gancho remolque, Faltante: 4432 – 89 %.

Page 198: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 197 de287 Ing. Hugo Daniel Flores

General: Tapa acceso gancho remolque, Faltante, Leve. Lugar - Parte – Avería: Ingreso a Puerto, Barras de techo, Pintura saltada: 46 – 1 %. Ingreso a Puerto, Guardabarro trasero derecho, Pintura saltada: 40 – 1 %. Ingreso a Puerto, Luz de neblina trasera, Abollado: 147 – 3 %. Ingreso a Puerto, Luz de patente trasera, Rayado – Rozado: 72 – 1 %. Transferencia ubicación y línea de carga, Retrovisor externo izquierdo, Rayado – Rozado: 36 – 1 %. Ingreso a Puerto, Paragolpe trasero / Zona contacto, Rayado – Rozado: 299 – 6 %. Transferencia ubicación y línea de carga, Bolsa de herramientas, Faltante: 4331- 87 %. General: Retiro de Puerto, Tapa acceso gancho remolque, Faltante. Lugar - Parte - Avería – Gravedad: Ingreso a Puerto, Alfombra suplementarias, Proyección, Grave: 48 – 1 %. Ingreso a Puerto, Luz de neblina trasera, Faltante, Grave: 54 – 1 %. Subida Buque Puerto de Origen, Giro Delantero (derecho / izquierdo), Faltante, Grave: 448 – 9 %. Ingreso a Puerto, Retrovisor externo derecho, Proyección: 548 – 11 %. Subida Buque Puerto de Origen, Otros, Faltante: 3883 – 78 %. General: Retiro de Puerto, Tapa acceso gancho remolque, Faltante, Leve. Modelo - Área – Avería:

Modelo 17, Llave de rueda, Faltante: 556 – 11 %. Modelo 17, Cubierta delantera izquierda, Faltante: 1084 – 22 %. Modelo 9, Giro Delantero (derecho / izquierdo), Abollado: 1409 – 28 %. Modelo 13, Puerta trasera izquierda, Abollado: 89 – 2 %. Modelo 17, Guardabarro trasero derecho, Abollado: 849 – 17 %. Modelo 18, Limpiador y lavador de parabrisas, Proyección: 712 – 14 %. Modelo 17, Tapa posterior de techo, Faltante: 286 – 6 %.

General: Modelo 15, Tapa acceso gancho remolque, Faltante. Modelo - Área - Avería – Gravedad:

Modelo - Área - Avería – Gravedad: Modelo 4, Retrovisor externo derecho, Faltante, Grave: 63 – 1 %. Modelo 10, Faro de stop luneta, Abollado, Grave: 128 – 3 %. Modelo 17, Puerta trasera izquierda, Faltante, Grave: 72 – 1 %. Modelo 17, Manual, Faltante, Grave: 259 – 5 %. Modelo 15, Tapa acceso gancho remolque, Faltante: 4432 – 89 %.

General:

Modelo 15, Tapa acceso gancho remolque, Faltante, Leve.

Page 199: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 198 de287 Ing. Hugo Daniel Flores

Predicción Parte: Con variación de Avería los valores predictivos resultan: Parte: Llanta delantera derecha

Avería: Faltante Gravedad: Observada

Con variación de Gravedad los valores predictivos resultan: Parte: Puerta trasera derecha Avería: Faltante Gravedad: Observada

Avería: Con variación de Parte los valores predictivos resultan: Avería: Abollado Parte: Giro Delantero (derecho / izquierdo) Gravedad: Observada Con variación de Gravedad los valores predictivos resultan: Avería: Abollado Parte: Giro Delantero (derecho / izquierdo) Gravedad: Observada Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Baja de Buque Parte: Giro Delantero (derecho / izquierdo) Avería: Faltante Gravedad: Observada Con variación de Avería los valores predictivos resultan:

Lugar: Retiro de Puerto Parte: Giro Delantero (derecho / izquierdo) Avería: Faltante Gravedad: Observada

Con variación de Gravedad los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Giro Delantero (derecho / izquierdo) Avería: Faltante Gravedad: Observada

Modelos: Con variación de Parte los valores predictivos resultan:

Modelo: Modelo 14 Parte: Giro Delantero (derecho / izquierdo) Avería: Abollado Gravedad: Observada

Con variación de Avería los valores predictivos resultan: Modelo: Modelo 16 Parte: Giro Delantero (derecho / izquierdo) Avería: Faltante Gravedad: Observada

Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 14 Parte: Giro Delantero (derecho / izquierdo)

Page 200: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 199 de287 Ing. Hugo Daniel Flores

Avería: Faltante Gravedad: Observada

8.5.1.4. Período 4: Año 2005 semestre 1. Clasificación Averías: 45 % de averías “Rayado – Rozado”. 28 % de averías “Abollado”. 15 % de averías “Pintura saltada”. 7 % de averías “Faltante” Lugares: 47 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 15 % de averías en “Retiro Fábrica de Origen”. Imputación planta de producción. 15 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 13 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. Modelos: 51 % de averías en Modelo 17. 15 % de averías en Modelo 20. 12 % de averías en Modelo 8. 11 % de averías en Modelo 9. 5 % de averías en Modelo 5. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Área - Avería – Gravedad:

Capot, Rayado – Rozado, Observada: 77 – 2 %. Panel trasero bajo baúl, Rayado – Rozado, Observada: 134 – 3%. Alerón, Proyección, Observada: 172 – 4 %. Llanta delantera izquierda, Abollado, Observada: 703 – 18 %. Zócalo izquierdo, Manchado, Observada: 31 – 1 %. Zócalo derecho, Faltante: 2779 – 71 %.

General: Guardabarro trasero derecho, Faltante. Lugar - Parte – Avería:

Ingreso a Puerto, Capot, Rayado – Rozado: 72 – 2 %. Subida Buque Puerto de Origen, Tapa posterior de techo, Rayado – Rozado: 131 – 3 %. Retiro de Puerto, Taza, Faltante: 226 – 6 %. Retiro de Puerto, Llanta delantera izquierda, Faltante: 311 – 8 %. Retiro de Puerto, Puerta trasera derecha, Faltante: 3161 – 81 %.

General:

Retiro de Puerto, Guardabarro trasero derecho, Faltante.

Page 201: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 200 de287 Ing. Hugo Daniel Flores

Lugar - Parte - Avería – Gravedad: Bajada de Buque, Capot, Rayado – Rozado, Observada: 64 – 2 %. Ingreso a Puerto, Parabrisa, Faltante, Observada: 43 – 1 %. Bajada de Buque, Luz de neblina trasera, Proyección, Observada: 165 – 4 %. Transferencia ubicación y línea de carga, Cubierta delantera derecha, Faltante: 436 – 11 %. Bajada de Buque, Zócalo derecho, Faltante: 2342, - 60 %. Bajada de Buque, Escape, Faltante, Observada: 855 – 22 %.

General:

Retiro de Puerto, Guardabarro trasero derecho, Faltante. Modelo - Área – Avería:

Modelo 9, Parante delantero, Rayado – Rozado: 42 – 1 %. Modelo 6, Limpiador de Faros (derecho / izquierdo), Proyección: 380 – 10 %. Modelo 8, Llanta delantera izquierda, Abollado: 812 – 21 %. Modelo 18, Panel trasero bajo baúl, Rayado – Rozado: 1250 – 32 %. Modelo 18, Escape, Proyección, 583 – 15 %. Modelo 17, Guardabarro delantero izquierdo, Pintura saltada: 533 – 14 %. Modelo 17, Separador interno de carga, Proyección: 237 – 6 %. Modelo 17, Llanta delantera derecha, Pintura saltada: 65 – 2 %.

General: Modelo 15, Guardabarro trasero derecho, Faltante. Modelo - Área - Avería – Gravedad:

Modelo 16, Batería, Rayado – Rozado, Observada: 22 – 1 %. Modelo 18, Luz de patente trasera, Proyección, Observada: 146 – 4 %. Modelo 8, Tapa acceso gancho remolque, Abollado, Observada: 382 – 10 %. Modelo 18, Alfombra suplementarias, Faltante, Observada: 518 – 13 %. Modelo 9, Zócalo derecho, Manchado, Observada: 67 – 2 %. Modelo 15, Zócalo derecho, Faltante: 2779 – 71 %.

General: Modelo 15, Guardabarro trasero derecho, Faltante. Predicción Parte: Con variación de Avería los valores predictivos resultan: Parte: Alerón

Avería: Faltante Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Parte: Cubierta delantera derecha Avería: Faltante Gravedad: -

Avería: Con variación de Parte los valores predictivos resultan: Avería: Abollado Parte: Panel lateral derecho

Page 202: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 201 de287 Ing. Hugo Daniel Flores

Gravedad: - Con variación de Gravedad los valores predictivos resultan: Avería: Faltante Parte: Panel lateral derecho Gravedad: - Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Giro Panel lateral derecho Avería: Faltante Gravedad: - Con variación de Avería los valores predictivos resultan:

Lugar: Retiro de Puerto Parte: Panel lateral derecho Avería: Faltante Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Panel lateral derecho Avería: Faltante Gravedad: -

Modelos: Con variación de Parte los valores predictivos resultan:

Modelo: Modelo 15 Parte: Panel lateral derecho Avería: Faltante Gravedad: -

Con variación de Avería los valores predictivos resultan: Modelo: Modelo 17 Parte: Panel lateral derecho Avería: Faltante Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 15 Parte: Panel lateral derecho Avería: Faltante Gravedad: -

8.5.1.5. Período 5: Año 2005 semestre 2. Clasificación Averías: 48 % de averías “Rayado – Rozado”. 29 % de averías “Abollado”. 13 % de averías “Pintura saltada”. 6 % de averías “Faltante” Lugares: 32 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre.

Page 203: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 202 de287 Ing. Hugo Daniel Flores

23 % de averías en “Retiro Fábrica de Origen”. Imputación planta de producción. 20 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 14 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 6 % de averías en “Retiro de Puerto”. Imputación puerto. Modelos: 47 % de averías en Modelo 17. 16 % de averías en Modelo 8. 12 % de averías en Modelo 9. 10 % de averías en Modelo 5. 7 % de averías en Modelo 20. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Área - Avería – Gravedad:

Barras de techo, Pintura saltada, Observada: 38 – 1 %. Barras de techo, Rayado – Rozado, Observada: 108 – 3 %. Retrovisor externo izquierdo, Pintura saltada, Observada: 146 – 4 %. Tapa tanque combustible, Rayado – Rozado, Observada: 30 – 1 %. Bolsa de herramientas, Rayado – Rozado, Observada: 81 – 2 %. Guardabarro delantero derecho, Faltante: 3464 – 89 %.

General:

Guardabarro delantero derecho, Faltante.

Lugar - Parte – Avería: Subida Buque Puerto de Origen, Paragolpe delantero / Protector delantero Rayado – Rozado: 29 – 1 %. Bajada de Buque, Paragolpe delantero / Protector delantero, Rayado - Rozado 63 – 2 %. Bajada de Buque, Paragolpe delantero / Superior, Rayado – Rozado: 44 – 1 %. Retiro Fábrica de Origen, Paragolpe trasero / Spoiler trasero, Rayado – Rozado: 993 – 26 %. Bajada de Buque, Antena, Proyección: 177 – 5 %. Retiro de Puerto, Cristales de parante delantero, Faltante: 2562 – 66 %. General: Retiro de Puerto, Guardabarro delantero derecho, Faltante. Lugar - Parte - Avería – Gravedad: Ingreso a Puerto, Techo (inclusive convertible), Pintura saltada: 67 – 2 %. Ingreso a Puerto, Otros, Abollado: 177 – 5 %. Ingreso a Puerto, Techo (inclusive convertible), Rayado – Rozado: 142 – 4 %. Ingreso a Puerto, Llanta delantera izquierda, Proyección: 111 – 3 %. Subida Buque Puerto de Origen, Guardabarro delantero derecho, Faltante: 2955 - 76 %. Bajada de Buque, Zócalo derecho, Faltante, Observada: 168 – 4 %. Ingreso a Puerto, Llanta delantera derecha, Proyección, Observada: 249 – 6 %. General:

Page 204: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 203 de287 Ing. Hugo Daniel Flores

Retiro de Puerto, Guardabarro delantero derecho, Faltante. Modelo - Área – Avería:

Modelo 18, Guardabarros y parante trasero izquierdo, Rayado – Rozado: 269 – 7 %. Modelo 17, Faro de stop luneta, Abollado: 669 – 17 %. Modelo 7, Tapa acceso gancho remolque, Abollado: 1290 – 33 %. Modelo 17, Tapa de Baúl o Puerta Trasera, Rayado – Rozado: 1307 – 34 %. Modelo 13, Techo (inclusive convertible), Abollado: 24 – 1 %. Modelo 6, Paragolpe trasero / Zona contacto, Rayado – Rozado: 263 – 7 %. Modelo 9, Paragolpe delantero / Superior, Rayado – Rozado: 59 – 2 %.

General:

Modelo 13, Guardabarro delantero derecho, Faltante.

Modelo - Área - Avería – Gravedad: Modelo 19, Tapizado interno puerta delantera izquierda, Rayado – Rozado, Observada: 53 – 1 %. Modelo 18, Llave, Abollado, Observada: 123 – 3 %. Modelo 6, Taza, Proyección, Observada: 167 – 4 %. Modelo 8, Guardabarro delantero izquierdo, Abollado, Observada: 50 – 1 %. Modelo 13, Guardabarro delantero derecho, Faltante: 3464 – 89 %.

General: Modelo 13, Guardabarro delantero derecho, Faltante.

Predicción Parte: Con variación de Avería los valores predictivos resultan: Parte: Aerosol antipinchazos

Avería: Faltante Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Parte: Guardabarro trasero derecho Avería: Faltante Gravedad: -

Avería: Con variación de Parte los valores predictivos resultan: Avería: Abollado Parte: Zócalo derecho Gravedad: - Con variación de Gravedad los valores predictivos resultan: Avería: Proyección Parte: Zócalo derecho Gravedad: - Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Zócalo derecho Avería: Faltante

Page 205: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 204 de287 Ing. Hugo Daniel Flores

Gravedad: - Con variación de Avería los valores predictivos resultan:

Lugar: Retiro de Puerto Parte: Zócalo derecho Avería: Faltante Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Lugar: Ingreso a Puerto Parte: Zócalo derecho Avería: Faltante Gravedad: -

Modelos: Con variación de Parte los valores predictivos resultan:

Modelo: Modelo 14 Parte: Zócalo derecho Avería: Faltante Gravedad: -

Con variación de Avería los valores predictivos resultan: Modelo: Modelo 16 Parte: Zócalo derecho Avería: Faltante Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 13 Parte: Zócalo derecho Avería: Faltante Gravedad: -

8.5.1.6. Período 6: Año 2006 semestre 1. Clasificación Averías: 45 % de averías “Abollado”. 40 % de averías “Rayado – Rozado”. 7 % de averías “Pintura saltada”. 7 % de averías “Faltante” Lugares: 42 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 17 % de averías en “Retiro Fábrica de Origen”. Imputación planta de producción. 15 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 13 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 5 % de averías en “Retiro de Puerto”. Imputación puerto. Modelos: 40 % de averías en Modelo 17. 21 % de averías en Modelo 9. 14 % de averías en Modelo 5. 12 % de averías en Modelo 20.

Page 206: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 205 de287 Ing. Hugo Daniel Flores

8 % de averías en Modelo 8. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Área - Avería – Gravedad:

Capot, Rayado – Rozado, Observada: 24 – 1 %. Panel trasero bajo baúl, Rayado – Rozado, Observada: 37 – 1 %. Manijas externas de puertas delanteras, Faltante, Observada: 40 – 1 %. Luz de neblina trasera, Abollado, Observada: 340 – 9 %. Zócalo derecho, Faltante: 3301 – 88 %.

General: Zócalo derecho, Faltante. Lugar - Parte – Avería:

Transferencia ubicación y línea de carga, Spoiler delantero, Rayado – Rozado: 42 – 1 %. Transferencia ubicación y línea de carga, Paragolpe delantero / Protector delantero, Rayado – Rozado: 27 – 1 %. Ingreso a Puerto, Paragolpe delantero / Protector delantero, Rayado – Rozado: 74 – 2 %. Ingreso a Puerto, Zócalo interno puerta delantera izquierda, Rayado – Rozado: 114 – 3 %. Ingreso a Puerto, Tapa acceso gancho remolque, Faltante: 470 – 12 %. Transferencia ubicación y línea de carga, Llave, Abollado: 53 – 1 %. Subida Buque Puerto de Origen, Guardabarro trasero derecho, Faltante: 2983- 79 %.

General:

Retiro de Puerto, Zócalo derecho, Faltante.

Lugar - Parte - Avería – Gravedad: Bajada de Buque, Spoiler delantero, Rayado – Rozado, Observada: 7 – 1 %. Retiro de Puerto, Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada: 1 – 4 %. Bajada de Buque, Spoiler delantero, Rayado – Rozado, Observada: 9 – 5 %. Ingreso a Puerto, Tapa posterior de techo, Rayado – Rozado, Observada: 35 – 6 %. Bajada de Buque, Moldura protectora lateral derecha, Faltante, Observada: 103 – 7 %. Transferencia ubicación y línea de carga, Puerta trasera izquierda, Abollado, Observada: 33 – 8 %. Bajada de Buque, Tapa acceso gancho remolque, Abollado, Observada: 274 – 9 %. Bajada de Buque, Zócalo derecho, Faltante: 3301 – 10 %.

General:

Retiro de Puerto, Zócalo derecho, Faltante.

Modelo - Área – Avería: Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado: 124 – 3 %. Modelo 17, Panel trasero bajo baúl, Rayado – Rozado: 901 – 24 %. Modelo 7, Escape, Faltante: 1695 – 45 %. Modelo 17, Otros, Rayado – Rozado: 110 – 3 %. Modelo 18, Giro Delantero (derecho / izquierdo), Abollado: 577 – 15 %.

Page 207: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 206 de287 Ing. Hugo Daniel Flores

Modelo 16, Guardabarros y parante trasero izquierdo, Abollado: 318 – 8 %. Modelo 13, Barras de techo, Abollado: 38 – 1 %.

General: Modelo 13, Zócalo derecho, Faltante. Modelo - Área - Avería – Gravedad:

Modelo 20, Spoiler delantero, Rayado – Rozado, Observada: 20 – 1 %. Modelo 19, Paragolpe trasero / Spoiler trasero, Proyección, Observada: 45 – 1 %. Modelo 19, Bolsa de herramientas, Proyección, Observada: 57 – 2 %. Modelo 7, Bolsa de herramientas, Faltante, Observada: 260 – 7 %. Modelo 16, Parrilla delantera, Pintura saltada, Observada: 74 – 2 %. Modelo 13, Zócalo derecho, Faltante: 3301 – 88 %.

General: Modelo 13, Zócalo derecho, Faltante. Predicción Parte: Con variación de Avería los valores predictivos resultan: Parte: Panel trasero bajo baúl

Avería: Faltante Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Parte: Puerta delantera derecha Avería: Faltante Gravedad: -

Avería: Con variación de Parte los valores predictivos resultan: Avería: Abollado Parte: Cubierta delantera derecha Gravedad: - Con variación de Gravedad los valores predictivos resultan: Avería: Faltante Parte: Cubierta delantera derecha Gravedad: - Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Cubierta delantera derecha Avería: Faltante Gravedad: - Con variación de Avería los valores predictivos resultan:

Lugar: Retiro de Puerto Parte: Cubierta delantera derecha Avería: Faltante Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Lugar: Retiro de Puerto

Page 208: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 207 de287 Ing. Hugo Daniel Flores

Parte: Cubierta delantera derecha Avería: Faltante Gravedad: -

Modelos: Con variación de Parte los valores predictivos resultan:

Modelo: Modelo 11 Parte: Cubierta delantera derecha Avería: Faltante Gravedad: -

Con variación de Avería los valores predictivos resultan: Modelo: Modelo 14 Parte: Cubierta delantera derecha Avería: Faltante Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 12 Parte: Cubierta delantera derecha Avería: Faltante Gravedad: -

8.5.1.7. Período 7: Año 2006 semestre 2. Clasificación Averías: 47 % de averías “Rayado – Rozado”. 30 % de averías “Abollado”. 14 % de averías “Faltante”. 5 % de averías “Pintura saltada” Lugares: 40 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 21% de averías en “Bajada de Buque”. Imputación transporte marítimo. 16 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de producción. 10 % de averías en “Subida a Buque”. Imputación puerto. 6 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. Modelos: 50 % de averías en Modelo 20. 22 % de averías en Modelo 5. 10 % de averías en Modelo 10. 7 % de averías en Modelo 9. 4 % de averías en Modelo 13. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Área - Avería – Gravedad:

Page 209: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 208 de287 Ing. Hugo Daniel Flores

Bolsa de herramientas, Arrancado - Roto – Fisurado, Observada: 15 – 1 %. Luz de neblina trasera, Abollado, Observada: 94 – 4 %. Faro de stop luneta, Rayado – Rozado, Observada: 94 – 4 %. Tapa posterior de techo, Proyección, Observada: 128 – 5 %. Alfombra suplementarias, Abollado, Observada: 22 - 1 %. Guardabarro delantero derecho, Faltante: 2271 – 86 %.

General: Guardabarro delantero derecho, Faltante. Lugar - Parte – Avería: Bajada de Buque, Paragolpe delantero / Protector delantero, Rayado – Rozado: 41 – 2 %.

Bajada de Buque, Manijas externas de puertas traseras, Proyección: 326 – 12 %. Ingreso a Puerto, Parabrisa, Proyección: 865 – 33 %. Bajada de Buque, Guardabarro delantero izquierdo, Abollado: 473 – 18 %. Ingreso a Puerto, Faro de stop luneta, Abollado: 483 – 18 %. Ingreso a Puerto, Llave, Rayado – Rozado: 429 – 16 %.

General:

Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante. Lugar - Parte - Avería – Gravedad:

Bajada de Buque, Panel trasero bajo baúl, Rayado – Rozado, Observada: 14 – 1 %. Bajada de Buque, Alfombra suplementarias, Proyección, Observada: 21 – 1 %. Bajada de Buque, Parrilla delantera, Abollado, Observada: 67 – 3 %. Ingreso a Puerto, Guardabarro delantero derecho, Faltante, Observada: 250 – 10 %. Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante: 2271 – 86 %.

General: Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante.

Modelo - Área – Avería:

Modelo 20, Parrilla delantera, Rayado – Rozado: 252 – 10 %. Modelo 19, Retrovisor externo izquierdo, Abollado: 553 – 21 %. Modelo 6, Puerta delantera derecha, Faltante: 868 – 33 %. Modelo 11, Barras de techo, Proyección: 91 – 3 %. Modelo 20, Barras de techo, Proyección: 714 – 27 %. Modelo 18, Retrovisor externo derecho, Reventado – Estallado: 114 – 4 %. Modelo 13, Llanta delantera derecha, Abollado: 32 – 1 %.

General: Modelo 15, Guardabarro delantero derecho, Faltante. Modelo - Área - Avería – Gravedad:

Modelo 5, Zócalo izquierdo, Rayado – Rozado, Observada: 22 – 1 %. Modelo 7, Zócalo izquierdo, Abollado, Observada: 42 – 2 %. Modelo 6, Manijas externas de puertas traseras, Proyección, Observada: 42 – 2 %. Modelo 8, Retrovisor externo derecho, Pintura saltada, Observada: 20 – 1 %. Modelo 19, Retrovisor externo derecho, Faltante, Observada: 224 – 9 %.

Page 210: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 209 de287 Ing. Hugo Daniel Flores

Modelo 15, Guardabarro delantero derecho, Faltante: 2271 – 86 %. General:

Modelo 15, Guardabarro delantero derecho, Faltante. Predicción Parte: Con variación de Avería los valores predictivos resultan: Parte: Manijas externas de puertas traseras

Avería: Faltante Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Parte: Cubierta delantera derecha Avería: Faltante Gravedad: -

Avería: Con variación de Parte los valores predictivos resultan: Avería: Faltante Parte: Guardabarro delantero derecho Gravedad: - Con variación de Gravedad los valores predictivos resultan: Avería: Faltante Parte: Guardabarro delantero derecho Gravedad: - Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Guardabarro delantero derecho Avería: Faltante Gravedad: - Con variación de Avería los valores predictivos resultan:

Lugar: Transferencia ubicación y línea de carga Parte: Guardabarro delantero derecho Avería: Faltante Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Guardabarro delantero derecho Avería: Faltante Gravedad: -

Modelos: Con variación de Parte los valores predictivos resultan:

Modelo: Modelo 15 Parte: Guardabarro delantero derecho Avería: Faltante Gravedad: -

Con variación de Avería los valores predictivos resultan: Modelo: Modelo 16 Parte: Guardabarro delantero derecho

Page 211: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 210 de287 Ing. Hugo Daniel Flores

Avería: Faltante Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 15 Parte: Guardabarro delantero derecho Avería: Faltante Gravedad: -

8.5.1.8. Período 8: Año 2007 semestre 1. Clasificación Averías: 43 % de averías “Rayado – Rozado”. 25 % de averías “Abollado”. 20 % de averías “Faltante”. 8 % de averías “Pintura saltada” Lugares: 48 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de producción. 19 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 17 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 7 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 5 % de averías en “Retiro de Puerto”. Imputación puerto. Modelos: 47 % de averías en Modelo 20. 24 % de averías en Modelo 5. 9 % de averías en Modelo 13. 7 % de averías en Modelo 9. 4 % de averías en Modelo 17. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Área - Avería – Gravedad:

Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada: 64 – 2 %. Paragolpe trasero / Spoiler trasero, Rayado – Rozado, Observada: 68 – 2 %. Tapa posterior de techo, Abollado, Observada: 76 – 3 %. Luz de neblina trasera, Faltante, Observada: 437 – 14 %. Zócalo derecho, Faltante: 2377 – 78 %.

General: Zócalo derecho, Faltante. Lugar - Parte – Avería:

Ingreso a Puerto, Puerta trasera izquierda, Proyección: 599 – 20 %.

Page 212: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 211 de287 Ing. Hugo Daniel Flores

Transferencia ubicación y línea de carga, Guardabarro trasero derecho, Pintura saltada: 288 – 10 %. Bajada de Buque, Moldura protectora lateral derecha, Faltante: 910 – 30 %. Transferencia ubicación y línea de carga, Techo (inclusive convertible), Rayado – Rozado: 510 – 17 %. Transferencia ubicación y línea de carga, Manual, Faltante: 722 – 24 %.

General:

Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante. Lugar - Parte - Avería – Gravedad:

Ingreso a Puerto, Zócalo izquierdo, Abollado, Observada: 57 – 2 %. Transferencia ubicación y línea de carga, Puerta trasera izquierda, Rayado – Rozado, Observada: 68 – 2 %. Transferencia ubicación y línea de carga, Tapizado interno puerta delantera izquierda, Rayado – Rozado, Observada: 160 – 5 %. Subida Buque Puerto de Origen, Panel lateral derecho, Abollado, Observada: 349 – 12 %. Transferencia ubicación y línea de carga, Zócalo derecho, Faltante: 2377 - 78 %.

General:

Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante. Modelo - Área – Avería:

Modelo 5, Capot, Rayado – Rozado: 105 – 3 %. Modelo 5, Manijas externas de puertas traseras, Proyección: 316 – 10 %. Modelo 7, Parrilla delantera, Faltante: 730 – 24 %. Modelo 19, Zócalo izquierdo, Abollado: 455 – 15 %. Modelo 13, Guardabarro delantero izquierdo, Abollado: 206 – 7 %. Modelo 20, Limpiador y lavador de parabrisas, Proyección: 1110 – 37 %. Modelo 14, Techo corredizo, Faltante: 90 – 3 %.

General: Modelo 14, Zócalo derecho, Faltante. Modelo - Área - Avería – Gravedad:

Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada: 20 – 4 %. Modelo 20, Tapa de Baúl o Puerta Trasera, Rayado – Rozado, Observada: 45 – 10 %. Modelo 17, Manijas externas de puertas traseras, Proyección, Observada: 57 – 12 %. Modelo 20, Cubierta delantera izquierda, Rayado – Rozado, Observada: 260 – 56 %. Modelo 11, Panel lateral derecho, Faltante, Observada: 5 – 1 %. Modelo 14, Zócalo derecho, Faltante: 74 – 16 %.

General: Modelo 14, Zócalo derecho, Faltante. Predicción Parte: Con variación de Avería los valores predictivos resultan:

Page 213: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 212 de287 Ing. Hugo Daniel Flores

Parte: Manual Avería: Faltante Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Parte: Guardabarro delantero derecho Avería: Faltante Gravedad: -

Avería: Con variación de Parte los valores predictivos resultan: Avería: Faltante Parte: Zócalo derecho Gravedad: - Con variación de Gravedad los valores predictivos resultan: Avería: Faltante Parte: Zócalo derecho Gravedad: - Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Retiro de Puerto Parte: Zócalo derecho Avería: Faltante Gravedad: - Con variación de Avería los valores predictivos resultan:

Lugar: Transferencia ubicación y línea de carga Parte: Zócalo derecho Avería: Faltante Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Zócalo derecho Avería: Faltante Gravedad: -

Modelos: Con variación de Parte los valores predictivos resultan:

Modelo: Modelo 13 Parte: Zócalo derecho Avería: Faltante Gravedad: -

Con variación de Avería los valores predictivos resultan: Modelo: Modelo 16 Parte: Zócalo derecho Avería: Faltante Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 15 Parte: Zócalo derecho Avería: Faltante Gravedad: -

Page 214: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 213 de287 Ing. Hugo Daniel Flores

8.5.1.9. Período 9: Año 2007 semestre 2. Clasificación Averías: 66 % de averías “Rayado – Rozado”. 14 % de averías “Abollado”. 9 % de averías “Faltante”. 8 % de averías “Pintura saltada” Lugares: 63 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de producción. 16 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 7 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 4 % de averías en “Bajada de Buque”. Imputación transporte marítimo. Modelos: 54 % de averías en Modelo 20. 24 % de averías en Modelo 7. 12 % de averías en Modelo 5. 5 % de averías en Modelo 13. 2 % de averías en Modelo 9. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Área - Avería – Gravedad: Llanta trasera izquierda, Rayado – Rozado, Observada: 67 – 1 %. Cubierta trasera derecha, Rayado – Rozado, Observada: 76 – 2 %. Guardabarros y parante trasero izquierdo, Rayado – Rozado, Observada: 176 – 4 %. Panel lateral derecho, Faltante, Observada: 438 – 9 %. Techo corredizo, Proyección, Observada: 275 – 6 %. Limpiador y lavador de parabrisas, Proyección: 3966 – 79 %. General: Taza, Proyección. Lugar - Parte – Avería:

Bajada de Buque, Capot, Rayado – Rozado: 27 – 1 %. Bajada de Buque, Zócalo interno puerta delantera izquierda, Rayado – Rozado: 30 – 1 %. Bajada de Buque, Barras de techo, Abollado: 147 – 3 %. Bajada de Buque, Tapa acceso gancho remolque, Abollado: 520 – 10 %. Ingreso a Puerto, Manijas externas de puertas delanteras, Proyección: 3082 – 62 %. Transferencia ubicación y línea de carga, Faro de stop luneta, Rayado – Rozado: 1169- 23 %.

General:

Transferencia ubicación y línea de carga, Taza, Proyección.

Page 215: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 214 de287 Ing. Hugo Daniel Flores

Lugar - Parte - Avería – Gravedad:

Transferencia ubicación y línea de carga, Llanta trasera izquierda, Rayado – Rozado, Observada: 72 – 1 %. Ingreso a Puerto, Tapizado interno puerta delantera izquierda, Proyección, Observada: 239 – 5 %. Transferencia ubicación y línea de carga, Tapa tanque combustible, Rayado – Rozado, Observada: 233 – 5 %. Ingreso a Puerto, Escape, Rayado – Rozado, Observada: 51 – 1 %. Transferencia ubicación y línea de carga, Zócalo derecho, Rayado – Rozado, Observada: 100 – 2 %. Subida Buque Puerto de Origen, Puerta delantera izquierda, Abollado, Observada: 62 – 1 %. Subida Buque Puerto de Origen, Limpiador y lavador de parabrisas, Abollado, Observada: 266 – 5 %. Transferencia ubicación y línea de carga, Limpiador y lavador de parabrisas, Proyección: 3966 – 79 %.

General:

Transferencia ubicación y línea de carga, Taza, Proyección. Modelo - Área – Avería:

Modelo 7, Cable de carga, Rayado – Rozado: 356 – 7 %. Modelo 6, Tapizado interno puerta delantera izquierda, Rayado – Rozado: 782 – 16 % Modelo 7, Guardabarro trasero derecho, Pintura saltada: 704 – 14 %. Modelo 14, Luz de neblina trasera, Abollado: 112 – 2 %. Modelo 20, Limpiador y lavador de parabrisas, Proyección: 2716 – 54 %. Modelo 13, Faro de stop luneta, Faltante: 27 – 1 %. Modelo 13, Guardabarro trasero derecho, Abollado: 144 – 3 %. Modelo 13, Techo (inclusive convertible), Abollado: 144 – 3 %.

General:

Modelo 14, Taza, Proyección. Modelo - Área - Avería – Gravedad:

Modelo 20, Llanta trasera izquierda, Rayado – Rozado, Observada: 65 – 1 %. Modelo 20, Alfombra baúl / caja de carga, Rayado – Rozado, Observada: 165 - 3 %. Modelo 8, Alfombra suplementarias, Proyección, Observada: 450 – 9 %. Modelo 16, Llanta delantera derecha, Faltante, Observada: 354 – 7 %. Modelo 7, Llanta delantera derecha, Faltante: 1598 – 32 %. Modelo 20, Transponder, Proyección: 2346 – 47 %.

General: Modelo 14, Taza, Proyección. Predicción Parte: Con variación de Avería los valores predictivos resultan: Parte: Cubierta delantera derecha

Avería: Proyección

Page 216: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 215 de287 Ing. Hugo Daniel Flores

Gravedad: - Con variación de Gravedad los valores predictivos resultan: Parte: Cubierta delantera derecha Avería: Proyección Gravedad: -

Avería: Con variación de Parte los valores predictivos resultan: Avería: Faltante Parte: Cubierta delantera derecha Gravedad: - Con variación de Gravedad los valores predictivos resultan: Avería: Faltante Parte: Cubierta delantera derecha Gravedad: - Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Cubierta delantera derecha Avería: Proyección Gravedad: - Con variación de Avería los valores predictivos resultan:

Lugar: Transferencia ubicación y línea de carga Parte: Cubierta delantera derecha Avería: Proyección Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Cubierta delantera derecha Avería: Proyección Gravedad: -

Modelos: Con variación de Parte los valores predictivos resultan:

Modelo: Modelo 12 Parte: Cubierta delantera derecha Avería: Proyección Gravedad: -

Con variación de Avería los valores predictivos resultan: Modelo: Modelo 13 Parte: Cubierta delantera derecha Avería: Proyección Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 13 Parte: Cubierta delantera derecha Avería: Proyección Gravedad: -

Page 217: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 216 de287 Ing. Hugo Daniel Flores

8.5.1.10. Período 10: Año 2008 semestre 1. Clasificación Averías: 41 % de averías “Rayado – Rozado”. 32 % de averías “Faltante”. 14 % de averías “Abollado”. 6 % de averías “Pintura saltada” Lugares: 56 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de producción. 17 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 11 % de averías en “Subida a Buque”. Imputación puerto. 8 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 6 % de averías en “Bajada de Buque”. Imputación transporte marítimo. Modelos: 48 % de averías en Modelo 20. 34 % de averías en Modelo 7. 8 % de averías en Modelo 5. 3 % de averías en Modelo 13. 3 % de averías en Modelo 9. Nota: datos especificados anteriormente representan más del 90 % del total de registros explotados. Clustering Área - Avería – Gravedad:

Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada: 75 – 2 %. Paragolpe trasero / Spoiler trasero, Proyección, Observada: 145 – 3 %. Moldura protctora lateral izquierda, Rayado – Rozado, Observada: 828 - 17 %. Retrovisor externo derecho, Faltante: 3932 - 79 %.

General: Zócalo derecho, Faltante. Lugar - Parte – Avería:

Transferencia ubicación y línea de carga, Paragolpe delantero / Protector delantero, Rayado – Rozado: 176 – 4 %. Transferencia ubicación y línea de carga, Tapa posterior de techo, Rayado – Rozado: 717 – 14 %. Bajada de Buque, Panel lateral derecho, Faltante: 834 – 17 %. Transferencia ubicación y línea de carga, Manijas externas de puertas traseras, Reventado – Estallado: 204 – 4 %. Transferencia ubicación y línea de carga, Giro Delantero (derecho / izquierdo), Faltante: 3031 – 61 %. Transferencia ubicación y línea de carga, Llanta trasera izquierda, Rayado – Rozado: 38 – 1 %.

Page 218: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 217 de287 Ing. Hugo Daniel Flores

General: Transferencia ubicación y línea de carga, Zócalo derecho, Faltante. Lugar - Parte - Avería – Gravedad:

Ingreso a Puerto, Giro Delantero (derecho / izquierdo), Pintura saltada, Observada: 44 – 1 %. Ingreso a Puerto, Paragolpe trasero / Spoiler trasero, Rayado – Rozado, Observada: 255 – 5 %. Bajada de Buque, Moldura protectora lateral derecha, Abollado, Observada: 116 – 2 %. Transferencia ubicación y línea de carga, Llanta delantera izquierda, Rayado – Rozado, Observada: 402 – 8 %. Ingreso a Puerto, Encendedor, Manchado, Observada: 235 – 5 %. Transferencia ubicación y línea de carga, Retrovisor externo derecho, Faltante: 3932 – 79 %.

General: Transferencia ubicación y línea de carga, Zócalo derecho, Faltante. Modelo - Área – Avería:

Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado: 181 - 4 %. Modelo 20, Manijas externas de puertas delanteras, Proyección: 290 - 6 %. Modelo 13, Techo corredizo Pintura saltada, 186 - 4 %. Modelo 8, Capot, Faltante: 35 - 1 %. Modelo 10, Cristales de parante delantero, Reventado – Estallado: 60 - 1 %. Modelo 19, Puerta trasera derecha, Faltante: 2040 - 41 %. Modelo 7, Panel lateral derecho, Proyección: 2199 - 44 %.

General: Modelo 13, Zócalo derecho, Faltante. Modelo - Área - Avería – Gravedad:

Modelo 20, Guardabarro delantero izquierdo, Rayado – Rozado, Observada: 102 - 2 %. Modelo 7, Conjunto carrocería, Manchado, Observada: 163 - 3 %. Modelo 7, Giro Delantero (derecho / izquierdo), Rayado – Rozado, Observada: 560 - 11 %. Modelo 16, Limpiador y lavador de parabrisas, Faltante, Observada: 202 - 4 %. Modelo 14, Retrovisor externo derecho, Faltante: 3932 - 79 %.

General: Modelo 13, Zócalo derecho, Faltante. Predicción Parte: Con variación de Avería los valores predictivos resultan: Parte: Manual

Avería: Proyección Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Parte: Taza Avería: Proyección Gravedad: -

Page 219: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 218 de287 Ing. Hugo Daniel Flores

Avería: Con variación de Parte los valores predictivos resultan: Avería: Faltante Parte: Puerta delantera derecha Gravedad: - Con variación de Gravedad los valores predictivos resultan: Avería: Faltante Parte: Puerta delantera derecha Gravedad: - Lugar: Con variación de Parte los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Puerta delantera derecha Avería: Proyección Gravedad: - Con variación de Avería los valores predictivos resultan:

Lugar: Transferencia ubicación y línea de carga Parte: Puerta delantera derecha Avería: Proyección Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Lugar: Transferencia ubicación y línea de carga Parte: Puerta delantera derecha Avería: Proyección Gravedad: -

Modelos: Con variación de Parte los valores predictivos resultan:

Modelo: Modelo 10 Parte: Puerta delantera derecha Avería: Proyección Gravedad: -

Con variación de Avería los valores predictivos resultan: Modelo: Modelo 10 Parte: Puerta delantera derecha Avería: Proyección Gravedad: -

Con variación de Gravedad los valores predictivos resultan: Modelo: Modelo 10 Parte: Puerta delantera derecha Avería: Proyección Gravedad: -

8.5.2. Evaluación de los resultados en términos de objetivos de negocio. En este ítems se van a describir los resultados obtenidos de la explotación de datos en función de los objetivos de negocio propuesto para el presente estudio. Cada período analizado contiene como resultado información detallada sobre daños, tipo de daños, lugares, transportes y modelos de autos, los cuales se encuentran relacionados entre si y permiten ver un comportamiento que se va a tratar de describir claramente.

Page 220: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 219 de287 Ing. Hugo Daniel Flores

Existen objetivos de negocios específicamente vinculados con resultados estadísticos como cantidades, cantidades totales, porcentajes, máximos, mínimos, etc. los cuales fueron explicitados en los puntos desarrollados por el proyecto en la parte de exploración de datos, evaluación de resultados y resumen de los resultados obtenidos. Ahora se va a tratar de describir los comportamientos y conductas de los datos explotados para de esta forma concluir con la evaluación final de la minería de datos desarrollada. 8.5.2.1. Tipos de averías. Los Tipos de Averías predominantes a lo largo de los períodos analizados son abollados, rayados o rozados, pinturas saltadas y faltantes. Entre estos 4 Tipos de Averías se encuentra más del 90 % de los siniestros en cada período. El período 1 y 2 se caracteriza en primer lugar por el Tipo de Avería abollado con 59 y 50 % respectivamente, luego el rayado o rozado con 22 y 29 % respectivamente y luego el pintura saltada con el 10 % y 14 % respectivamente. En el segundo período aparece la avería faltante con el 3 % de ocurrencia. Y finalmente en el período 2 aparece por única vez a un nivel aceptable de ocurrencia para ser mencionado el Tipo de Avería manchado con un 3 %. Luego analizando el período 3 se puede ver que los niveles de ocurrencia de las averías cambia teniendo en primer lugar los abollados con 44 %, luego el 34 % para rayados o rozados, en tercer lugar el 15 % de averías son pintura saltada y finalmente el 5 % de tipo de averías son faltantes. El cuarto y quinto período contienen exactamente los mismos tipos de averías con un leve cambio en la distribución de los porcentajes de ocurrencia. Esto es, en primer lugar el Tipo de Avería rayado o rozado con 45 y 48 % para cada período respectivamente, luego aparecen los abollados con 28 y 29 % respectivamente, en tercer lugar se encuentra el Tipo de Avería pintura saltada con el 15 y 13 % respectivamente, y para terminar, en ambos períodos aparece la ocurrencia de los faltantes con el 7 y el 6 % respectivamente. El período 6 presenta en la ocurrencia de los Tipos de Averías la misma distribución en cuanto a porcentajes del período 3. O sea que en primer lugar se ve un 45 % de averías abollado, luego un 40 % de Tipos de Averías rayado o rozado, en tercer lugar pintura saltada con un 7 % y finalmente otro 7 % para los faltantes. Los períodos 7, 8 y 9 presentan la ocurrencia exactamente de los mismos tipos de averías. Los porcentajes se distribuyen de la siguiente forma: en primer lugar rayado o rozado con el 47, 43 y 66 % respectivamente, luego en segundo lugar los abollados con el 30, 25 y 14 % respectivamente, en tercer lugar aparecen los faltantes con el 14, 20 y 9 % respectivamente, y finalmente se observan los tipos de averías de pintura saltada con el 5 % para el período 7 y el 8 % para los períodos 8 y 9. Para concluir con el análisis de los resultados de los Tipos de Averías ocurridos de éste punto se puede ver que en el período 10 con un particular cambio en la posición de los porcentajes de ocurrencia en el segundo lugar aparecen los faltantes con un 32 %. En primer lugar tenemos el rayado – rozado con el 41 %. Y en el tercer y cuarto lugar se encuentran los abollados y pintura saltada con el 14 y 6 % respectivamente.

Page 221: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 220 de287 Ing. Hugo Daniel Flores

8.5.2.2. Lugares. Para los 6 primeros períodos del presente estudio los lugares predominantes donde ocurrieron las averías son a la Subida de Buque en Puerto de Origen con el 74, 83, 76, 47, 32 y 42 respectivamente. Los motivos por los cuales se produjo el cambio son fundamentalmente por la decisión política de la empresa vinculada a la implementación de mayores controles debido al alto porcentaje de siniestralidad. Ese motivo no es incumbencia del presente estudio por lo cual solo es mencionado sin realizar el estudio y/o análisis del cambio ejecutado por la compañía. Los tres primeros períodos se caracterizan en segundo lugar por la ocurrencia de las averías en las operaciones de Bajada de Buque con el 10, el 6 y el 9 % respectivamente. Los siguientes tres períodos el segundo lugar de ocurrencia es Retiro Fábrica de Origen 15, 23 y 17 % respectivamente. Para el tercer lugar en la ocurrencia de averías se haya el mismo comportamiento que para el segundo lugar para los 6 primeros períodos. Esto es, los tres primeros períodos tienen como tercer lugar de ocurrencia de averías el Ingreso a Puerto con el 5, el 6 y el 9 % respectivamente. Luego en los siguientes tres períodos cambia por Bajada de Buque con 15, 20 y 15 % respectivamente. Para concluir con el análisis de los 6 primeros períodos se ve que en el cuarto lugar para el período 1, 2 y 3 se encuentran los lugares de Transferencia Ubicación y Línea de Carga (5 %), Retiro de Puerto (2 %) y Subida a Buque (4 %). Luego para los períodos 4, 5 y 6 se encuentra en cuarto lugar la ocurrencia de averías en Ingreso a Puerto con el 13, 14 y 13 % de ocurrencia respectivamente. Para los períodos 7, 8, 9 y 10 se produce un cambio en los porcentajes de ocurrencia de mayor a menor nivel de averías. En el período 7 el mayor nivel de ocurrencia se ve en el Ingreso a Puerto con el 40 %. Luego se reduce a un 21 % en la Bajada de Buque. En tercer lugar en el período 7 se encuentra la Transferencia Ubicación y Línea de Carga y finalmente con un porcentaje mínimo del 10 % y 6 % se encuentran la Subida a Buque y Subida a Buque Puerto de Origen respectivamente. Básicamente estos dos últimos lugares son similares operativamente pero se diferencian específicamente por el lugar físico. Esta similitud será evaluada en los puntos siguientes donde se analiza la imputabilidad de las averías en función de los tipos de transportes. El período 8 y 9 coinciden en cuatro lugares con el mismo nivel de ocurrencia en porcentajes. En primer término el lugar Transferencia Ubicación y Línea de Carga con el 48 y el 63 % respectivamente. Luego en el segundo puesto el lugar Ingreso a Puerto con el 19 y 16 % respectivamente. En tercer lugar las ocurrencias se producen en la Bajada de Buque con el 7 % en ambos períodos. Para concluir el análisis de estos dos períodos se ve que en el período hay un pequeño porcentaje (5 %) correspondiente al lugar Retiro de Puerto. Para terminar con el análisis de los lugares donde se producen las averías se ve que en el período 10 el 56 % de ocurrencia de averías se produce en el lugar Transferencia Ubicación y Línea de Carga, luego el segundo lugar donde se producen las averías con mayor frecuencia en es Ingreso a Puerto con el 17 %. En tercer lugar se observa que la Subida a Buque tiene el 11 % de ocurrencia de averías. Finalmente los lugares Subida a Buque Puerto de Origen y Bajada de Buque son los de menor ocurrencia con el 8 y el 6 % respectivamente. 8.5.2.3. Modelos. Como particular comportamiento se puede ver que en 9 de los 10 períodos analizados un 50 % ± 6 % de los datos explotados giran en torno a un solo modelo.

Page 222: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 221 de287 Ing. Hugo Daniel Flores

El primer período tiene al Modelo 9 (46 %) como de mayor ocurrencia de averías, seguido por el Modelo 17 con el 29 %. En tercer lugar se encuentra el Modelo 5 y 20 con el 6 %, y finalmente con el 5 % se ve la ocurrencia de averías sobre el Modelo 18 y 13. Los períodos 2 y 3 tienen en primera instancia con mayor nivel de ocurrencia de averías al Modelo 17 (47 y 56 % respectivamente) y luego al Modelo 9 (32 y 15 % respectivamente). Luego en el período 2 sigue el Modelo 13 con el 10 %, en cuarto lugar el Modelo 20 con el 6 % y finalmente el Modelo 18 con el 4 %. Para el período 3 se ve que en el tercer lugar se encuentra el Modelo 20 con el 12 %, luego el Modelo 13 con el 9 % y finalmente el Modelo 5 con el 5 % de ocurrencia de averías. En los períodos 4, 5 y 6 el Modelo con mayor cantidad de ocurrencia de averías es el 17 (51, 47 y 40 % respectivamente). Luego en el período 4 se ve el Modelo 20 con el 15 %, en tercer lugar el Modelo 8 con el 12 % y en cuarto y quinto lugar los Modelos 9 y 5 con el 11 y el 5 % respectivamente. El período 5 tiene en segundo lugar de ocurrencia de averías al Modelo 8 con el 16 %, luego el Modelo 9 con el 12 %, y finalmente el Modelo 5 y 20 con el 10 y el 5 % respectivamente. El período 6 tiene en segundo lugar al Modelo 9 con el 21 %, luego en tercer lugar el Modelo 5 con el 14 %, en cuarto lugar el Modelo 20 con el 12 % y finalmente el Modelo 8 con el 8 %. Los períodos 7 y 8 se caracterizan por la mayor ocurrencia de averías en los Modelos 20 (50 y 47 % respectivamente) y 5 (22 y 24 % respectivamente) en primer y segundo lugar respectivamente. En el período 7 se ve en tercer lugar al Modelo 10 con el 10 % de ocurrencia de averías y luego los Modelos 9 y 13 con el 7 y 4 % respectivamente. En el período 8 se encuentra en el tercer lugar de ocurrencia de averías el Modelo 13 con el 9 % y luego los Modelos 9 y 17 con el 7 y el 4 % respectivamente. Finalmente analizados los datos del período 9 y 10 considerando la ocurrencia de averías en los Modelos se puede ver que tienen la misma ubicación en porcentajes de ocurrencia. El Modelo 20 es el de mayor ocurrencia con el 54 % para el período 9 y el 48 % para el período 10. En segundo lugar en ambos períodos se encuentra el Modelo 7 con el 24 y el 34 % respectivamente para cada período. Luego en tercer lugar se encuentra el Modelo número 5 con el 12 y el 8 % respectivamente para cada período. El Modelo 13 ocupa el cuarto lugar de ocurrencia de averías con el 5 y 3 % respectivamente. Para terminar se menciona con el menor porcentaje de ocurrencia el Modelo 9 con el 2 y el 3 % de nivel de ocurrencia para los períodos 9 y 10 respectivamente. 8.5.2.4. Partes, Averías y Gravedad. La estructura de las averías estudiadas en el presente proyecto es Parte + Avería + Gravedad. En este punto se evalúan los resultados de la explotación de datos combinando los tres parámetros en cada uno de los períodos. Para el primer período se puede ver que la media general es: Tapa acceso gancho remolque, Faltante, Mediano. Es un tipo de daño válido y está relacionada con el robo de esa parte. Los centroides que pueden representar un tipo de ocurrencia de avería mínimo son:

Luz trasera izquierda, Faltante, Mediano (13 %). Cubierta delantera izquierda, Rayado – Rozado, Mediano (3 %).

En ambos casos su ocurrencia es poco probable y los porcentajes arrojados por la explotación de datos no tienen relación con la realidad.

Page 223: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 222 de287 Ing. Hugo Daniel Flores

Finalmente para el primer período se observan los centroides compuesto por: Panel lateral izquierdo, Abollado, Leve (21 %) Panel lateral derecho, Abollado, Mediano (7 %)

Se puede concluir para este período que hay un comportamiento particular debido a que la media global de daño no se corresponde con ninguno de los centroides formados. Posiblemente el resultado se debe al hecho que el número que caracteriza al Tipo de Avería Faltante (7) se encuentra entre los dos Tipos de Avería de mayor ocurrencia en el período (Abollado 6 y Rozado – Rayado 9). El período dos está caracterizado por la media global igual al periodo anterior: Tapa acceso gancho remolque, Faltante, Mediano. Al igual que en el periodo anterior se puede ver que la media global no tiene relación con los datos generados por los centroides que participan con resultado válido. El centroide compuesto por:

Cristales de parante delantero, Faltante, Intolerable (6 %). Tiene poco grado de ocurrencia en la realidad, pero puede llegar a tener aparición entre los siniestros. En cuanto al centroide real representativo de este periodo se encuentra:

Otros, Abollado, Leve (37 %). Este tipo de daños está vinculado directamente a la posibilidad de encontrar abolladuras en diferentes partes de las unidades. Como conclusión de este periodo también se puede decir que el hecho de no haber relación entre la media global y los resultados posibles obtenidos se debe a una cuestión específicamente matemática. Siguiendo con los centroides del periodos 3 se puede ver que la media global continúa siendo: Tapa acceso gancho remolque, Faltante, Leve. Pero la característica distintiva de la media para este período es que su gravedad es leve y no mediana como en los dos períodos anteriores. Este periodo se caracteriza por estos dos tipos de daños:

Paragolpe trasero / Zona contacto, Rayado – Rozado, Grave (1 %). Tapa acceso gancho remolque, Faltante (89 %).

Aquí si se puede ver la relación directa entre la avería con nivel porcentual más alto ocurrido en el período y la media global. Sin embargo no hay correspondencia entre el tipo de avería con mayor cantidad de ocurrencia y el tipo de avería que compone el daño que caracteriza al centroide de mayor porcentaje. El periodo cuatro contiene como media global: Guardabarro trasero derecho, Faltante. Al evaluar la ocurrencia de este evento en la base de datos se puede ver que no tiene posibilidad real de combinación. Posiblemente su aparición en la media es solo a los efectos de cálculos matemáticos. Analizando el centroide:

Zócalo izquierdo, Manchado, Observada (1 %). Se puede concluir que el porcentaje de ocurrencia en la realidad es mínimo como está representado por el porcentaje de la explotación de los datos. En cuanto a los centroides que caracterizan a este periodo:

Capot, Rayado – Rozado, Observada (2 %). Panel trasero bajo baúl, Rayado – Rozado, Observada (3%). Llanta delantera izquierda, Abollado, Observada (18 %).

Page 224: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 223 de287 Ing. Hugo Daniel Flores

Se puede ver que las mismas son solo averías del tipo leve debido a que las mismas solo aparecen como observaciones. En el quinto periodo el daño con media global es: Guardabarro delantero derecho, Faltante. Este daño coincide con el daño de centroide de mayor ocurrencia de este periodo pero el mismo no aparece en la base de datos estudiada. Al igual que en los casos anteriores posiblemente su aparición solo se debe a cuestiones de cálculo matemático. Y para reforzar la conclusión también se debe mencionar que la mayor cantidad de tipos de avería para este periodo no es el Faltante sino el Abollado. En cuanto a los centroides que aparecen con posibilidad de ocurrencia baja en la realidad se encuentra:

Barras de techo, Rayado – Rozado, Observada (3 %). El 3 % indica cantidad de ocurrencia numerosa en relación a la cantidad verificada sobre la base de datos. Los centroides que caracterizan este periodo son:

Retrovisor externo izquierdo, Pintura saltada, Observada (4 %). Tapa tanque combustible, Rayado – Rozado, Observada (– 1 %).

Si bien no representan un porcentaje importante de ocurrencia son los únicos cuyo resultado en la verificación de datos tienen ocurrencia válida. Como en el periodo 5, en el periodo 6 la media global de daño ocurrido no encuentra validez cruzando los datos de la base de datos explotada: Zócalo derecho, Faltante. Este daño no tiene posibilidad de ocurrencia real. En cuanto a los centroides que caracterizan al periodo:

Capot, Rayado – Rozado, Observada (1 %). Panel trasero bajo baúl, Rayado – Rozado, Observada (1 %).

Estos dos centroides representan un porcentaje mínimo de ocurrencia en función de la cantidad de datos introducidos en el modelo. En el periodo 7 tampoco se encuentra correspondencia entre la media global y los datos explotados: Guardabarro delantero derecho, Faltante. En cuanto al centroide que caracteriza este periodo se ve:

Bolsa de herramientas, Arrancado - Roto – Fisurado, Observada (1 %). El porcentaje de ocurrencia es mínimo. El periodo 8 tiene como media global: Zócalo derecho, Faltante. Y al igual que en el periodo anterior este centroide no represente ocurrencia real en la base datos. En cuanto a los centroides representativo de este periodo:

Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada (2 %). Paragolpe trasero / Spoiler trasero, Rayado – Rozado, Observada (2 %). Luz de neblina trasera, Faltante, Observada (14 %).

El periodo 9 tiene como media global: Taza, Proyección. El centroide más importante no representa una avería real. El cluster representativo de este periodo es:

Guardabarros y parante trasero izquierdo, Rayado – Rozado, Observada (4 %).

Page 225: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 224 de287 Ing. Hugo Daniel Flores

Llanta trasera izquierda, Rayado – Rozado, Observada (1 %). Este representa un porcentaje mínimo de ocurrencia en la base de datos explotada. La media global que representa este periodo es: Zócalo derecho, Faltante. Tampoco es una combinación de daño válida y además no se corresponde con el tipo de avería más producido en este periodo. Los centroides que representan este periodo son más representativos y arrojan mayor probabilidad de ocurrencia que en los periodos anteriores:

Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada (2 %). Moldura protectora lateral izquierda, Rayado – Rozado, Observada (17 %).

Retrovisor externo derecho, Faltante (79 %). Para finalizar con el desarrollo de este punto del Clustering de daños considerando Parte + Tipo de Avería + Gravedad es difícil tomar como valores válidos factibles de dar algún tipo de información en relación al comportamiento de las averías debido específicamente a que la combinación de los parámetros que definen un daño es excluyente. Es decir que hay combinaciones de códigos de partes, averías y gravedades que en la realidad no se van a producir e inclusive en la práctica algunas veces son poco frecuentes y no justifican su estudio. El desarrollo del Clustering evaluando cada uno de los grupos separando por cada una de sus partes si resulta de validez para el modelo y si arroja resultados factibles de ser estudiados para determinar un comportamiento de los siniestros. En los puntos que continúan en el presente trabajo se seguirá evaluando la información suministrada por el agrupamiento de datos considerando los daños imputables a un modelo o a un determinado lugar, por lo tanto es viable la posibilidad que el agrupamiento de datos arroje resultados que permitan representar fehacientemente el comportamiento de los daños en las unidades automotrices. 8.5.2.5. Lugares, Partes y Tipos de Averías. Analizando el resultado del primer periodo podemos ver que la media global contemplando la gravedad de una avería y sin contemplarla arrojan como daño: Retiro de Puerto, Tapa acceso gancho remolque, Faltante. La gravedad de la media global es: Mediano. En cuanto a los resultados sin contemplar la gravedad de la avería podemos ver:

Subida Buque Puerto de Origen, Bolsa de herramientas, Faltante (87 %). Luego se puede visualizar el siguiente resultado:

Transferencia ubicación y línea de carga, Luz de neblina trasera, Exceso kilometraje (6 %). Transferencia ubicación y línea de carga, Luz de neblina trasera, Abollado (2 %).

Si bien tanto el lugar como la parte averiada suman un 8 % de ocurrencia, los porcentajes se dividen entre el 6 % y 2 % para diferentes tipos de averías. Finalmente se puede ver que los daños:

Ingreso a Puerto, Cubierta delantera derecha, Abollado (2 %). Ingreso a Puerto, Paragolpe delantero / Superior, Rayado – Rozado (1 %). Ingreso a Puerto, Techo corredizo, Faltante (1 %). Ingreso a Puerto, Luz trasera izquierda, Abollado (1 %).

El 5 % del total de averías ocurren en el ingreso a puerto, pero las partes se distribuyen en tres grupos 3 % de abolladuras, 1 % de rayados o rozados y 1 % de faltantes.

Page 226: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 225 de287 Ing. Hugo Daniel Flores

Si los datos procesados contemplan la gravedad de una avería los resultados cambian. Los daños que encabezan el mayor porcentaje de ocurrencias son: Subida Buque Puerto de Origen, Llave, Abollado, Leve (42 %).

Retiro de Puerto, Cristales de parante delantero, Abollado, Grave (20 %). Subida Buque Puerto de Origen, Cable de carga, Faltante, Mediano (12 %). Subida Buque Puerto de Origen, Guardabarro delantero izquierdo, Rayado – Rozado, Mediano (2 %).

Analizando estos datos se puede ver que las averías ocurren en un 56 % en la subida a buque. Pero los tipos de averías se dividen solo en tres, por un lado el 62 % de abolladuras, el 12 % son faltantes y por otro solo el 2 % corresponde a rayados o rozados. Y en cuanto a las partes no sucede lo mismo puesto que se dividen en 4 partes, el 42 % corresponden a llaves, el 20 % a los cristales de parante delantero, el 12 % se refiere a los cables de carga o bien en un 2 % a guardabarros delantero izquierdo. Finalmente se ve que los las gravedades varían en leves 42 %, graves 20 % y medianos en un 2 %. Luego se ve la siguiente distribución de ocurrencia de averías donde es considerada la gravedad:

Bajada de Buque, Tapizado interno puerta delantera izquierda, Rayado – Rozado, Mediano (12 %). Ingreso a Puerto, Moldura protectora lateral derecha, Rayado – Rozado, Leve (10 %).

Transferencia ubicación y línea de carga, Insignia, Faltante, Leve (2 %). Solo se puede hacer la observación referida a que solo participa de esta distribución dos tipos de averías por un lado el 22 % de rayados o rozados leves y por otro el 2 % de faltantes leves. El segundo periodo tiene menor cantidad de centroides. En cuanto a la media global también como en el periodo anterior con la participación y sin la participación de la severidad de los daños, la avería es la misma y en el mismo lugar: Retiro de Puerto, Tapa acceso gancho remolque, Faltante. Si se especifica la gravedad esta es media. Sin la consideración de los datos de gravedad se observa:

Subida Buque Puerto de Origen, Bolsa de herramientas, Faltante (92 %). Además el resultado en evaluación tiene coherencia entre la avería y la parte del auto involucrada. Para concluir con esta parte se pueden ver porcentajes mínimos en:

Transferencia ubicación y línea de carga, Otros, Abollado (3 %). Transferencia ubicación y línea de carga, Puerta delantera izquierda, Rayado – Rozado (1 %). Ingreso a Puerto, Techo corredizo, Rayado – Rozado (2 %). Ingreso a Puerto, Puerta trasera derecha, Rayado – Rozado (1 %).

Aquí se puede agrupar los lugares de averías en dos, el primero referido a la transferencia en línea de carga (4 %) y el segundo en el ingreso a puerto (3 %). Mientras que los tipos de averías son también son dos, rayados o rozados con un 4 % y los abollados con un 3 %. Las partes si están divididas en cuatro partes en función de los centroides definidos. Pasando a la evaluación de los resultados considerando la gravedad de las averías en los lugares en estudio se ve que produce una dispersión de los porcentajes de mayor ocurrencia: Bajada de Buque, Panel lateral izquierdo, Faltante, Leve (39 %). Bajada de Buque, Llanta delantera derecha, Abollado, Leve (33 %). El 72 % se produce en la bajada de un buque. En cuanto a los tipos de averías se observa faltantes con el 39 % y abollados con el 33 %. Y en relación a las partes involucradas se puede ver que ocurren en el panel lateral izquierdo y las llantas delanteras derechas. En los dos casos la gravedad es solo leve. Finalmente se ve que los porcentajes mínimos de ocurrencia de avería se producen según la siguiente distribución:

Page 227: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 226 de287 Ing. Hugo Daniel Flores

Bajada de Buque, Cristales de parante delantero, Faltante, Intolerable (5 %). Bajada de Buque, Llanta delantera derecha, Faltante, Grave (8 %). Retiro de Puerto, Guardabarro trasero derecho, Faltante, Grave (13 %). Ingreso a Puerto, Tapa posterior de techo, Pintura saltada, Mediano (2 %). Se observa que el 13 % ocurren en la bajada de un buque, un 13 % en el retiro de un puerto y solo un 2 % en ele ingreso a un puerto. En canto a los tipos de averías solo se presentan dos, los faltantes con el 26 % y un 2 % para pinturas saltadas. En referencia a las partes involucradas estás se distribuyen en cuatro en función de los centroides generados, un 13 % de guardabarros traseros derechas, un 8 % de llantas delanteras derechas, un 5 % de cristales de parantes delanteros y un 2 % de tapas posteriores de techo. Finalmente se observa que las gravedades encontradas se dividen en tres grupos, 21 % de graves, 5 % de intolerables y 2 % de medias. El tercer periodo se caracteriza por el daño global: Retiro de Puerto, Tapa acceso gancho remolque, Faltante. Y si se contempla la gravedad, esta es leve. El lugar más importante donde ocurren las averías sin considerar su gravedad es:

Transferencia ubicación y línea de carga, Bolsa de herramientas, Faltante (87 %). Luego en porcentajes mínimos se puede ver:

Ingreso a Puerto, Paragolpe trasero / Zona contacto, Rayado – Rozado (6 %). Ingreso a Puerto, Luz de neblina trasera, Abollado (3 %). Ingreso a Puerto, Barras de techo, Pintura saltada (1 %). Ingreso a Puerto, Guardabarro trasero derecho, Pintura saltada (1 %). Ingreso a Puerto, Luz de patente trasera, Rayado – Rozado (1 %).

Transferencia ubicación y línea de carga, Retrovisor externo izquierdo, Rayado – Rozado (1 %).

Se observa que el 12 % de averías se produce en el ingreso a un puerto y solo el 1 % a los lugares vinculados a la transferencia y línea de carga. En cuanto a las apartes afectadas se puede ver otra distribución entre los porcentajes mínimos, esto es: un 6 % para los paragolpes traseros, un 3 % para las luces de neblina trasera, un 1 % para las barras de techo al igual que los guardabarros traseros derechos, las luces de patente traseras y los retrovisores externos izquierdos. En cuanto a los tipos de averías se observa que el 8 % son rayados o rozados, el 3 % son abollados y solo un 1 % para pintura saltada. Analizado los datos considerando la gravedad de las averías se observa: Subida Buque Puerto de Origen, Otros, Faltante (78 %). Se ve que el mayor porcentaje de incidentes se realiza a la subida a un buque. Los porcentajes mínimos de ocurrencia se observan en: Ingreso a Puerto, Retrovisor externo derecho, Proyección (11 %).

Subida Buque Puerto de Origen, Giro Delantero (derecho / izquierdo), Faltante, Grave (9 %).

Ingreso a Puerto, Alfombra suplementarias, Proyección, Grave (1 %). Ingreso a Puerto, Luz de neblina trasera, Faltante, Grave (1 %). El 13 % ocurre al ingreso a un puerto mientras que un 9 % ocurre a la subida a un buque. En cuanto a las partes que intervienen se observa que el 11 % se produce en retrovisores externos derechos, un 9 % en giros delanteros derechos o izquierdos, un 1 % son sobre las alfombras suplementarias y un 1 % sobre las luces de neblina trasera. En relación a los tipos de averías se observa que el 12 % son de tipo proyección y un 10 % de faltantes. Finalmente se observa que las averías ocurridas son graves.

Page 228: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 227 de287 Ing. Hugo Daniel Flores

El cuarto periodo se caracteriza por averías global en retiro de puerto. Las partes que hacen a la media global son el guardabarros trasero derecho. En cuanto al tipo de avería de la media son los faltantes. La severidad de las averías de la media si es considerada es grave. Los porcentajes de averías si la consideración de la gravedad no es tenida en cuenta es la siguiente:

Retiro de Puerto, Puerta trasera derecha, Faltante (81) %) El mayor índice de siniestralidad no coincide con la media global solo en la parte dañada pero si en el lugar y el tipo de daño. Luego los porcentajes de siniestralidad bajan agrupándose de la siguiente manera:

Ingreso a Puerto, Capot, Rayado – Rozado (2 %). Subida Buque Puerto de Origen, Tapa posterior de techo, Rayado – Rozado (3 %). Retiro de Puerto, Taza, Faltante (6 %). Retiro de Puerto, Llanta delantera izquierda, Faltante (8 %).

El 3 % se producen en la subida al buque, el 2 % en el ingreso a puerto y el 14 % en el retiro de puerto. Las averías en los dos primero lugares son rayados y rozados y en retiro de puerto son faltantes. Y las partes de los autos involucradas se dividen en un 2 % capot, un 3 % a las tapas posteriores de techos, un 6 % a las tazas y 8 % a las llantas delanteras izquierdas. Si la gravedad es considerada el mayor porcentaje de ocurrencia es en: Bajada de Buque, Zócalo derecho, Faltante (60 %). Luego los porcentajes se agrupan de la siguiente forma: Subida Buque Puerto de Origen, Escape, Faltante, Observada (22 %). Ingreso a Puerto, Cubierta delantera derecha, Faltante (11 %). Ingreso a Puerto, Luz de neblina trasera, Proyección, Observada (4 %). Ingreso a Puerto, Capot, Rayado – Rozado, Observada (2 %). Ingreso a Puerto, Parabrisa, Faltante, Observada (1 %). El 22 % se produce en la subida a buque y el 18 % en el ingreso a puerto. En referencia a las partes se distribuyen en 11 % cubiertas delanteras derechas, 4 % luces de neblina traseras, 2 % en capot y el 1 % en parabrisas. En relación a los tipos de averías se dividen en faltantes con un 34 %, un 4 % proyecciones y un 2 % rayados o rozados. Y finalmente la severidad de las averías se distribuye en un 29 % de solo observaciones y 11 % graves. La media global para el quinto periodo se define en: Retiro de Puerto, Guardabarro delantero derecho, Faltante. La severidad es grave si es considerada. Si no se considera la gravedad de las averías la ocurrencia de los siniestros se desarrolla de la siguiente manera: Retiro de Puerto, Cristales de parante delantero, Faltante (66 %). Luego el porcentaje baja y se distribuye como sigue:

Retiro Fábrica de Origen, Paragolpe trasero / Spoiler trasero, Rayado – Rozado (26 %).

Bajada de Buque, Antena, Proyección (5 %). Bajada de Buque, Paragolpe delantero / Protector delantero, Rayado - Rozado (2 %). Bajada de Buque, Paragolpe delantero / Superior, Rayado – Rozado (1 %). Subida Buque Puerto de Origen, Paragolpe delantero / Protector delantero Rayado – Rozado (1 %). En retiro de fábrica se produce el 26 % de las averías de este periodo, en bajada de buque el 8 % y el 1 % en subida a buque. Luego analizando los resultados de las partes se ve que el paragolpe delantero o protector delantero tiene un 3 %, antenas un 5 % y el 26 % los paragolpes traseros o

Page 229: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 228 de287 Ing. Hugo Daniel Flores

spoilers traseros. En cuanto a las averías estás se caracterizan por rayado o rozado 30 % y el 5 % proyecciones. Considerando la gravedad de las averías se observa que el mayor porcentaje de siniestralidad de este periodo es:

Subida Buque Puerto de Origen, Guardabarro delantero derecho, Faltante (76 %). Luego los menores porcentajes se definen en los siguientes centroides: Ingreso a Puerto, Llanta delantera derecha, Proyección, Observada (6 %). Bajada de Buque, Zócalo derecho, Faltante, Observada (4 %). Ingreso a Puerto, Llanta delantera izquierda, Proyección (3 %). Ingreso a Puerto, Techo (inclusive convertible), Rayado – Rozado (2 %). Ingreso a Puerto, Otros, Abollado (5 %). Ingreso a Puerto, Techo (inclusive convertible), Pintura saltada (4 %). En ingreso a puerto se produce el 20 % y el 4 % en la bajada de buque. En referencia a los tipos de averías se subdividen en 9 % proyecciones, faltantes 4 %, rayados o rozados 2 %, un 5 % de abollados y el 4 % pinturas saltadas. Observando las partes afectadas éstas se dividen en llantas delanteras derechas el 6 %, llanta delanteras izquierdas 3 %, zócalos derechos 4 %, techos (inclusive convertibles) 2 % y otros el 5 %. Finalmente se observa que el 10 % son solo observaciones y el 14 % A continuación se realiza la evaluación de los datos explotados para el periodo seis. Se puede ver que la media global está constituida por:

Retiro de Puerto, Zócalo derecho, Faltante. Y si la severidad es considerada esta es grave. Analizados los datos del periodo seis sin la consideración de la gravedad de las averías se observa como ocurrencia predominante:

Subida Buque Puerto de Origen, Guardabarro trasero derecho, Faltante (79 %). El lugar especificado y el daño no coincide con la media global salvo en el tipo de avería que es Faltante. En cuanto a los porcentajes de ocurrencia menor esos se distribuyen de la siguiente manera:

Ingreso a Puerto, Tapa acceso gancho remolque, Faltante (12 %). Ingreso a Puerto, Zócalo interno puerta delantera izquierda, Rayado – Rozado (3 %). Ingreso a Puerto, Paragolpe delantero / Protector delantero, Rayado – Rozado (2 %). Transferencia ubicación y línea de carga, Spoiler delantero, Rayado – Rozado (1 %). Transferencia ubicación y línea de carga, Paragolpe delantero / Protector delantero, Rayado – Rozado (1 %). Transferencia ubicación y línea de carga, Llave, Abollado (1 %).

Se observa que el 15 % de las averías se producen en el ingreso a un puerto. Las partes intervinientes son las tapas de acceso a gancho de remolque con un 12 %, luego los zócalos internos de puerta delantera izquierda con el 3 %, el paragolpe delantero o protector delantero con un 3 %, el spoiler delantero con el 1 % al igual que las llaves con el 1 %. Luego se observa que las averías se distribuyen en: un 7 % de rayados o rozados, un 12 % de faltantes y solo un 1 % de abollados. Pasando al caso donde las severidades son consideradas se observa lo siguiente:

Bajada de Buque, Zócalo derecho, Faltante (88 %). El mayor porcentaje de ocurrencia tampoco coincide con la media global del periodo salvo en el tipo de averías que es Faltante. Luego en porcentajes inferiores se observa:

Bajada de Buque, Tapa acceso gancho remolque, Abollado, Observada (7 %). Bajada de Buque, Moldura protectora lateral derecha, Faltante, Observada (3 %). Ingreso a Puerto, Tapa posterior de techo, Rayado – Rozado, Observada (1 %).

Page 230: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 229 de287 Ing. Hugo Daniel Flores

Transferencia ubicación y línea de carga, Puerta trasera izquierda, Abollado, Observada (1 %).

Los daños ocurren en un 10 % a la bajada del buque, en un 1 % en el ingreso al puerto y al igual que en la transferencia de ubicación y línea de carga. En referencia a los tipos de averías se observa que el 8 % son abollados, el 3 % faltantes y el 1 % rayados o rozados. En cuanto a las partes observadas se ve que el 7 % pertenece a las tapas de acceso a gancho de remolque, el 3 % a moldura protectora lateral derecha, y el 1 % para tapa posterior de techo al igual que la puerta trasera izquierda. Finalmente se observa que la severidad de la avería es solamente observable en todos los casos (12 %). La media global del séptimo periodo está caracterizada por los daños:

Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante. Si la gravedad es considerada entonces esta es grave. Observando los resultados del procesamiento sin considerar la gravedad de los daños se puede ver que hay una distribución homogénea de los centroides. Esto es:

Ingreso a Puerto, Parabrisa, Proyección (33 %). Bajada de Buque, Guardabarro delantero izquierdo, Abollado (18 %). Ingreso a Puerto, Faro de stop luneta, Abollado (18 %). Ingreso a Puerto, Llave, Rayado – Rozado (16 %).

Bajada de Buque, Manijas externas de puertas traseras, Proyección (12 %). Bajada de Buque, Paragolpe delantero / Protector delantero, Rayado – Rozado (2 %).

Las averías son producidas en un 67 % en el ingreso a puerto y el 32 % en la bajada de buque. En referencia a las partes afectadas se divide en: un 33 % de parabrisas, 18 % guardabarros delanteros izquierdos al igual que los faros de stop de luneta, el 17 % de llaves, el 12 % de manijas externas de puertas traseras y el 2 % de paragolpes delanteros o protectores delanteros. Finalmente los tipos de averías son de proyección en un 45 %, un 36 % de abollados y el 18 de rayados o rozados. Luego analizando los resultados del proceso contemplando la severidad de las averías el resultado es:

Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante (86 %).

En esta parte si el resultado muestra un mayor predominio en un centroide con casi un 90 % de ocurrencia. Además se observa que tanto el lugar como la avería coinciden con la media global. Luego los centroides se dividen en menor porcentaje de la siguiente manera:

Ingreso a Puerto, Guardabarro delantero derecho, Faltante, Observada (10 %). Bajada de Buque, Parrilla delantera, Abollado, Observada (3 %). Bajada de Buque, Panel trasero bajo baúl, Rayado – Rozado, Observada (1 %). Bajada de Buque, Alfombra suplementarias, Proyección, Observada (1 %).

Los lugares de ocurrencia se mantienen como en el ítem anterior. El 10 % suceden en el ingreso al puerto y el 5 % en la bajada de buque. En cuanto a las partes que intervienen se observa el 10 % son guardabarros delanteros derechos, el 3 % en parrillas delanteras, y el 1 % tanto para los paneles traseros bajo baúl como para alfombras suplementarias. En referencia al tipo de averías estas se subdividen en 10 % de faltantes, 3 % de abollados, y 1 % de rayados y rozados al igual que proyecciones. Finalmente se ve que la gravedad de las averías son solo observadas (15 %). El octavo periodo es caracterizado por la media global:

Transferencia ubicación y línea de carga, Guardabarro delantero derecho, Faltante. Esta es la misma que para el periodo anterior tanto en el lugar de ocurrencia como el tipo de avería y la gravedad de la misma.

Page 231: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 230 de287 Ing. Hugo Daniel Flores

Luego si se analiza detalladamente la distribución de las averías sin considerar la gravedad del mismo se observa una distribución pareja entre los diferentes centroides generados. Esto es:

Bajada de Buque, Moldura protectora lateral derecha, Faltante (30 %). Transferencia ubicación y línea de carga, Manual, Faltante (24 %). Ingreso a Puerto, Puerta trasera izquierda, Proyección (20 %). Transferencia ubicación y línea de carga, Techo (inclusive convertible), Rayado – Rozado (17 %). Transferencia ubicación y línea de carga, Guardabarro trasero derecho, Pintura saltada (10 %).

Los lugares de ocurrencia se distribuyen entre un 30 % en la bajada de buque, el 51 % en la transferencia de ubicación de línea de carga y el 20 en el ingreso a puerto. En referencia a las partes averiadas se observa el 30 % en moldura protectora lateral derecha, el 24 % de manuales, el 20 de puertas traseras izquierdas, el 17 % techos (inclusive convertibles) y el 10 % de guardabarros traseros derechos. En relación a los tipos de averías se observa que el 54 % son faltantes, el 20 % son proyecciones, el 17 % de rayados y rozados y el 10 de pinturas saltadas. Analizando los datos considerando la gravedad de las averías se observa que, al igual que en el periodo anterior, se centralizan en un centroide. Esto es:

Transferencia ubicación y línea de carga, Zócalo derecho, Faltante (78 %). Donde la misma coincide con la media global en el lugar, el tipo de avería y la gravedad. Luego se observa que:

Subida Buque Puerto de Origen, Panel lateral derecho, Abollado, Observada (12 %). Transferencia ubicación y línea de carga, Tapizado interno puerta delantera izquierda, Rayado – Rozado, Observada (5 %). Ingreso a Puerto, Zócalo izquierdo, Abollado, Observada (2 %). Transferencia ubicación y línea de carga, Puerta trasera izquierda, Rayado – Rozado, Observada (2 %).

Los lugares se distribuyen en el 12 % en subida a buque, el 7 % en transferencia ubicación y línea de carga, y el 2 % en el ingreso a puerto. Las partes afectadas se subdividen en 12 % de paneles laterales derechos, 5 % de tapizados internos de puertas delanteras izquierdas, 2 % en zócalos izquierdos y el 2 % en puertas traseras izquierdas. En referencia a los tipos de averías son el 14 % de abollados y el 7 % de rayados y rozados. Por último la severidad es grave. El penúltimo periodo en estudio se caracteriza por la media de ocurrencia global:

Transferencia ubicación y línea de carga, Taza, Proyección. Con gravedad si es tenida en cuenta, grave. Si la gravedad no es considerada el centroide más importante es:

Ingreso a Puerto, Manijas externas de puertas delanteras, Proyección (62 %). Luego se dividen de la siguiente forma:

Transferencia ubicación y línea de carga, Faro de stop luneta, Rayado – Rozado (23 %). Bajada de Buque, Tapa acceso gancho remolque, Abollado (10 %). Bajada de Buque, Barras de techo, Abollado (3 %). Bajada de Buque, Capot, Rayado – Rozado (1 %). Bajada de Buque, Zócalo interno puerta delantera izquierda, Rayado – Rozado (1 %).

El 23 % se produce en la transferencia ubicación y línea de carga y el 15 % en la bajada de buque. Las partes afectadas son: un 23 % de faros de stop de lunetas, 10 % tapas de ganchos de remolque, 3 % barras de techos, 1 % en capot y zócalo interno de puertas delanteras izquierdas. Mientras que el tipo de avería es 25 % de rayados o rozados y el 13 % de abollados. Si la gravedad del daño es considerada entonces el centroide más importante es:

Page 232: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 231 de287 Ing. Hugo Daniel Flores

Transferencia ubicación y línea de carga, Limpiador y lavador de parabrisas, Proyección (79 %).

No coincide totalmente con la media global. Luego los porcentajes mínimos ocurren de la siguiente forma:

Subida Buque Puerto de Origen, Limpiador y lavador de parabrisas, Abollado, Observada (5 %). Transferencia ubicación y línea de carga, Tapa tanque combustible, Rayado – Rozado, Observada (5 %). Ingreso a Puerto, Tapizado interno puerta delantera izquierda, Proyección, Observada (5 %). Transferencia ubicación y línea de carga, Zócalo derecho, Rayado – Rozado, Observada (2 %). Transferencia ubicación y línea de carga, Llanta trasera izquierda, Rayado – Rozado, Observada (1 %). Ingreso a Puerto, Escape, Rayado – Rozado, Observada (1 %). Subida Buque Puerto de Origen, Puerta delantera izquierda, Abollado, Observada (1 %).

El 6 % se observa en la subida a buque de puerto de origen, luego el 8 % en la transferencia ubicación y línea de carga, el 6 % en el ingreso a puerto. Las partes que intervienen son: el 5 % el limpiador y lavador de parabrisas, el 5 % de tapas de tanque de combustible, el 5 % de tapizado interno de la puerta delantera izquierda, el 2 % del zócalo derecho, el 1 % de las llantas traseras izquierdas, el 1 % del escape y el 1 % puertas delanteras izquierdas. Luego el tipo de avería se divide en un 6 % de abollados, 9 % rayados o rozados y 5 % de proyecciones. El último periodo se caracteriza por la media: Transferencia ubicación y línea de carga, Zócalo derecho, Faltante. Con el tipo de severidad grave si es considerada. Si no se considera la severidad entonces el centroide de mayor peso es:

Transferencia ubicación y línea de carga, Giro Delantero (derecho / izquierdo), Faltante (61 %).

Luego baja de forma considerable y se distribuye de la siguiente forma: Bajada de Buque, Panel lateral derecho, Faltante (17 %). Transferencia ubicación y línea de carga, Tapa posterior de techo, Rayado – Rozado (14 %). Transferencia ubicación y línea de carga, Paragolpe delantero / Protector delantero, Rayado – Rozado (4 %). Transferencia ubicación y línea de carga, Manijas externas de puertas traseras, Reventado – Estallado (4 %). Transferencia ubicación y línea de carga, Llanta trasera izquierda, Rayado – Rozado (1 %).

El 17 % se producen en la bajada del buque y el 23 % en transferencia ubicación y línea de carga. Las partes afectadas son: 17 % de paneles laterales derechos, 14 % de tapa posterior de techo, 4 % de paragolpe delantero y protector delantero, 4 % de manijas externas de puertas traseras y el 1 % de llantas traseras izquierdas. Lo tipos de averías son: 19 % de rayados o rozados y el 4 % de estallados. Si los datos de la gravedad de las averías son considerados entonces la ocurrencia de los daños es la siguiente. El máximo porcentaje está centralizado en

Transferencia ubicación y línea de carga, Retrovisor externo derecho, Faltante: (79 %).

Como en el punto anterior no coincide con la media global.

Page 233: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 232 de287 Ing. Hugo Daniel Flores

Luego los porcentajes se reducen y queda conformado de la siguiente manera: Transferencia ubicación y línea de carga, Llanta delantera izquierda, Rayado – Rozado, Observada (8 %). Ingreso a Puerto, Paragolpe trasero / Spoiler trasero, Rayado – Rozado, Observada (5 %). Ingreso a Puerto, Encendedor, Manchado, Observada (5 %). Bajada de Buque, Moldura protectora lateral derecha, Abollado, Observada (2 %). Ingreso a Puerto, Giro Delantero (derecho / izquierdo), Pintura saltada, Observada (1 %).

El 8 % ocurre en la transferencia de ubicación y línea de carga, el 11 % en el ingreso a puerto y el 2 % en la bajada de buque. Las partes afectadas se dividen en 8 % llanta delantera izquierda, 5 % de paragolpes traseros o spoilers traseros, 5 % de encendedores, 2 % de molduras protectoras laterales derechas, y 1 % giro delantero (derecho o izquierdo). Los tipos de averías son rayados o rozados 13 %, manchados 5 %, abollados 2 % y pintura saltada un 1 %. 8.5.2.6. Modelos, Partes y Tipos de Averías. A continuación se realiza una evaluación de los resultados vinculados con la ocurrencia de averías en los modelos de autos en estudio. Se contemplan como en el ítem anterior el análisis de daños con consideración de la severidad y sin la consideración de ella. El primer periodo tiene como media global: Modelo 12, Tapa acceso gancho remolque, Faltante. Y si la gravedad es considerada esta es mediana. Luego se observa la siguiente distribución de los centroides formados:

Modelo 10, Manual, Abollado (25 %). Modelo 10, Panel lateral izquierdo, Abollado (22 %). Modelo 18, Cubierta delantera derecha, Rayado – Rozado (18 %). Modelo 17, Cubierta delantera izquierda, Abollado (14 %). Modelo 4, Moldura protectora lateral derecha, Faltante (13 %). Modelo 9, Cerraduras de puertas, Rayado – Rozado (6 %). Modelo 10, Giro Delantero (derecho / izquierdo), Rayado – Rozado (2 %).

El modelos 10 tiene el 49 % de participación entre los daños detectados, luego el modelo 18 tiene el 18 %, el modelo 17 con un 14 %, el modelo 4 con un 13 % y finalmente el modelo 9 con solo un 6 %. En referencia a las partes que intervienen estas se subdividen en: 25 % manual, 22 % panel lateral izquierdo, 18 % cubierta delantera derecha, 14 % cubierta delantera izquierda, 13 % en moldura protectora lateral derecha, 6 % en cerraduras de puertas, y el 6 % en giros delanteros (derechos o izquierdos). Finalmente el tipo de avería se divide en: 61 % de abollados, 26 % rayados y rozados y el 13 % de faltantes. La producción de averías considerando la gravedad tiene el siguiente el siguiente comportamiento:

Modelo 11, Luz de neblina trasera, Faltante, Leve (59 %). Modelo 15, Puerta trasera derecha, Faltante, Grave (16 %). Modelo 5, Giro Delantero (derecho / izquierdo), Faltante, Intolerable (8 %). Modelo 17, Panel lateral derecho, Rayado – Rozado, Mediano (6 %). Modelo 16, Bolsa de herramientas, Abollado, Mediano (5 %). Modelo 9, Manijas externas de puertas traseras, Rayado – Rozado, Mediano (3 %). Modelo 18, Paragolpe trasero / Spoiler trasero, Faltante, Mediano (2 %). Modelo 14, Retrovisor externo derecho, Pintura saltada, Mediano (1 %).

El modelo 11 tiene el 59 % de participación, el modelo 15 le sigue con un 16 %, luego se observa el modelo 5 con el 8 %, el modelo 17 con el 6 %, el modelo 16 con el 5 %, el modelo 9 con el 3 %, el

Page 234: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 233 de287 Ing. Hugo Daniel Flores

modelo 18 con el 2 % y al final el modelo 14 con un 1 %. Las partes afectadas son: 59 % luces de neblinas traseras, puertas traseras derechas con el 16 %, los giros delanteros (derechos o izquierdos) con el 8 %, el panel lateral derecho con el 6 %, bolsas de herramientas con un 5 %, manijas externas de puertas traseras con el 3 %, el 2 para los paragolpes traseros o spoilers traseros y el 1 % para los retrovisores externos derechos. En cuanto a los tipos de averías estos se subdividen en: faltantes con el 85 %, 9 % los rayados o rozados, abollados el 5 % y pintura saltada el 1 %. Luego la severidad tiene el siguiente comportamiento: el 59 % con leves, 16 % graves, intolerables 8 %, y finalmente medianos 12 %. El segundo periodo se caracteriza por la combinación: Modelo 14, Tapa acceso gancho remolque, Faltante. Y cuando la severidad es considerada esta es media. Luego los centroides quedan conformados de la siguiente manera:

Modelo 10, Guardabarro delantero izquierdo, Abollado (34 %). Modelo 17, Aerosol antipinchazos, Proyección (20 %). Modelo 17, Alfombra baúl / caja de carga, Faltante (14 %). Modelo 17, Puerta delantera derecha, Abollado (12 %). Modelo 17, Cubierta delantera izquierda, Rayado – Rozado (8 %). Modelo 8, Panel lateral izquierdo, Rayado – Rozado (5 %). Modelo 6, Limpiador y lavador de parabrisas, Abollado (4 %). Modelo 7, Zócalo interno puerta delantera izquierda, Rayado – Rozado (3 %).

El modelo 10 participa con el 34 %, el modelo 17 tiene el 54 % de las averías, el modelo 8 con el 5 %, el modelo 6 con el 4 % y el modelo 7 con el 3 %. Luego las partes involucradas son: guardabarros delanteros izquierdos con el 34 %, aerosol antipinchazos 20 %, alfombra baúl o caja de carga con el 14 %, puerta delantera derecha con el 12 %, cubierta delantera izquierda con el 8 %, panel lateral izquierdo el 5 %, limpiador y lavador de parabrisas con el 4 % y al final zócalo interno de puerta delantera izquierda con el 3 %. En cuanto a los tipos de averías se dividen de la siguiente forma: abollados 50 %, proyección el 20 %, faltantes el 14 % y rayados o rozados con el 16 %. Luego con la consideración de las gravedades los daños se distribuyen del siguiente modo:

Modelo 13, Puerta delantera izquierda, Faltante, Leve (47 %). Modelo 17, Alerón, Faltante, Mediano (22 %). Modelo 16, Guardabarro trasero derecho, Faltante, Grave (16 %). Modelo 8, Giro Delantero (derecho / izquierdo), Faltante, Mediano (7 %). Modelo 8, Cristales de parante delantero, Faltante, Grave (5 %). Modelo 10, Barras de techo, Proyección, Mediano (2 %).

El modelo 13 con el 47 % de ocurrencia, luego el modelo 17 con el 22 %, el modelo 16 el 16 %, el modelo 8 con el 12 % y finalmente el modelo 10 con el 2 %. Los tipos de averías se subdividen en: faltantes 97 % y proyección con el 2 %. Las partes se subdividen en: 47 % de puertas delanteras izquierdas, 22 % de alerones, con el 16 % guardabarros traseros derechos, el 7 % de giros delanteros (derecho o izquierdo), el 5 % de cristales de parante delantero y el 2 % de barras de techo. Finalmente la severidad de las averías se distribuye en: 47 % leves, 31 % medios y graves 21 %. La media global del tercer periodo es: Modelo 15, Tapa acceso gancho remolque, Faltante. Y la severidad de la avería es leve si es considerada en el procesamiento. Luego los centroides arrojan la siguiente información:

Modelo 9, Giro Delantero (derecho / izquierdo), Abollado (28 %). Modelo 17, Cubierta delantera izquierda, Faltante (22 %). Modelo 17, Guardabarro trasero derecho, Abollado (17 %).

Page 235: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 234 de287 Ing. Hugo Daniel Flores

Modelo 18, Limpiador y lavador de parabrisas, Proyección (14 %). Modelo 17, Llave de rueda, Faltante (11 %). Modelo 17, Tapa posterior de techo, Faltante (6 %). Modelo 13, Puerta trasera izquierda, Abollado (2 %).

El modelo 9 ocurre en un 28 %, el modelo 17 el 56 %, el modelo 18 ocurre en un 14 % y las avería en el modelo 13 se producen en un 2 %. Luego se observa que el comportamiento de las parte se distribuye de la siguiente manera: 28 % en giros delanteros (derechos o izquierdos), 22 % en cubierta delantera izquierda, el 17 % en guardabarros traseros derechos, el 14 % en limpiador y lavador de parabrisas, 11 % en llaves de ruedas, el 6 % en tapa posterior de techo y el 2 % en puertas traseras izquierdas. Finalmente se observa que el 47 % son tipos de averías abollados, el 37 % de faltantes y el 14 % de proyecciones. Considerando las severidades de las averías se observa el siguiente comportamiento:

Modelo 15, Tapa acceso gancho remolque, Faltante (89 %). En casi un 90 % de ocurrencia el modelo 15 es el más afectado. Y coincide ciento por ciento con la media global. Luego los porcentajes mínimos quedan distribuidos de la siguiente forma:

Modelo 17, Manual, Faltante, Grave (5 %). Modelo 10, Faro de stop luneta, Abollado, Grave (3 %). Modelo 4, Retrovisor externo derecho, Faltante, Grave (1 %). Modelo 17, Puerta trasera izquierda, Faltante, Grave (1 %).

6 % modelo 17, modelo 10 el 3 % y el modelo 4 el 1 %. Luego se observa que las partes afectadas son: manuales el 5 %, faros de stop de luneta el 3 %, 1 % de retrovisor externo derecho y también el mismo porcentaje para las puertas traseras izquierdas. Luego se observa que el 7 % son faltantes y el 3 % abollados. Finalmente el tipo de avería entre los porcentajes mínimos es siempre grave. El cuarto periodo está caracterizado por el centroide. Modelo 15, Guardabarro trasero derecho, Faltante. Con severidad grave si es considerada. Luego sin la consideración de la gravedad de averías los centroides dan la siguiente información:

Modelo 18, Panel trasero bajo baúl, Rayado – Rozado (32 %). Modelo 8, Llanta delantera izquierda, Abollado (21 %). Modelo 18, Escape, Proyección (15 %). Modelo 17, Guardabarro delantero izquierdo, Pintura saltada (14 %). Modelo 6, Limpiador de Faros (derecho / izquierdo), Proyección (10 %). Modelo 17, Separador interno de carga, Proyección (6 %). Modelo 17, Llanta delantera derecha, Pintura saltada (2 %). Modelo 9, Parante delantero, Rayado – Rozado (1 %).

El 47 % corresponde al modelo 18, el modelo 8 el 21 %, el modelo 17 con el 22 %, el modelo 6 con el 10 % y el modelo 9 con el 1 %. Las partes se subdividen en: 32 % el panel trasero bajo baúl, el 21 % las llantas delanteras izquierdas, el 15 % de escapes, el 14 % de guardabarros delanteros izquierdos, el 10 % limpiador de faros, el 6 % separador interno de carga, el 2 % de llanta delantera derecha y el 1 % en los parantes delanteros. Luego se observa que los tipos de averías se distribuyen de la siguiente forma: rayados o rozados 33 %, abollados con el 21 %, proyecciones con el 21 % y pinturas saltadas con el 16 %. Pasando a los resultados obtenidos con la consideración de la gravedad del daño se observa que el mayor índice de ocurrencia es:

Modelo 15, Zócalo derecho, Faltante (71 %). Luego los porcentajes bajan de forma importante y quedan distribuidos de la siguiente forma:

Modelo 18, Alfombra suplementarias, Faltante, Observada (13 %). Modelo 8, Tapa acceso gancho remolque, Abollado, Observada (10 %).

Page 236: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 235 de287 Ing. Hugo Daniel Flores

Modelo 18, Luz de patente trasera, Proyección, Observada (4 %). Modelo 9, Zócalo derecho, Manchado, Observada (2 %). Modelo 16, Batería, Rayado – Rozado, Observada (1 %).

El modelo 18 con el 17 %, luego el modelo 8 con el 10 %, el modelo 9 con el 2 % y al final el modelo 16 con el 1 %. Las partes que intervienen se dividen en: 13 % alfombras suplementarias, 10 % tapas de acceso gancho de remolque, 4 $ de luz de patente trasera, 2 % de zócalos derechos y 1 % en baterías. Los tipos de averías observados son: faltantes el 13 %, abollados con el 10 %, proyecciones con el 4 %, manchados con el 2 % y rayados o rozados con el 1 %. En todos los casos las averías son solo observables. El quinto periodo está caracterizado por la media global:

Modelo 13, Guardabarro delantero derecho, Faltante. Donde cuando se considera la severidad esta es grave. Luego pasando a la evaluación de los resultados si la consideración de la gravedad de los daños se observa:

Modelo 17, Tapa de Baúl o Puerta Trasera, Rayado – Rozado (34 %). Modelo 7, Tapa acceso gancho remolque, Abollado (33 %). Modelo 17, Faro de stop luneta, Abollado (17 %). Modelo 18, Guardabarros y parante trasero izquierdo, Rayado – Rozado (7 %). Modelo 6, Paragolpe trasero / Zona contacto, Rayado – Rozado (7 %). Modelo 9, Paragolpe delantero / Superior, Rayado – Rozado (2 %). Modelo 13, Techo (inclusive convertible), Abollado (1 %).

El 51 % de ocurrencias en el modelo 17, el 33 % en el modelo 7, luego el modelo 18 con el 7 %, el modelo 6 con el 7 %, el modelo 9 con el 2 % y el modelo 13 con el 1 %. Las partes se agrupan en los siguientes porcentajes según lo descrito en la lista previa. Los tipos de averías se subdividen en: rayados o rozados el 50 % y abollados el 51 %. Luego los datos a avaluar considerando la gravedad de los daños ocurre con el mayor porcentaje en:

Modelo 13, Guardabarro delantero derecho, Faltante (89 %). Luego los porcentajes se reducen a los siguientes centroides:

Modelo 6, Taza, Proyección, Observada (4 %). Modelo 18, Llave, Abollado, Observada (3 %). Modelo 19, Tapizado interno puerta delantera izquierda, Rayado – Rozado, Observada (1 %). Modelo 8, Guardabarro delantero izquierdo, Abollado, Observada (1 %).

Donde le modelo 6 aparece en un 4 %, el modelo 18 en el 4 %, el modelo 19 en el 1 % al igual que el modelo 8. Los tipos de averías se dividen en: 4 % proyecciones, 4 % abollados y 1 % en rayados o rozados. Las partes se distribuyen en: 4 % tazas, 3 % llaves, 3 % tapizados internos de puerta delanteras izquierdas y 1 % en guardabarros delanteros izquierdos. Finalmente se debe mencionar que en todos los casos las averías son solo observaciones.

El periodo seis tiene como media global: Modelo 13, Zócalo derecho, Faltante. Si se considera la severidad esta es grave. Los porcentajes de ocurrencia en los centroides se dividen en:

Modelo 7, Escape, Faltante (45 %). Modelo 17, Panel trasero bajo baúl, Rayado – Rozado (24 %). Modelo 18, Giro Delantero (derecho / izquierdo), Abollado (15 %). Modelo 16, Guardabarros y parante trasero izquierdo, Abollado (8 %). Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado (3 %). Modelo 17, Otros, Rayado – Rozado (3 %).

Page 237: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 236 de287 Ing. Hugo Daniel Flores

Modelo 13, Barras de techo, Abollado (1 %). El modelo 7 con el 45 %, el modelo 17 con el 27 %, el modelo 18 con el 15 %, el modelo 16 con el 8 %, el modelo 20 con el 3 % y el modelo 13 con el 1 %. Luego las partes que intervienen se subdividen de la forma descrita en el listado anterior. En cuanto a loas tipos de averías estas se distribuyen de la siguiente forma: faltantes el 45 %, rayados o rozados el 27 % y abollados el 24 %. Los resultados del proceso considerando la gravedad de las averías se distribuyen como sigue:

Modelo 13, Zócalo derecho, Faltante (88 %). El mayor porcentaje de ocurrencia es el modelo 13. Luego se distribuye en forma mínima entre los siguientes centroides:

Modelo 7, Bolsa de herramientas, Faltante, Observada (7 %). Modelo 19, Bolsa de herramientas, Proyección, Observada (2 %). Modelo 16, Parrilla delantera, Pintura saltada, Observada (2 %). Modelo 20, Spoiler delantero, Rayado – Rozado, Observada (1 %). Modelo 19, Paragolpe trasero / Spoiler trasero, Proyección, Observada (1 %).

El modelo 7 con el 7 %, el modelo 19 con un 3 %, el modelo 16 con un 2 % y el modelo 20 con el 1 %. Luego las partes se distribuyen en: un 9 % bolsas de herramientas, el 2 % en parrilla delantera, el 1 % en spoilers delanteros y el 1 % para los paragolpes traseros o spoilers traseros. Los tipos de averías observados son: el 7 % de faltantes, proyección el 3 %, pinturas saltadas en un 2 % y un 1 % para rayados o rozados. Finalmente se debe mencionar que la severidad de las averías mínimas es solo observación. Los resultados del periodo siete tienen como media global: General: Modelo 15, Guardabarro delantero derecho, Faltante. Y cuando la gravedad es considerada esta es grave. Si no se considera la gravedad de las averías la distribución es la siguiente:

Modelo 6, Puerta delantera derecha, Faltante (33 %). Modelo 20, Barras de techo, Proyección (27 %). Modelo 19, Retrovisor externo izquierdo, Abollado (21 %). Modelo 20, Parrilla delantera, Rayado – Rozado (10 %). Modelo 18, Retrovisor externo derecho, Reventado – Estallado (4 %). Modelo 11, Barras de techo, Proyección (3 %). Modelo 13, Llanta delantera derecha, Abollado (1 %).

Donde el modelo 6 tiene el 33 % de participación, el modelo 20 el 37 %, el modelo 19 el 21 %, el modelo 18 con el 4 %, el modelo 11 con el 3 % y modelo 13 con el 1 %. Luego las partes son distribuidas de la siguiente forma: 33 % de puerta delantera derecha, 30 % de barras de techo, 21 % de retrovisor externo izquierdo, 10 % de parrilla delantera, 4 % de retrovisor externo derecho y 1 % de llanta delantera derecha. Finalmente los tipos de averías se distribuyen de la siguiente manera: 33 % de faltantes, 30 % de proyecciones, 22 % de abollados, 10 % de rayados o rozados y el 4 % de reventado o estallado. Sin considerar las severidades el mayor porcentaje de averías es:

Modelo 15, Guardabarro delantero derecho, Faltante (86 %). Luego los porcentajes mínimos de ocurrencia son:

Modelo 19, Retrovisor externo derecho, Faltante, Observada (9 %). Modelo 7, Zócalo izquierdo, Abollado, Observada (2 %). Modelo 6, Manijas externas de puertas traseras, Proyección, Observada (2 %). Modelo 5, Zócalo izquierdo, Rayado – Rozado, Observada (1 %). Modelo 8, Retrovisor externo derecho, Pintura saltada, Observada (1 %).

El modelo 19 con el 9 %, el 7 % con el 2 % al igual que el modelo 6, el modelo 5 y el modelo 8 con el 1 %. Las partes averiadas tienen los siguientes porcentajes: 10 % retrovisor externo derecho, 3 %

Page 238: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 237 de287 Ing. Hugo Daniel Flores

zócalo izquierdo y 2 % de manijas externas de puertas traseras. Los tipos de averías que participan son: 9 % faltantes, abollados 2 %, proyecciones 2 %, rayados o rozados 1 % al igual que pintura saltada. Finalmente el tipo de severidad es observado. El periodo ocho tiene como media global: Modelo 14, Zócalo derecho, Faltante. Con severidad grave. En referencia a los resultados sin considerar la gravedad de la misma se divide de a siguiente forma:

Modelo 20, Limpiador y lavador de parabrisas, Proyección (37 %). Modelo 7, Parrilla delantera, Faltante (24 %). Modelo 19, Zócalo izquierdo, Abollado (15 %). Modelo 5, Manijas externas de puertas traseras, Proyección (10 %). Modelo 13, Guardabarro delantero izquierdo, Abollado (7 %). Modelo 5, Capot, Rayado – Rozado (3 %). Modelo 14, Techo corredizo, Faltante (3 %).

El 37 % para el modelo 20, el 24 % el modelo 7, el modelo 19 con el 15 %, el modelo 5 el 13 %, el modelo 13 el 7 % y el modelo 14 con el 3 %. Las partes se subdividen según los porcentajes es pacificados en el listado previo. En cuanto a los tipos de avería se puede observar: el 47 % son proyecciones, el 27 % faltantes, el 22 % de abollados y el 3 % de rayados o rozados. Considerando las severidades se observa la siguiente distribución:

Modelo 20, Cubierta delantera izquierda, Rayado – Rozado, Observada (56 %). Modelo 14, Zócalo derecho, Faltante (16 %). Modelo 17, Manijas externas de puertas traseras, Proyección, Observada (12 %). Modelo 20, Tapa de Baúl o Puerta Trasera, Rayado – Rozado, Observada (10 %). Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada (4 %). Modelo 11, Panel lateral derecho, Faltante, Observada (1 %).

El 70 % para el modelo 20, el modelo 14 el 16 %, el modelo 17 con el 12 % y el modelo 11 con el 1 %.Las partes afectadas se distribuyen según los datos especificados en el listado anterior. En cuanto a los tipos de averías estos son: rayados o rozados con el 70 %, faltantes con el 17 % y el 12 % proyecciones. Finalmente el tipo de severidad se divide en un 16 % de graves y un 83 % de solo observaciones. El noveno periodo se caracteriza por el siguiente centroide:

Modelo 14, Taza, Proyección. Y el tipo de severidad es grave. Luego si la gravedad no es considerada la distribución de los centroides es como sigue a continuación:

Modelo 20, Limpiador y lavador de parabrisas, Proyección (54 %). Modelo 6, Tapizado interno puerta delantera izquierda, Rayado – Rozado (16 %). Modelo 7, Guardabarro trasero derecho, Pintura saltada (14 %). Modelo 7, Cable de carga, Rayado – Rozado (7 %). Modelo 13, Guardabarro trasero derecho, Abollado (3 %). Modelo 13, Techo (inclusive convertible), Abollado (3 %). Modelo 14, Luz de neblina trasera, Abollado (2 %). Modelo 13, Faro de stop luneta, Faltante (1 %).

El modelo 20 con el 54 %, el modelo 6 con el 16 %, el modelo 7 con el 21 %, el modelo 13 con el 5 % y el modelo 14 con el 2 %. Luego se observa la siguiente distribución entre las partes: 54 % limpiador y lavador de parabrisas, tapizado interno puerta delantera izquierda el 17 %, guardabarros trasero derecho con el 17 %, cable de carga 7 %, techo (inclusive convertible) 3 %, luz de neblina

Page 239: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 238 de287 Ing. Hugo Daniel Flores

trasera el 2 % y el faro de stop de luneta el 1 %. Luego el tipo de avería se subdivide en: pintura saltada 14 %, rayados o rozados el 7 %, el 8 % de abollados y el 1 % de faltantes. En referencia a la evaluación de los resultados considerando su gravedad es la siguiente: Modelo 20, Llanta trasera izquierda, Rayado – Rozado, Observada (1 %). Modelo 20, Alfombra baúl / caja de carga, Rayado – Rozado, Observada (3 %). Modelo 8, Alfombra suplementarias, Proyección, Observada (9 %). Modelo 16, Llanta delantera derecha, Faltante, Observada (7 %). Modelo 7, Llanta delantera derecha, Faltante (32 %). Modelo 20, Transponder, Proyección (47 %). El modelo 20 con el 51 %, luego los modelos 8 con el 9 %, el modelo 16 con el 7 % y el modelo 7 con el 32 % son los resultados obtenidos. En cuanto a las partes averiadas se subdividen en rayados o rozados con el 4 %, proyección con el 56 % y faltante con con el 39 %. Luego se observa que el 20 % son solo observaciones y averías el 80 %. El último periodo en estudio muestra la media global: Modelo 13, Zócalo derecho, Faltante. Con severidad grave. Sin la consideración de la severidad el proceso arroja los siguientes valores:

Modelo 7, Panel lateral derecho, Proyección (44 %). Modelo 19, Puerta trasera derecha, Faltante (41 %). Modelo 20, Manijas externas de puertas delanteras, Proyección (6 %). Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado (4 %). Modelo 13, Techo corredizo Pintura saltada (4 %). Modelo 8, Capot, Faltante (1 %). Modelo 10, Cristales de parante delantero, Reventado – Estallado (1 %).

El modelo 7 con el 44 %, el modelo 19 con el 41 %, luego el modelo 20 con el 10 %, el modelo 13 con el 4 %, el modelo 8 con el 1 % al igual que el modelo 10. Luego las partes afectadas se distribuyen según se especificó el listado expuesto previamente. Los tipos de averías se distribuyen de la siguiente forma: proyección con el 50 %, faltante con el 41 %, rayado o rozado con el 4 %, pintura saltada con el 4 % y reventado o estallado con el 1 %. Con la gravedad considerada el mayor índice de ocurrencia ocurre como sigue:

Modelo 14, Retrovisor externo derecho, Faltante (79 %). Luego los porcentajes mínimos se dividen de la siguiente forma:

Modelo 7, Giro Delantero (derecho / izquierdo), Rayado – Rozado, Observada (11 %). Modelo 16, Limpiador y lavador de parabrisas, Faltante, Observada (4 %). Modelo 7, Conjunto carrocería, Manchado, Observada (3 %). Modelo 20, Guardabarro delantero izquierdo, Rayado – Rozado, Observada (2 %).

El modelo 7 con el 14 %, el modelo 16 con el 4 % y el modelo 20 con el 2 %. Las partes se subdividen según se ha definido en el listado previo. Los tipos de averías son: rayados o rozados con el 13 %, faltante con el 4 % y manchados con el 3 %. Luego la gravedad de las averías es solo observable en todos los casos (21 %). 8.5.2.7. Imputación Tipo de Transporte. En este punto se van a evaluar los resultados obtenidos en cada periodo relacionados con el lugar donde se producen los daños y a partir de estos se especificará el tipo de imputación al que corresponde.

Page 240: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 239 de287 Ing. Hugo Daniel Flores

En el periodo uno se observa que el 79 % de las averías corresponden al transporte terrestre. Luego el 10 % transportes marítimos y finalmente el 5 % a la salida de planta. El detalle del resultado del proceso es el siguiente:

74 % de averías en “Subida a Buque Puerto de Origen”. Imputación transporte terrestre. 10 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 5 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 5 % de averías en “Transferencia Ubicación y Línea de Carga”. Imputación planta de producción.

En el segundo periodo también el mayor índice de daños es realizado por el transporte terrestre con un 89 % del total de datos explotados. Luego le sigue el transporte marítimo con el 6 % y finalmente el puerto (averías en la playa de puerto) con solo el 2 %. El detalle porcentual de los datos explotados es el siguiente:

83 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 6 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 6 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 2 % de averías en “Retiro de Puerto”. Imputación puerto.

Los datos del periodo tres muestran que todavía existe un predominio de las averías producidas por el transporte terrestre con el 85 %. Luego las averías de trasporte marítimo con el 9 % y finalmente el la playa de puerto con el 4 %. Este periodo coincide con las imputaciones del periodo anterior pero los porcentuales son distintos. En cuanto a los detalles del periodo es el siguiente:

76 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 9 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 9 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 4 % de averías en “Subida a Buque”. Imputación puerto.

La información del periodo cuatro muestra que el 60 % solo es de trasporte terrestre. Luego el 15 % son daños de salida de planta de producción. Y finalmente el 13 % son producidos en el transporte marítimo. El detalle es el siguiente:

47 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 15 % de averías en “Retiro Fábrica de Origen”. Imputación planta de producción. 15 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 13 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre.

El comportamiento de los resultados del periodo cinco también muestra en el primer lugar a las averías imputables al transporte terrestre con un 46 %. Luego le siguen las averías producidas en planta con el 23 %. En tercer lugar aparecen las averías producidas por las compañías marítimas con el 20 % y finalmente con un porcentaje mínimo se observan las averías en playa de puerto con el 6 %. El detalle porcentual es el siguiente:

32 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 23 % de averías en “Retiro Fábrica de Origen”. Imputación planta de producción. 20 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 14 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 6 % de averías en “Retiro de Puerto”. Imputación puerto.

Page 241: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 240 de287 Ing. Hugo Daniel Flores

En el periodo seis todavía existe el predominio de las averías imputables al transporte terrestre con el 55 %. Luego, al igual que en el periodo anterior, las averías de planta de producción con el 17 %. En tercer lugar las averías de transporte terrestre con el 13 % y finalmente con solo un 5 % las averías imputables a la playa de puerto.

42 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 17 % de averías en “Retiro Fábrica de Origen”. Imputación planta de producción. 15 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 13 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 5 % de averías en “Retiro de Puerto”. Imputación puerto.

El resultado de los procesos del periodo siete muestra que el transporte terrestre aparece con un 46 % de participación. Luego en el segundo lugar se observan las averías de transporte marítimo con el 21 %. En tercer lugar están las averías imputables a planta con el 16 %. Y finalmente se observan los daños imputables a la playa de puerto con el 10 %. El detalle porcentual es el siguiente:

40 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 21% de averías en “Bajada de Buque”. Imputación transporte marítimo. 16 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de producción. 10 % de averías en “Subida a Buque”. Imputación puerto. 6 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre.

En el periodo ocho se observa el cambio del primer lugar de imputabilidad. En este periodo el porcentaje más alto de daños se encuentra en la salida de planta, o sea daños en producción con el 48 %. Luego con el 36 % le siguen los daños imputables al transporte terrestre. El transporte marítimo tiene el 7 % de incidencia en los daños y finalmente el 5 % de los daños de este periodo fueron producidos por la playa de puerto. El detalle es el siguiente:

48 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de producción. 19 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 17 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 7 % de averías en “Bajada de Buque”. Imputación transporte marítimo. 5 % de averías en “Retiro de Puerto”. Imputación puerto.

Las averías en el periodo nueve mantienen el primer lugar de imputación del periodo anterior. Los daños producidos en planta y detectados en la transferencia y línea de carga tienen el 63 % de ocurrencia. Luego sigue el trasporte terrestre con el 23 % y finalmente el 4 % son averías producidas por el transporte marítimo.

63 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de producción. 16 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 7 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 4 % de averías en “Bajada de Buque”. Imputación transporte marítimo.

El último periodo en estudio tiene como mayor porcentaje de incidencia de las averías a la planta de producción con el 56 %. Luego le siguen los daños de transporte terrestre con el 25 %. En el tercer

Page 242: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 241 de287 Ing. Hugo Daniel Flores

lugar se encuentran las averías de playa de puerto con el 11 %. Y finalmente las averías de transporte marítimo con el 6 %.

56 % de averías en “Transferencia ubicación y línea de carga”. Imputación planta de producción. 17 % de averías en “Ingreso a Puerto”. Imputación transporte terrestre. 11 % de averías en “Subida a Buque”. Imputación puerto. 8 % de averías en “Subida a Buque Puerto de origen”. Imputación transporte terrestre. 6 % de averías en “Bajada de Buque”. Imputación transporte marítimo.

8.6. Desarrollo En esta fase se realiza la evaluación de los resultados y la misma concluye con una estrategia para el desarrollo de los resultados de la minería de datos en el negocio. 8.6.1. Plan de desarrollo Resumen de resultados. El Árbol de Clasificación arroja el siguiente resultado que es ilustrado resumidamente en el Gráfico 39. Se puede ver claramente los resultados obtenido sobre las cantidades de tipos de averías producidos a lo largo de cada periodo. En el gráfico se han introducido solo los cuatro principales tipos de averías: Faltante, Pintura Saltada, Rayado o Rozado y Abollado. Estos cuatro tipos de averías constituyen el 96,04 por ciento en promedio del total de datos explotados.

Tipos de Averías

0

1000

2000

3000

4000

5000

6000

Per io do

Faltante 494 184 274 264 240 247 339 605 641 1771

Pintura saltada 935 790 812 598 490 271 136 237 609 334

Rayado - Rozado 2023 1628 1794 1792 1887 1499 1207 1278 4689 2223

Abollado 5338 2855 2375 1099 1126 1681 780 761 1016 751

2003 Semestre 1-04 Semestre 2-04 Semestre 1-05 Semestre 2-05 Semestre 1-06 Semestre 2-06 Semestre 1-07 Semestre 2-07 Semestre 1-08

Gráfico 39: Barras detallado cantidades por tipo de avería

Con el Árbol de Clasificación también se proceso la información relacionada con los lugares donde se producen las averías. En el Gráfico 40 se muestra el detalle de los resultados obtenidos. En este caso a diferencia del resultado anterior, la información que se puede visualizar es el 100 % de los resultados.

Page 243: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 242 de287 Ing. Hugo Daniel Flores

Un detalle a tener presente en el resultado que muestra a lugar “Subida a Buque en Puerto de Origen” como el de mayor producción de daños es que la información procesada en la práctica pertenece a dos cambios de responsabilidad. Esto es, las averías detectadas en la subida a un buque son imputables tanto al transporte terrestre como a playa de puerto. Además, especialmente en los periodos iniciales del presente proyecto también hubo cambios a nivel empresas que por motivos políticos o internos. Es difícil estimar un porcentaje el cual sea representativo de lo que sucedió en la realidad en el punto de control en cuestión pero esto nos lleva a deducir que como línea futura de investigación se puede trabajar con los datos agrupados en función de los lugares de control y no por periodos de tiempo como es estudio actual.

Lugares

0

1000

2000

3000

4000

5000

6000

7000

8000

Per iodo

Subida a Buque 104 82 228 201 104 138 265 95 523 633

Retiro de Puerto 352 89 71 137 248 187 119 156 60 124

Ingreso a Puerto 443 343 491 510 550 497 1069 575 1167 958

Salida de Planta 511 69 53 642 1003 767 454 1457 4521 3020

Bajada de Buque 942 343 505 570 758 580 547 219 282 318

Subida Buque Puerto de Origen 6925 4741 4008 1849 1208 1585 144 517 635 454

2003 Semestre 1-04 Semestre 2-04 Semestre 1-05 Semestre 2-05 Semestre 1-06 Semestre 2-06 Semestre 1-07 Semestre 2-07 Semestre 1-08

Gráfico 40: Barras detallado cantidades por lugares de ocurrencia de averías

El resultado de la explotación de datos con Árbol de Clasificación también fue realizado sobre los modelos de autos que participan proyecto de minería de datos. El Gráfico 41 muestra el resumen de los resultados obtenidos. En este caso como en el de los tipos de averías también se ha reducido la cuestión a los modelos que participan en un 96,65 % de los registros explotados. Como en el caso de los lugares de producción de averías aquí también hay una observación válida que se puede realizar. Existen modelos que debido a que no están incluidos en determinados periodos no porque no hayan tenido averías sino porque todavía no participaban del proceso o porque no se fabricaban o porque no entraban en la cadena logística. Esto también lleva a determinar la necesidad de realizar estudios futuros de minería de datos sobre la producción de averías de determinados modelos. Posiblemente un agrupamiento interesante puede ser por modelo. De esto se hablará en ítems posteriores cuando se especifiquen planes alternativos de explotación de datos o líneas futuras de investigación.

Page 244: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 243 de287 Ing. Hugo Daniel Flores

Modelos

0

500

1000

1500

2000

2500

3000

3500

4000

4500

Per iodo

M odelo 9 4143 1785 833 433 469 789 170 209 156 142

M odelo 17 2662 2616 3041 2002 1795 1482 260 125 30 38

M odelo 5 595 244 252 200 398 533 565 712 839 433

M odelo 20 546 319 632 574 266 441 1268 1403 3819 2571

M odelo 18 467 28 40 86 39 10 29 37 36 21

M odelo 13 436 562 457 35 70 125 106 270 358 190

M odelo 7 0 0 0 0 0 0 2 94 1747 1883

M odelo 8 0 0 0 465 608 285 28 88 75 26

2003 Semestre 1-04 Semestre 2-04 Semestre 1-05 Semestre 2-05 Semestre 1-06 Semestre 2-06 Semestre 1-07 Semestre 2-07 Semestre 1-08

Gráfico 41: Barras detallado cantidades por modelos averiados

Para cada uno resultados obtenidos de la explotación de datos aplicando los modelos de clasificación se han obtenido los conjuntos de reglas necesarios para establecer la ocurrencia de los resultados linealmente. Por razones prácticas no se exponen en el proyecto el detalle de las reglas pero las mismas pueden formar parte de futuras líneas de desarrollo de minería de datos para la identificación de las reglas que llevan a la ocurrencia de las averías. Resumiendo el resultado de los agrupamientos generados a partir del algoritmo de Clustering se observan los siguientes patrones de comportamiento. Estos resultados pueden ser diferenciados para los tipos de averías de mayor ocurrencia en todo el conjunto de datos estudiado. Por cuestiones de practicidad los patrones expuestos a continuación representan el más alto porcentaje de probabilidad de ocurrencia en relación a los datos analizados. Debido a que la herramienta de clustering utilizada en el proyecto se basa específicamente en el valor de los atributos y no en las relaciones entre los mismos sería necesario para afinar los resultados introducirlos o analizarlos a través de algoritmos de inducción. La aplicación de algoritmos de inducción sobre los resultados del agrupamiento por cada periodo o cada explotación de datos en esta industria puede formar parte de líneas futuras de investigación muy interesantes a desarrollar. Como resultado del agrupamiento de averías se pueden especificar los siguientes patrones:

• Capot, Abollado, Observada. • Abollado, Leve. • Abollado, Observada. • Ingreso a Puerto, Abollado. • Transferencia ubicación y línea de carga, Abollado. • Abollado. • Subida Buque Puerto de Origen, Luneta trasera / Cristal puerta trasera,

Arrancado - Roto – Fisurado, Grave.

Page 245: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 244 de287 Ing. Hugo Daniel Flores

• Transferencia ubicación y línea de carga, Paragolpe delantero / Protector delantero, Arrancado - Roto – Fisurado, Observada.

• Paragolpe delantero / Protector delantero, Arrancado - Roto – Fisurado, Observada.

• Arrancado - Roto – Fisurado, Observada. • Modelo 17, Arrancado - Roto – Fisurado. • Manijas externas de puertas delanteras, Faltante, Observada. • Subida a Buque, Tapa acceso gancho remolque, Faltante. • Faltante, Grave. • Faltante, Leve. • Modelo 8, Faltante. • Faltante. • Modelo 13, Faltante. • Conjunto carrocería, Manchado, Observada. • Modelo 5, Otros, Manchado, Observada. • Paragolpe delantero / Protector delantero, Manchado, Observada. • Spoiler delantero, Manchado, Observada. • Manchado, Observada. • Guardabarro trasero derecho, Pintura saltada. • Modelo 17, Llanta delantera derecha, Pintura saltada. • Llanta trasera derecha, Pintura saltada, Observada. • Paragolpe delantero / Protector delantero, Pintura saltada, Observada. • Modelo 9, Pintura saltada, Mediano. • Pintura saltada, Observada. • Cable de carga, Proyección. • Retiro de Puerto, Proyección, Mediano. • Proyección, Observada. • Proyección. • Retiro de Puerto, Capot, Rayado – Rozado. • Llanta trasera izquierda, Rayado – Rozado, Observada. • Modelo 20, Llanta trasera izquierda, Rayado – Rozado, Observada. • Transferencia ubicación y línea de carga, Manijas externas de puertas delanteras,

Rayado - Rozado • Manijas externas de puertas traseras, Rayado – Rozado, Mediano. • Modelo 17, Otros, Rayado – Rozado. • Panel trasero bajo baúl, Rayado – Rozado, Observada. • Bajada de Buque, Paragolpe delantero / Protector delantero, Rayado – Rozado,

Observada. • Retiro de Puerto, Paragolpe delantero / Protector delantero, Rayado – Rozado,

Observada. • Transferencia ubicación y línea de carga, Paragolpe delantero / Protector

delantero, Rayado – Rozado, Observada. • Modelo 20, Paragolpe delantero / Protector delantero, Rayado – Rozado,

Observada. • Paragolpe delantero / Protector delantero, Rayado – Rozado, Observada. • Subida Buque Puerto de Origen, Paragolpe delantero / Protector delantero,

Rayado – Rozado.

Page 246: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 245 de287 Ing. Hugo Daniel Flores

• Transferencia ubicación y línea de carga, Paragolpe delantero / Protector delantero, Rayado – Rozado.

• Paragolpe delantero / Superior, Rayado – Rozado, Mediano. • Modelo 20, Paragolpe delantero / Superior, Rayado – Rozado, Observada. • Subida Buque Puerto de Origen, Paragolpe delantero / Superior, Rayado – Rozado. • Paragolpe delantero / Superior, Rayado – Rozado. • Modelo 13, Puerta delantera derecha, Rayado – Rozado. • Retiro de Puerto, Rayado – Rozado. • Modelo 13, Retrovisor externo izquierdo, Rayado – Rozado. • Subida a Buque, Spoiler delantero, Rayado – Rozado, Mediano. • Bajada de Buque, Spoiler delantero, Rayado – Rozado, Observada. • Ingreso a Puerto, Spoiler delantero, Rayado – Rozado, Observada. • Transferencia ubicación y línea de carga, Spoiler delantero, Rayado – Rozado,

Observada. • Spoiler delantero, Rayado – Rozado, Observada. • Bajada de Buque, Spoiler delantero, Rayado – Rozado. • Transferencia ubicación y línea de carga, Spoiler delantero, Rayado – Rozado. • Tapa posterior de techo, Rayado – Rozado, Observada. • Tapizado interno puerta delantera izquierda, Rayado – Rozado. • Subida a Buque, Zócalo interno puerta delantera izquierda, Rayado – Rozado,

Observada. • Rayado – Rozado, Grave. • Rayado – Rozado, Leve. • Rayado – Rozado, Mediano. • Modelo 20, Rayado – Rozado, Observada. • Subida a Buque, Rayado – Rozado, Observada. • Rayado – Rozado, Observada. • Modelo 20, Rayado – Rozado, Observada. • Rayado – Rozado, Observada. • Modelo 20, Rayado – Rozado, Observada. • Rayado – Rozado, Observada. • Bajada de Buque, Rayado – Rozado. • Ingreso a Puerto, Rayado – Rozado. • Paragolpe trasero / Spoiler trasero, Rayado – Rozado. • Transferencia ubicación y línea de carga, Rayado - Rozado. • Modelo 10, Rayado - Rozado. • Rayado – Rozado. • Modelo 5, Rayado – Rozado. • Modelo 13, Rayado – Rozado. • Moldura protectora lateral derecha, Rayado – Rozado. • Modelo 20, Rayado – Rozado. • Cubierta trasera derecha, Reventado – Estallado, Observada. • Reventado - Estallado. • Alerón. • Barras de techo. • Capot, Observada. • Conjunto carrocería, Observada.

Page 247: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 246 de287 Ing. Hugo Daniel Flores

• Cubierta delantera izquierda. • Faro delantero izquierdo / derecho, Mediano. • Subida Buque Puerto de Origen, Guardabarro trasero derecho. • Llanta trasera izquierda, Observada. • Manijas externas de puertas traseras, Observada. • Manijas externas de puertas traseras. • Panel lateral derecho, Observada. • Parante delantero, Observada. • Modelo 9, Parrilla delantera, Observada. • Parrilla delantera. • Retrovisor externo derecho, Grave. • Retrovisor externo derecho, Observada. • Separador interno de carga. • Tapa acceso gancho remolque, Observada. • Tapa posterior de techo, Mediano. • Tapa posterior de techo, Observada. • Tapa posterior de techo. • Techo (inclusive convertible) . • Techo corredizo, Observada. • Zócalo derecho, Grave. • Zócalo derecho, Observada. • Zócalo derecho, Grave. • Modelo 13, Grave. • Transferencia ubicación y línea de carga, Leve. • Modelo 16, Mediano. • Subida Buque Puerto de Origen, Observada. • Transferencia ubicación y línea de carga, Observada. • Modelo 13, Observada. • Modelo 7, Observada. • Modelo 13, Observada. • Modelo 20, Observada. • Modelo 16, Observada. • Subida a Buque. • Transferencia ubicación y línea de carga. • Modelo 17. • Modelo 9. • Modelo 13. • Ingreso a Puerto, Capot, Rayado – Rozado. • Ingreso a Puerto, Paragolpe trasero / Spoiler trasero, Rayado – Rozado. • Ingreso a Puerto, Paragolpe trasesro / Zona contacto, Rayado – Rozado. • Subida a Buque, Rayado – Rozado, Grave.

El resumen expuesto anteriormente incluye todos los resultados coherentes en función de la relación entre sus atributos. La lista anterior muestra todos los resultados de la explotación de datos de clustering; esto es partes, averías y gravedades; daños por lugar y daños por modelos.

Page 248: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 247 de287 Ing. Hugo Daniel Flores

Para resumir los resultados del Modelo de Predicción se puede decir que se hicieron los siguientes procesos y los mismos agruparon la ocurrencia de partes averiadas, tipos de averías, lugares donde se producen las averías y modelos con averías como se especifica a continuación. Al igual que en el caso de los agrupamientos en los modelos de predicción empleados sería viable y necesaria el estudio y aplicación de algoritmos de inducción debido a que los resultados generados por sus atributos se basan en el valor numérico y no en la relación entre ellos. Las partes predictivas resultantes a lo largo de los 10 periodos son:

• Manual • Cubierta delantera derecha • Escape • Guardabarro delantero derecho • Guardabarro trasero derecho • Llanta delantera derecha • Llave • Manijas externas de puertas traseras • Panel trasero bajo baúl • Puerta delantera derecha • Puerta trasera derecha • Tapa acceso gancho remolque • Taza • Alerón • Aerosol antipinchazos

Estos resultados fueron obtenidos realizando la variación del tipo de avería y la gravedad de los mismos por cada periodo. Estas partes resultantes de los procesamientos de datos representan el 15 % de la cantidad de partes posibles de participación en un siniestro. En cuanto a los tipos de averías se puede ver un comportamiento mucho más acotado en cantidad:

• Faltante • Abollado • Proyección

A pesar que la cantidad resultante resumida es menor que en el análisis de partes, en este caso los tipos de averías representan el 27 % del total de tipos de averías entre las cuales se puede encontrar un siniestro. En referencia a los lugares donde se producen las averías el resultado arrojó el siguiente valor:

• Bajada de Buque • Ingreso a Puerto • Retiro de Puerto • Salida de Planta

En este caso se puede ver que la posibilidad que se encuentre una avería en la subida a un buque es tan baja como para que el modelo de predicción no la considere como resultado posible. Lo mismo

Page 249: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 248 de287 Ing. Hugo Daniel Flores

sucede con las averías encontradas en la subida a un buque en puerto de origen, si bien en ese punto de control se han encontrado gran porcentaje de las averías en estudio el modelo no arroja como resultado posible de ocurrencia en su predicción. Finalmente se observa que de los modelos de auto explotados en el presente estudio el resultado se resume a la ocurrencia de:

• Modelo 9 • Modelo 17 • Modelo 16 • Modelo 15 • Modelo 14 • Modelo 13 • Modelo 12 • Modelo 11 • Modelo 10

En este caso representan el 45 % de la cantidad de modelos posibles de aparecer. Procesamiento de información La información fue procesada según la siguiente distribución de datos dentro de cada software:

• Explotación de datos usando Árbol de Clasificación: Tipo de Averías, Lugares y Modelos de autos. Para cada herramienta se ingresan las columnas de daños distribuidas según el formato parte + avería + gravedad.

• Explotación de datos usando Clustering de Averías, Modelos averiados y Lugares donde se producen las averías. La distribución de datos se realiza encolumnando las averías en función del formato parte más avería y más gravedad.

• Explotación de datos usando Modelo de Predicción de Averías, Lugares donde se producen las averías, y Modelos averiados. El ingreso de datos a cada modelo se realiza según el formato parte + avería + gravedad.

En el procesamiento de datos vinculado directamente a los lugares donde se producen las averías se realizan dos actividades:

1. Agrupar en función de la imputabilidad a la salida de planta dos de los puntos de control. Estos puntos se identifican en el proyecto como Salida de Planta y la imputabilidad es a Calidad o Línea de Producción.

2. Y para el caso específico de los datos relacionados con el punto de control Subida a Buque en Puerto de Origen se realiza la salvedad que la imputabilidad del daño está distribuida entre los daños producidos por el transporte terrestre y la playa de puerto (donde también se debe incluir la estiba).

Todos los modelos de datos son explotados para cada periodo desde el año 2003 hasta mediados del año 2008. El proyecto se ha desarrollado sobre 7 puntos de control. El total global de inspecciones realizadas para obtener la información es de 595393 inspecciones distribuidas entre los 7 puntos de control. El número total de autos es de 183926 unidades inspeccionadas a lo largo de las cadenas de logísticas, estas unidades corresponden a 20 tipos de modelos de autos diferentes. Finalmente y

Page 250: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 249 de287 Ing. Hugo Daniel Flores

como se mencionó en la etapa de Preparación de Datos el número total de registro de daños explotados en el proyecto es de 50246. Planes alternativos Un plan alternativo de desarrollo de minería de datos puede ser el que se detalla a continuación.

- Extracción de datos en formato SQL desde las bases de datos. - Normalización y transformación de datos si es necesario. - Generación de registros con el formato: parte, avería, gravedad, modelo, y lugar. - Distribución de las tablas para introducir los datos en función de periodos por

columna. - El modelo de Clustering se forma por las columnas:

• Periodo 1 • Periodo 2 • Periodo 3 • Periodo 4 • Periodo 5 • Periodo 6 • Periodo 7 • Periodo 8 • Periodo 9 • Periodo 10

- Luego para cada periodo / columna introducir los registros extraídos de la base de

datos. O sea que se puede invertir la introducción de los datos a ser explotados para procesar por separado partes, luego averías, luego lugares, etc.

Otro plan alternativo que puede resultar interesante para la industria es el de separar la información por lugar y luego procesar cada lugar independientemente. Esto quedaría conformado de la siguiente forma:

• Punto de control salida de línea de producción. • Punto de control ingreso a puerto. • Punto de control despachos de puerto. • Punto de control subidas a buque. • Punto de control bajada de buque.

Luego para cada lugar donde se produce la información se ingresa en cada modelo según el procesamiento actual los datos vinculados a las averías en formato parte más avería y más gravedad. Dentro de cada uno de los puntos de control se pueden encontrar más de una compañía responsable por el movimiento de la unidad automotriz por lo que también puede ser una línea de análisis valida para llevar a la práctica la realización de una subdivisión por cada lugar en función de la compañía que interviene. Continuando con ese análisis la minería de datos también puede ser llevada a cabo distribuyendo los grupos de datos por imputabilidad. Esto sería:

Page 251: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 250 de287 Ing. Hugo Daniel Flores

• Averías provocadas por líneas marítimas. • Averías producidas por transportes terrestres. • Averías de calidad. • Averías de puerto o playa.

Y cada grupo contendría en la explotación de datos los códigos de averías en formato parte más avería más gravedad. En resumen y concluyendo con la mención de los planes alternativos que se podrían llevar a la práctica en un proyecto de minería de datos se puede decir que al contar con la información normalizada desde la producción de la misma (inspecciones según los estándares) pasando por la captura de datos y llegando a su almacenamiento en bases de datos centralizadas las estrategias para un futuro procesamiento de datos aplicando técnicas de minería de datos solo depende de los requerimientos de las partes interesadas en la industria y la creatividad de los responsables de llevar a cabo el proyecto. El descubrimiento de la información obtenida a partir del presente proyecto directamente podría ser usado para consolidar prácticas empíricas realizadas en la industria. Se puede dar un marco teórico por ejemplo al hecho de trabajar siempre sobre la base que el comportamiento de los tipos de averías siempre esta vinculado directamente a 4 tipos del total que impone el estándar de inspección de este estudio. Esto está justificado debido a que la ocurrencia de averías se produce con cuatro tipos de averías que participan en un porcentaje medio del 96 % del total en explotación. 8.6.2. Supervisión y mantenimiento del plan La supervisión y el mantenimiento de la implementación del presente proyecto es importante debido a que los datos que se procesan diariamente pueden ser modificados por el personal operativo de la compañía. Los datos son modificados por diferentes motivos como puede ser haber realizado una codificación incorrecta, haber asignado una imputabilidad incorrecta, etc. El volumen de datos en movimiento diario es grande y dinámico motivo por el cual la extracción de las muestras debe ser realizada cuidadosamente y realizando backups de los datos explotados por cada proceso. La minería de datos debería ser realizada por periodos de 6 meses. En función del presente proyecto se puede establecer el semestre como una unidad de medida representativa importante para la obtención de resultados prácticos. Como plan de supervisión y mantenimiento se podría establecer:

- Extracción y almacenamiento semestral de datos guardando en formato de hoja de cálculo toda la información.

- Verificación de los modelos de autos y lugares de inspección que intervienen. Si aparecen nuevos puntos de control o nuevos modelos se debe proceder a su codificación.

- Distribución de los datos en función de los modelos de software de minería de datos a trabajar.

- Los archivos de la explotación de datos semestrales deben ser guardado en soporte magnético en la compañía. Lo conveniente es almacenar en carpetas y por procesos semestralmente.

Page 252: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 251 de287 Ing. Hugo Daniel Flores

- Los resultados obtenidos por cada explotación de datos debe ser llevado a formato de hoja de cálculos con generación de gráficos de barras y tortas para una mejor visión e interpretación de los resultados obtenidos por cada periodo.

- Al final de cada proceso de minería de datos la evaluación de los resultados debe ser realizado por un equipo compuesto por la parte operación encargada de la captura de la información y el área de tecnología de la compañía.

8.6.3. Producción de Informe definitivo La utilización de la metodología CRISP-DM para este proyecto ha permitido encontrar un comportamiento predictivo de los daños y/o en función del estándar utilizado para la realización de la inspección de unidades. Se ha podido encontrar un plan de extracción, normalización, y codificación de datos para la realización de procesos de minería de datos semestrales. Como se ha mencionado en puntos anteriores además estos procesos de minería de datos pueden tener como objetivos otros aspectos como pueden ser: realizar procesos de minería sobre las averías producidas en determinados puntos de control, por determinadas compañías o por tipos de imputación. Entre los objetivos logrados por la aplicación de la metodología se puede mencionar:

• Se han determinado los daños y/o averías para cada periodo. • Se han determinado responsabilidades en la siniestralidad en función del tipo de avería y

tipo de transporte por cada periodo. • El estudio de las averías ha permitido encontrar un referente de imputación estableciendo

patrones de comportamiento. • Se han podido encontrar los tipos de averías y sus porcentajes de ocurrencia por cada

periodo. • Las partes averiadas han sido identificadas como así también las cantidades y porcentajes de

ocurrencia en cada periodo. • El comportamiento de los daños ha sido establecido especificando la gravedad de los

mismos. • Se han establecido cuales son los modelos de autos más afectados por los daños como así

también las partes que normalmente aparecen averiadas en las unidades. • Los lugares donde se producen las averías han podido ser identificados como así también las

partes y tipos de averías. • Se han especificado las cantidades de averías por tipos de transportes, partes averías, tipos

de averías, lugares donde se producen las averías y los modelos afectados. • En referencia a información “oculta” descubierta en el proyecto lo más importante fue lo

relacionado con la cantidad de tipos de avería normalmente producidos, las partes normalmente afectadas y los modelos mayoritariamente averiados.

La presentación final del proyecto se encuentra en el anexo 5. En este se encuentra un subconjunto de resultados obtenidos como así también la explicación global de la metodología utilizada y los pasos a seguir en la implementación práctica.

Page 253: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 252 de287 Ing. Hugo Daniel Flores

8.6.4. Revisión del proyecto Entre las cosas acertadas para el desarrollo del proyecto actual se puede decir que la determinación de la división en periodos de tipo ha sido determinante para poder encontrar un estándar de cantidad de tiempo para realizar la explotación de los datos. Posiblemente uno de los errores en el proyecto fue el hecho de no invertir las columnas de datos a ser explotados dentro de cada modelo. Lo acertado dentro de la explotación de datos de proyecto se puede mencionar la Evaluar que fue lo correcto y que fue lo errado, cual fue el éxito obtenido, y que necesidades serán mejoradas. Posiblemente para futuros proyectos haya que analizar la posibilidad de evitar el procesamiento o la obtención de resultados inconsistentes debido a la combinación de partes con tipos de averías que en la realidad no aparecen. Este proyecto puede ser de utilidad para especificar en el software de captura o de almacenamiento en la base de datos todas las restricciones para el ingreso de averías con estructura inconsistente. Otro resultado interesante que se ha podido corroborar dentro de un contexto metodológico debido a la explotación de datos desde el 2003 a mediados del 2008 con la base de datos en cuestión es que el cambio de compañía de inspección en el punto de control “Subida a Buque en Puerto de Origen” ha generado un cambio significativo en la detección de daños y/o averías. Los motivos que provocaron ese comportamiento distintivo en los datos no son discutidos en el presente proyecto, pero si se puede decir que para evitar este inconveniente en futuros proyectos de minería de datos uno de los caminos factibles para explotar los datos puede ser el de agrupar la información por puntos de control o por tipo de imputación.

Page 254: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 253 de287 Ing. Hugo Daniel Flores

9. Conclusiones A partir del análisis de los diferentes métodos para el desarrollo de esta minería de datos se puede concluir que la metodología CRISP-DM es apropiada para la explotación de datos en esta industria. Posiblemente en futuros proyectos podrían utilizarse otras herramientas de software pero en términos generales es apropiado considerar al presente proyecto con todos los pasos y las herramientas de software para la minería de datos en la detección de patrones de daños y/o averías. Otro de los motivos por los cuales resulta apropiado trabajar con la metodología mencionada anteriormente es que es totalmente independiente de las herramientas de software. Esto último, característica particular de CRISP-DM, es una de las grandes ventajas sobre otras metodologías. Además, siguiendo los pasos según lo detalla la metodología se ha probado que es completa y flexible por lo cual es aconsejable recomendarla como base metodológica para futuros proyectos en la industria de automóviles. Como se ha mencionado a lo largo del presente trabajo en la industria automotriz a nivel global existen diferentes estándares de inspección, codificación y sistemas de captura de datos por lo tanto la generalidad que presenta la metodología CRISP-DM le permite hacerse recomendable para futuras implementaciones. Cambiar de un estándar a otro no representa inconvenientes importantes para la explotación de información. En referencia a la minería de datos realizada también se puede concluir que la misma puede tomar formas diferentes de explotación de datos tanto a nivel de formato de registros como a los periodos de tiempos en los cuales se puede distribuir la información. El sistema de datos está normalizado casi en su totalidad. En relación a las cantidades consideradas estadísticamente para la ocurrencia de los diferentes siniestros se observa de forma clara como es su distribución. Inclusive los resultados obtenidos desde el punto de vista práctico permiten establecer como patrones de comportamiento los tipos de averías y los modelos afectados en este nicho de mercado específico (considerando el estándar de inspección para la toma de datos y los modelos de autos que intervienen en este proyecto particularmente). Si bien los resultados del trabajo muestran patrones de comportamiento satisfactorios es interesante ver que se pueden realizar más combinaciones para la explotación de datos en lo que se refiere a los lugares, modelos de autos o tipo de formato de registros introducidos en cada modelo de software. Inclusive puede también considerarse como parámetro de separación las empresas responsables en cada punto de control. Teniendo en cuenta lo expuesto en los puntos iniciales de esta tesis se puede decir que cualquiera sea el problema a resolver y con cualquier estándar de inspección no existe una única técnica para solucionarlo, sino que puede ser resuelto con distintas herramientas. Los aspectos estadísticos de la minería de datos aquí pueden dar resultados globales que permitan guiar el proyecto en esta industria hacia los aspectos inteligentes de explotación de datos. Esto es, posiblemente sea conveniente comenzar los proyectos de data mining en esta industria con técnicas estadísticas y luego en la medida que se va profundizando en el análisis y conocimiento de los resultados se puede ir hacia la aplicación de sistemas inteligentes. La aplicación del Árbol de Clasificación es totalmente óptima para este proyecto y en futuros proyectos de minería de datos de esta industria. Inclusive independientemente de la distribución o el

Page 255: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 254 de287 Ing. Hugo Daniel Flores

agrupamiento de la información. Resulta de alta importancia siempre utilizarlo al inicio de cada explotación de datos para tener una referencia clara de la situación global de las cantidades de datos. El modelo gráfico de los resultados obtenidos detallando cantidades y porcentajes en toda la distribución en forma de tortas permite ver, seguir y analizar en todos los momentos del proyecto la información y coherencia con que se va trabajando. Cada Árbol de Clasificación del software utilizado genera las reglas de producción de cada nodo. Esas reglas pueden ser aplicables directamente al desarrollo de cualquier software para la administración de datos en el proceso de almacenamiento de información. Constituirían las denominadas reglas de negocio para la validación de datos de partes con tipos de averías y gravedades. En este trabajo las reglas no han sido incluidas debido a su gran cantidad y a que cada una tiene que ser sometida a un estudio previo para filtrarlas. En cuanto al Clustering quizás sea necesario estudiar la posibilidad de trabajar con matrices de menor tamaño puesto que este estudio ha demostrado que se necesita mucho tiempo de computación para el procesamiento de matrices de 10 x 10 y posiblemente no se justifique debido a la similitud obtenida en los resultados con otras matrices de menor tamaño. Otro factor a ser estudiado es la aplicación o no de la gravedad de las averías puesto que pueden no ser necesarias, pero no se debe dejar de lado que quizás el estándar lo precise. También se puede realizar la explotación de datos con está técnica considerando solamente datos relacionados con las partes por un lado por periodos, o bien por tipos de averías en determinados periodos, o por lugares o modelos en diferentes periodos. Es decir que la combinación de posibilidades en función de la gran cantidad de información disponible es muy alta y es posible considerar que lo más importante es que con este proyecto de tesis se ha podido demostrar la viabilidad de líneas de investigación futuras con la aplicación del agrupamiento como técnica de explotación de datos. Es interesante ver también que la combinación de posibilidades para la producción de los centroides es grande debido al sistema de codificación con el que se trabaja en el registro de averías en la industria y al sistema de datos normalizado desde donde se extraen los datos. O sea que es posible obtener resultados finales válidos y erróneos a partir de la explotación. Los errores son descubiertos a partir de la inconsistencia entre las combinaciones posibles de: partes más averías más gravedades. Si bien los resultados obtenidos son satisfactorios es importante destacar que es necesario trabajar, en etapas posteriores o en una futura implementación de esta metodología en la industria, con algoritmos de inducción para tratar de mejorar la explotación de datos en lo que respecta a la relación entre ellos. Como se ha mencionado a lo largo de este proyecto de tesis la tendencia de las técnicas empleadas hacia el valor de los atributos y no entre sus relaciones muestra que algunos de los datos resultantes son inconsistentes con la realidad. Algunas de las herramientas posibles de utilizar pueden ser árboles de decisión o de clasificación. En relación al Modelo de Predicción es importante su aplicación y determinante a la hora de encontrar los patrones de ocurrencia en las averías, lugares, partes averiadas y modelos de autos averiados. Al igual que con las otras dos herramientas utilizadas se han dejado fuera de este trabajo algunos de los resultados obtenidos. Esto es, para el caso de las variaciones posibles de realizar entre determinado rango de tipos de averías o partes la ocurrencia de los resultados predictivos puede variar. Las pendientes obtenidas sobre las tendencias pueden ser positivas o negativas, y también pueden tener como ocurrencia de resultados posibles un determinado rango de valores. Estos últimos son

Page 256: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 255 de287 Ing. Hugo Daniel Flores

aspectos matemáticos que estudiados profundamente pueden dar información útil sobre el comportamiento o la predictibilidad de las averías. Además, también como en el caso del Clustering es posible realizar la búsqueda de otro tipo de predicciones como por ejemplo determinados tipos de averías en determinados meses del año. O bien, se puede realizar la predicción sobre partes solamente en determinados periodos, o lugares o modelos de autos. Este software de predicción empleado también se basa fuertemente en el valor de sus atributos más que en la relación entre ellos en los resultados finales por lo que sería conveniente también como el caso del Clustering trabajar con algoritmos de inducción para mejorar los resultados. Concluyendo con el resultado de la utilización del software empleado la información de esta industria en su formato tradicional y con el sistema de seguimiento almacenado en una base de datos central puede ser explotada en un proyecto de minería de datos con la aplicación de técnicas como el clustering, la clasificación o la predicción. Los periodos de tiempo para el desarrollo de una minería de datos en la industria podría ser el semestre. La muestra semestral de datos es considerada suficiente como para lograr los objetivos según se plantearon en el presente proyecto de tesis, y teniendo en cuenta el movimiento de los vehículos de mercado argentino. Los tipos de transportes también pueden determinar los límites y alcances de un proyecto de minería de datos para detectar patrones de comportamiento. También es importante mencionar como conclusión de este proyecto que la estructura de las bases de datos desde donde se extrajo el mayor porcentaje de información contiene todas las relaciones y el formato necesarios para el desarrollo de cualquier tipo de herramienta de software para la gestión de la información. O sea que es recomendable para el desarrollo de aplicaciones de software de captura o almacenamiento de información para cada punto de control de una cadena logística, realizar un análisis detallado de las combinaciones posibles de averías o tipos de averías en función de esta base de datos. El mecanismo para la obtención de las reglas de negocios para aplicaciones informáticas en el seguimiento y control de siniestros de este estudio no esta desarrollada en este mercado, motivo por el cual este proyecto puede servir de antecedente para mostrar lo lineamientos generales a tener en cuenta para el desarrollo de la tecnología en la industria automotriz. El descubrimiento de patrones de comportamiento de las averías o los resultados estadísticos en la explotación de datos realizada en este trabajo permite definir el camino que se debe seguir para la realización de presupuestos y la definición de políticas de distribución de los operadores logísticos encargados de los movimientos de los automóviles 0 KM. Teniendo en consideración que el costo de producción de las unidades es menor al costo de su posterior distribución desde que sale de línea de producción hasta que llega a su destino final, hace de la minería de datos con técnicas estadísticas e inteligentes una alternativa más que importante para ser desarrollada por las empresas interesadas en el descubrimiento de patrones de comportamiento como así también en el control y asignación de responsabilidad por siniestralidad.

Page 257: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 256 de287 Ing. Hugo Daniel Flores

Page 258: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 257 de287 Ing. Hugo Daniel Flores

10. Líneas futuras de investigación Las líneas futuras de investigación pueden ser las siguientes:

• Implementación de la metodología para el estudio de comportamiento de averías agrupando la información por empresas responsables de siniestros.

• Desarrollo de la metodología con información extraída de base de datos con otros estándares de inspección de unidades. Se recuerda que cada compañía puede tener su propio estándar de inspección el cual define el formato en el que los registros pueden ser explotados.

• Al igual que la implementación por empresas responsables también se puede procesar la información para determinadas marcas o modelos de autos.

• Implementación de proyecto con datos agrupados en función de la imputabilidad también es otra futura línea de investigación viable.

• Con la aplicación del Modelo de Clasificación se puede extraer todo el conjunto de reglas de negocio generado para ser aplicado en el software tanto de captura de datos como en la aplicación que alimenta la base de datos. Esto es, a partir de las reglas generadas por el modelo validar todos los datos que ingresan al sistema.

• Como se ha mencionado en otros ítems a lo largo de esta tesis también es viable la explotación de datos de este sistema de información considerando cada uno de los puntos de control por separado.

• El Modelo de Clstering también puede ser considerado definiendo matrices de menor tamaño.

En cuanto a la utilización de nuevas herramientas o herramientas complementarias para el tratamiento de la información en esta industria es necesario hacer mención como posibles líneas futuras de investigación la utilización de algoritmos de inducción. Tanto en el Clustering como en el Modelo de Predicción los resultados obtenidos hacen hincapié fundamentalmente en sus valores numéricos y no en la relación entre los atributos. O sea que antes de dar los resultados finales de la aplicación de cada modelo sería conveniente una introducción previa de los mismos en algoritmos que permitan una aproximación más cercana a la realidad en lo referente a la relación entre los datos procesados. Concluyendo con los posibles caminos de investigación se puede hacer referencia a que en esta industria uno de los sistemas de información estándares en el mundo (seguimiento y control de unidades automotrices) es el que se ha expuesto en el presente proyecto. Con la información normalizada electrónicamente es posible su estudio y explotación con la aplicación de la metodología CRISP-DM considerando diferentes tipos de agrupación de datos y distintas herramientas de software para obtener resultados exitosos para los interesados.

Page 259: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 258 de287 Ing. Hugo Daniel Flores

Page 260: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 259 de287 Ing. Hugo Daniel Flores

11. Bibliografías y Documentación Britos, P., et al, Minería de Datos, Basada en Sistemas Inteligentes (Editorial Nueva Librería, 2005). De Ville, B., Microsoft Data Mining: Integrated Business Intelligence for e-Commerce and Knowledge Management (Butterworth-Heinemann, 2001). Diché, J., E-data, Transformando datos en información con Data Warehouse (Editorial Prentice Hall, 2001). Gill, H. y Rao, P., Data Warehousing, la integración de información para la mejor toma de decisiones (Editorial Prentice Hall 1996). Groth, R., Data Mining: A Hands-On Approach for Business Professionals (Editorial Prentice Hall PTR, 1998). Han, J. y Kamber, M., Data Mining: Concepts and Techniques (Editorial Morgan Kauffman Publishers, 2001). Hernández, O., Introducción a la Minería de Datos (Editorial Pearson Educion, 2004). Hornick, F., et al, Java Data Mining: Strategy, Standard, and Practice: A Practical Guide for architecture, design, and implementation (The Morgan Kaufmann Series in Data Management Systems) (Elsevier Inc., 2007). Inmon, W., Building the Data Warehouse (Editorial John Wiley & Sons, Inc., 2002). Jean-Michel Franco y EDS-Instituc Prometheus, El Data Warehouse, El Data Minning (Ediciones Gestión 2000, 1997). Jean-Pasal, A., Inteligencia Artificial (Editorial Paraninfo, 1986). Larose, T., Data Mining Methods and Models (John Wiley & Sons, Inc., 2006). Mccorduck, P., Máquinas que piensan, historia de la Inteligencia Artificial (Editorial Tecnos, 1991). Mundy, J., et al, The Microsoft Data Warehouse Toolkit: With SQL Server 2005 and the Microsoft Business Intelligence Toolset (Wiley Publishing, Inc., 2006). Nilsson Nils, J., Inteligencia Artificial Una Nueva Síntesis (Editorial MCGrow-Hill, 2001). Pajares Martinsanz, G., Inteligencia Artificial e Ingeniería del Conocimiento (Editorial Alfaomega Grupo Editor, 2006). Peña, D., Análisis de datos Multivariantes (Editorial McGraw Hill/Interamericana de España, 2002). Pérez López, C. y Santin Gonzalez, D., Minería de Datos, Técnicas y Herramientas (Editorial Paraninfo, 2007). Russel, S y Norvig P., Inteligencia Artificial - Un Enfoque Moderno (Editorial. Pearson Education, 2003). Singh, H., Data Warehousing (Editorial Prentice Hall, 1998). Sitio de ADEFA (Asociación de Fábricas de Automotores) http://www.adefa.com.ar (Octubre, 2007). Sitio de comunidad de personas interesadas en compartir conocimiento sobre temas relacionados con los datos, y como tratarlos para transformarlos en información que a su vez nos permita obtener conocimiento y saber: http://www.dataprix.com/categorias-de-dataprix. Sitio de Estadística (Metodología para el desarrollo de proyectos de Data Mining) http://www.estadistico.com/arts.html?20040426 (Septiembre, 2007). Sitio de ITBA (Instituto Tecnológico Buenos Aires, Centro de Ingeniería de Software e Ingeniería del Conocimiento, Escuela de Postgrado) http://www.itba.edu.ar/capis/webcapis/planma-esp.html (Septiembre de 2007). Sitio de Metodología CRISP-DM (Cross Industry Standard Process for Data Mining) http://www.crisp-dm.org (Agosto, 2007). Sitio de Microsoft http://technet.microsoft.com/es-es/library/ms174861.aspx (Octubre, 2007). Sitio de SAMAS (Sociedad Argentina de Mastología) http://www.samas.org.ar (Agosto, 2007).

Page 261: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 260 de287 Ing. Hugo Daniel Flores

Sitio de SECYT (Biblioteca Electrónica de Ciencia y Tecnología) http://www.biblioteca.secyt.gov.ar (Agosto, 2007). Sitio de Universidad de Sevilla http://www.us.edu.es (Septiembre, 2007). Sitio de Universidad Politécnica de Madrid http://www.upm.es (Septiembre, 2007). Sitio de Universidad Politécnica de Valencia http://www.upv.es (Septiembre, 2007). Tang, Z. and MacLennan, J., (Author), Data Mining with SQL Server 2005 (Wiley Publishing, Inc., 2005).

Page 262: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 261 de287 Ing. Hugo Daniel Flores

12. Anexos Anexo 1: Terminología de negocio.

Término Significado Area Parte de un vehículo. Avería Tipo de daño. Bajada de buque Operación de translado de un auto desde un barco hacia

el puerto. Barcaza Buque específicamente usado para transporte de autos. Batea Camión con estructura para transporte de vehículos. Buque Barco especial acondicionada y dimensionada para el

transporte de automóviles, camiones, tractores, etc. Cadena logística Conjunto de lugares por donde va pasando una

determinada unidad automotriz. Check point Punto de control. Códificación de avería Sistema de código establecido para tomar un daños. Por

ej. Parte + Avería + Gravedad. Colector de datos Equipo electrónico de datos con lector de código de

barras. CP Punto de control. Dealer Punto final de distribución de una cadena logística. Estándar de inspección Conjunto de reglas para establecer un criterio de

inspección donde se especifica como inspeccionar y define como son las averías en función de un nivel de importancia.

Gravedad Nivel de un daño. Hand held Colector de datos elctrónico con lector de código de

barras. Ingreso a puerto Entrada de autos a la playa de un puerto. Línea de producción Fábrica donde se producen los autos. Línea de transferencia Lugar donde se transfiere una unidad luego de su salida

de planta. Patio Lugar donde se almacenan vehículos. Perito Inspector que verifica estado de un vehículo. Perito naval Persona que realiza inspección de barcos y sus cargas. Playa Lugar donde se almacenan vehículos. Proyección Tipo de daño colectivo que provine de una variedad de

acciones. Retiro de puerto Salida de autos de la playa de un puerto. Severidad Gravedad de un daño. Spoiler Alerón u otro elemento de la carrocería de un automóvil

que sirve para hacerlo más aerodinámico. Subida a buque Operación de translado de un auto desde la playade

puerto hacia un barco.

Page 263: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 262 de287 Ing. Hugo Daniel Flores

Survey Operación de inspección autos. Surveyor Persona que realiza un inspacción de un auto. Transponder Dispositivo a bordo de un auto que recibe señales de

radio correspondientes a una banda de frecuencias determinada, las amplifica y desplaza su frecuencia a otra del espectro y la retransmite.

Transporte marítimo Sistema de traslado de autos por mar. Transporte terrestre Sistema de traslado de autos por tierra. Trincado Forma de amarrar un auto al piso de un buque.

Anexo 2: Terminología de minería de datos.

Término Significado Algoritmos genéticos Técnicas de optimización que usan procesos tales como

combinación genética, mutación y selección natural en un diseño basado en los conceptos de evolución natural.

Análisis de series de tiempo (time-series)

Análisis de una secuencia de medidas hechas a intervalos específicos. El tiempo es usualmente la dimensión dominanate de los datos.

Análisis exploratorio de datos

Uso de técnicas estadísticas tanto gráficas como descriptivas para aprender acerca de la estructura de un conjunto de datos.

Análisis prospectivo de datos

Análisis de datos que predice futuras tendencias, comportamientos o eventos basado en datos históticos.

Análisis retrospectivo de datos

Análisis de datos que provee una visión de las tendencias, comportamientos o eventos basado en datos históricos.

Árbol de decisión Estructura en forma de árbol que representa un conjunto de decisiones. Estas decisiones generan reglas para la clasificación de un conjunto de datos.

Base de datos multidimensional

Base de datos diseñada para procesamiento analítico on-line (OLAP). Estructurada como un hipercubo con un eje por dimensión.

CART Árboles de clasificación y regresión

Una técnica de árbol de decisión usada para la clasificación de un conjunto da datos. Provee un conjunto de reglas que se pueden aplicar a un nuevo (sin clasificar) conjunto de datos para predecir cuáles registros darán un cierto resultado. Segmenta un conjunto de datos creando 2 divisiones. Requiere menos preparación de datos que CHAID .

CHAID Detección de interacción automática de Chi cuadrado

Una técnica de árbol de decisión usada para la clasificación de un conjunto da datos. Provee un conjunto de reglas que se pueden aplicar a un nuevo (sin clasificar) conjunto de datos para predecir cuáles registros darán un cierto resultado. Segmenta un conjunto de datos utilizando tests de chi cuadrado para crear múltiples divisiones. Antecede, y requiere más preparación de datos, que CART.

Page 264: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 263 de287 Ing. Hugo Daniel Flores

Clasificación Proceso de dividir un conjunto de datos en grupos mutuamente excluyentes de tal manera que cada miembro de un grupo esté lo "más cercano" posible a otro, y grupos diferentes estén lo "más lejos" posible uno del otro, donde la distancia está medida con respecto a variable(s) específica(s) las cuales se están tratando de predecir. Por ejemplo, un problema típico de clasificación es el de dividir una base de datos de compañías en grupos que son lo más homogéneos posibles con respecto a variables como "posibilidades de crédito" con valores tales como "Bueno" y "Malo".

Clustering (agrupamiento)

Proceso de dividir un conjunto de datos en grupos mutuamente excluyentes de tal manera que cada miembro de un grupo esté lo "más cercano" posible a otro, y grupos diferentes estén lo "más lejos" posible uno del otro, donde la distancia está medida con respecto a todas las variables disponibles.

Computadoras con multiprocesadores

Una computadora que incluye múltiples procesadores conectados por una red.

Data cleansing Proceso de asegurar que todos los valores en un conjunto de datos sean consistentes y correctamente registrados.

Data Mining La extracción de información predecible escondida en grandes bases de datos.

Data Warehouse Sistema para el almacenamiento y distribución de cantdades masivas de datos.

Datos anormales Datos que resultan de errores (por ej. errores en el tipeado durante la carga) o que representan eventos inusuales.

Dimensión En una base de datos relacional o plana, cada campo en un registro representa una dimensión. En una base de datos multidimensional, una dimensión es un conjunto de entidades similares; por ej. una base de datos multidimensional de ventas podría incluir las dimensiones Producto, Tiempo y Ciudad.

Modelo analítico Una estructura y proceso para analizar un conjunto de datos. Por ejemplo, un árbol de decisión es un modelo para la clasificación de un conjunto de datos.

Modelo lineal Un modelo analítico que asume relaciones lineales entre una variable seleccionada (dependiente) y sus predictores (variables independientes).

Modelo no lineal Un modelo analítico que no asume una relación lineal en los coeficientes de las variables que son estudiadas.

Modelo predictivo Estructura y proceso para predecir valores de variables especificadas en un conjunto de datos.

Navegación de datos Proceso de visualizar diferentes dimensiones, "fetas" y niveles de una base de datos multidimensional.

OLAP Procesamiento analítico on-line (On Line Analitic prossesing)

Se refiere a aplicaciones de bases de datos orientadas a array que permite a los usuarios ver, navegar, manipular y analizar bases de datos multidimensionales.

Page 265: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 264 de287 Ing. Hugo Daniel Flores

Outlier Un item de datos cuyo valor cae fuera de los límites que encierran a la mayoría del resto de los valores correspondientes de la muestra. Puede indicar datos anormales. Deberían ser examinados detenidamente; pueden dar importante información.

Procesamiento paralelo Uso coordinado de múltiples procesadores para realizar tareas computacionales. El procesamiento paralelo puede ocurrir en una computadora con múltiples procesadores o en una red de estaciones de trabajo o PCs.

RAID Formación redundante de discos baratos (Redundant Array of inexpensive disks). Tecnología para el almacenamiento paralelo eficiente de datos en sistemas de computadoras de alto rendimiento.

Regresión lineal Técnica estadística utilizada para encontrar la mejor relación lineal que encaja entre una variable seleccionada (dependiente) y sus predicados (variables independientes).

Regresión logística Una regresión lineal que predice las proporciones de una variable seleccionada categórica, tal como Tipo de Consumidor, en una población.

SMP Multiprocesador simétrico (Symmetric multiprocessor)

Tipo de computadora con multiprocesadores en la cual la memoria es compartida entre los procesadores.

Vecino más cercano Técnica que clasifica cada registro en un conjunto de datos basado en una combinación de las clases del/de los k registro (s) más similar/es a él en un conjunto de datos históricos (donde k = 1). Algunas veces se llama la técnica del vecino k-más cercano.

Anexo 3: Consultas estructuradas para base de datos. /*cantidad de inspecciones total*/ select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20030101' and '20080631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') /*cantidad de inspecciones por periodo*/ select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20030101' and '20031231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')

Page 266: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 265 de287 Ing. Hugo Daniel Flores

select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20040101' and '20040631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20040701' and '20041231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20050101' and '20050631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20050701' and '20051231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20060101' and '20060631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or

Page 267: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 266 de287 Ing. Hugo Daniel Flores

operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20060701' and '20061231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20070101' and '20070631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20070701' and '20071231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20080101' and '20080631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis, operativos_chasis.idoperativo from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20080701' and '20081231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') /*cantidad de unidades total*/ select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20030101' and '20080631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')

Page 268: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 267 de287 Ing. Hugo Daniel Flores

/*cantidad de unidades por periodo*/ select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20030101' and '20031231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20040101' and '20040631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20040701' and '20041231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20050101' and '20050631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20050701' and '20051231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo

Page 269: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 268 de287 Ing. Hugo Daniel Flores

and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20060101' and '20060631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20060701' and '20061231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20070101' and '20070631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20070701' and '20071231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20080101' and '20080631' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20080701' and '20081231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a')

Page 270: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 269 de287 Ing. Hugo Daniel Flores

/*cantidad de modelos*/ select distinct operativos_chasis.idchasis from chasis inner join operativos_chasis on operativos_chasis.idchasis=chasis.idchasis inner join operativos on operativos.idoperativo=operativos_chasis.idoperativo and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) where operativos.fechaoperativo between '20030101' and '20031231' and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') and chasis.modelo='307' /*cantidad de abollados*/ select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=54 and idaveria=6 select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=51 and idaveria=6 and chasis.modelo='boxer' select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=3 and idaveria=6 and (operativos.idcp=30)

Page 271: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 270 de287 Ing. Hugo Daniel Flores

select idaveria, idarea, count(iddanio) from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idaveria=6 group by idaveria, idarea order by idaveria, idarea /*cantidad de rayados*/ select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=13 and idaveria=9 select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=51 and idaveria=9 and chasis.modelo='307' select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=8

Page 272: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 271 de287 Ing. Hugo Daniel Flores

and idaveria=9 and (operativos.idcp=10 or operativos.idcp=300) select idaveria, idarea, count(iddanio) from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idaveria=9 group by idaveria, idarea order by idaveria, idarea /*cantidad de pintura*/ select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=73 and idaveria=5 select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis where idarea=35 and idaveria=5 and chasis.modelo='c4' select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=6

Page 273: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 272 de287 Ing. Hugo Daniel Flores

and idaveria=5 and (operativos.idcp=360 or operativos.idcp=360) select idaveria, idarea, count(iddanio) from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idaveria=5 group by idaveria, idarea order by idaveria, idarea /*cantidad de faltantes*/ select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=41 and idaveria=7 select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=34 and idaveria=7 and chasis.modelo='c3' select * from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis

Page 274: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 273 de287 Ing. Hugo Daniel Flores

and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idarea=43 and idaveria=7 and (operativos.idcp=420 or operativos.idcp=420) select idaveria, idarea, count(iddanio) from danios inner join operativos on operativos.idoperativo=danios.idoperativo and operativos.fechaoperativo between '20030101' and '20080630' and (operativos.idcp=300 or operativos.idcp=360 or operativos.idcp=420 or operativos.idcp=10 or operativos.idcp=25 or operativos.idcp=30 or operativos.idcp=60) inner join chasis on chasis.idchasis=danios.idchasis and (left(chasis.vin,2)='93' or left(chasis.vin,2)='8b' or left(chasis.vin,2)='vf' or left(chasis.vin,2)='8a') where idaveria=7 group by idaveria, idarea order by idaveria, idarea Anexo 4: Codificación Modelos de autos.

Código Desccripción1 Modelo 1 2 Modelo 2 3 Modelo 3 4 Modelo 4 5 Modelo 5 6 Modelo 6 7 Modelo 7 8 Modelo 8 9 Modelo 9

10 Modelo 10 11 Modelo 11 12 Modelo 12 13 Modelo 13 14 Modelo 14 15 Modelo 15 16 Modelo 16 17 Modelo 17 18 Modelo 18 19 Modelo 19 20 Modelo 20

Códigos de puntos de control

Page 275: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 274 de287 Ing. Hugo Daniel Flores

Código Descripción 30 Bajada de Buque

300 Transferencia ubicación y línea de carga 420 Subida a Buque 60 Retiro de Puerto 10 Retiro Fábrica de Origen 25 Subida Buque Puerto de Origen

360 Ingreso a Puerto Códigos de tipos de transportes.

Código Descripción 30 Transporte marítimo

300 Transporte terrestre 420 Transporte terrestre 60 Transporte terrestre 10 Transporte terrestre 25 Transporte terrestre

360 Transporte terrestre Códigos de partes.

Código Descripción 1 Spoiler delantero 2 Paragolpe delantero / Protector delantero 3 Capot 4 Paragolpe delantero / Superior 5 Parante delantero 6 Techo (inclusive convertible) 7 Techo corredizo 8 Barras de techo 9 Tapa posterior de techo

10 Parabrisa 11 Tapa de Baúl o Puerta Trasera 12 Paragolpe trasero / Spoiler trasero 13 Panel trasero bajo baúl 14 Paragolpe trasero / Zona contacto 15 Tapizado interno puerta delantera izquierda 16 Zócalo interno puerta delantera izquierda 17 Manijas externas de puertas delanteras 18 Manijas externas de puertas traseras 19 Aerosol antipinchazos 20 Transponder 21 Antena

Page 276: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 275 de287 Ing. Hugo Daniel Flores

22 Faldillas para barro 23 Limpiador de Faros (derecho / izquierdo) 24 Limpiador y lavador de parabrisas 25 Limpiador y lavador de vidrios traseros 26 Alerón 27 Taza 28 Alfombra suplementarias 29 Manual 30 Retrovisor externo derecho 31 Guardabarro delantero derecho 32 Llanta delantera derecha 33 Cubierta delantera derecha 34 Zócalo derecho 35 Guardabarro trasero derecho 36 Puerta delantera derecha 37 Puerta trasera derecha 38 Panel lateral derecho 39 Moldura protectora lateral derecha 40 Giro Delantero (derecho / izquierdo) 41 Cristales de parante delantero 42 Escape 43 Tapa acceso gancho remolque 44 Bolsa de herramientas 45 Otros 46 Llave 47 Parrilla delantera 48 Luz de neblina trasera 49 Faro de stop luneta 50 Retrovisor externo izquierdo 51 Guardabarro delantero izquierdo 52 Llanta delantera izquierda 53 Cubierta delantera izquierda 54 Zócalo izquierdo 55 Guardabarros y parante trasero izquierdo 56 Puerta delantera izquierda 57 Puerta trasera izquierda 58 Panel lateral izquierdo 59 Moldura protectora lateral izquierda 60 Tapa tanque combustible 61 Insignia 62 Alfombra baúl / caja de carga 63 Luz de patente trasera 64 Cable de carga 65 Luz trasera izquierda

Page 277: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 276 de287 Ing. Hugo Daniel Flores

66 Cristales parante trasero / fijos 67 Cristales fijos / Móviles paneles 68 Plip 69 Cerraduras de puertas 70 Bajo chasis trasero 71 Bajo chasis delantero 72 Asientos delanteros / traseros 73 Llanta trasera derecha 74 Cubierta trasera derecha 75 Giro guardabarros delantero derecho / izquierdo 76 Faro delantero izquierdo / derecho 77 Faro antiniebla / largo alcance 78 Rejilla retenedora de carga 79 Separador interno de carga 80 Luneta trasera / Cristal puerta trasera 81 Llave de rueda 82 Cristales de puertas delanteras 83 Cristales de puertas traseras 84 Encendedor 85 Sistema de navegación 86 Stereo / Radio 87 Compactera / Porta CD 88 Apoya cabezas delantero / izquierdo / derecho

89 Apoya cabezas trasero / izquierdo / centro / derecho

90 Conjunto carroceria 91 Batería 92 Críquet 93 Llanta trasera izquierda 94 Cubierta trasera izquierda 95 Rueda de auxilio 96 Gancho de remolque 97 xxxxxxxxxx 98 Botiquín 99 -

Códigos de tipos de averías.

Código Descripción 1 Quemado 2 Arrancado - Roto - Fisurado 3 Desgarrado - Cortado 4 Reventado - Estallado 5 Pintura saltada

Page 278: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 277 de287 Ing. Hugo Daniel Flores

6 Abollado 7 Faltante 8 Proyección 9 Rayado - Rozado

10 Manchado 11 Exceso kilometraje

Códigos de gravedades.

Código Descripción1 Intolerable 2 Grave 3 Mediano 4 Leve

20 Observada 21 -

Anexo 5: Presentación final. Carátula

Presentación Final

Detección de Patrones para la Prevención de Daños y/o Averías

Ing. Hugo Daniel Flores Página 1

Presentación

• Detección de Patrones para la Prevención de Daños y/o Averías en Automóviles 0 KM.

• Metodología de desarrollo de minería de datos. • Metodología CRISP-DM. • Desarrollo de la industria automotriz. • Procesos en la industria automotriz • Información de la industria automotriz • Aplicación de metodología de desarrollo de minería de datos. • Conclusión.

Página 2

Objetivos

1. Identificar daños y/o averías. 2. Determinar responsabilidad de siniestralidad en función del tipo de avería y tipo de

transporte.

Page 279: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 278 de287 Ing. Hugo Daniel Flores

3. Imputar incidentes según el tipo de transporte. 4. Determinar tipos de averías y/o daños. 5. Determinar partes averiadas y/o dañadas que muestren algún tipo de comportamiento. 6. Especificar gravedad de daños y/o averías. 7. Definir e identificar modelos con daños especificando partes, tipo de daño y gravedad. 8. Especificar lugares donde se producen daños y/o averías tratando de definir patrones de

comportamiento. 9. Especificar estadísticamente: tipos de transporte que producen daños y/o averías como así

también, partes, tipos de averías, gravedades, lugares donde se producen. 10. Descubrir información “oculta” en función de los modelos generados a partir de los datos

disponibles. Página 3

Tecnología Minería de Datos Es un proceso con el cual se pueden descubrir y cuantificar relaciones predictivas en los datos con la aplicación de un conjunto de técnicas, y del resultado de este proceso es posible obtener conocimiento útil para el negocio. Técnicas de Mineria de Datos Análisis estadístico Se preocupa por el poder de generalización de los resultados obtenidos para poder inferir los resultados a situaciones más generales que la estudiada. Análisis con sistemas inteligentes Se preocupa por ofrecer soluciones algorítmicas con un coste computacional aceptable. Página 4

Tecnología Metodologías de Minería de Datos Metodología SEMMA

1. Muestreo 2. Exploración 3. Manipulación 4. Modelado 5. Valoración

Metodología MS

1. Definición del problema 2. Preparación de datos 3. Exploración de datos 4. Generación del modelos 5. Validación del modelos 6. Implementación y actualización de los modelos

Página 5

Page 280: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 279 de287 Ing. Hugo Daniel Flores

Tecnología Metodología CRISP-DM

1. Análisis del problema 2. Análisis de datos 3. Preparación de datos 4. Modelado 5. Explotación 6. Evaluación

Página 6

Metodología CRISP-DM Fue concebido a finales de 1996. Daimler Chrysler (entonces Daimler-Benz) estaba delante de la mayoría de las organizaciones industriales y comerciales en la aplicación de la minería de datos en sus operaciones de negocios. Introducción

1. La metodología CRISP-DM 2. Pasaje de modelos genéricos a modelos especializados

Modelo de referencia

1. Comprensión del negocio 2. Comprensión de datos 3. Preparación de datos 4. Modelado 5. Evaluación 6. Desarrollo

Página 7

Metodología CRISP-DM Guía de usuario

Comprendiendo el negocio Comprensión de datos Preparación de los datos Modelado Evaluación Desarrollo

Salidas

Comprensión del negocio Comprensión de datos Preparación de los datos Modelado Evaluación Desarrollo Resumen de dependencias

Page 281: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 280 de287 Ing. Hugo Daniel Flores

Página 8 Metodología CRISP-DM

Apéndice

Glosario/Terminología Tipos de problemas de minería de datos

Página 9

Industria automotriz

1. La industria automotriz y la identificación de daños y/o averías. 2. Globalización de marcas. 3. Diversificación de modelos. 4. Especialización en producción de modelos. 5. Desarrollo de tecnología de las comunicaciones y medios de transportes. 6. Implementación de controles. 7. Reducción de costos. 8. Incorporación de operadores logísticos. 9. Tercerización de sistemas de transporte y lugares de almacenamiento. 10. Puntos de control estratégicos. 11. Creación de los estándares de inspección: 12. Procedimientos de inspección. 13. Sistemas codificación de daños y/o averías. 14. Circuitos logísticos

Página 10

Industria Circuitos logísticos Exportación

Importación

Page 282: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 281 de287 Ing. Hugo Daniel Flores

Página 11 Procesos, Información y Datos

Puntos de control Los check points son los nodos de las cadenas logísticas que conforman lo circuitos que recorren las unidades desde que salen de producción hasta que llegan a su destino final. Estándares de inspección En cada punto de control se realiza la inspección de unidades según un conjunto de reglas o procedimientos especificados por el estándar de inspección. Captura de datos Normalmente en la industria los datos son tomados por lectores de código de barras debido a que toda unidad viene con una hoja detallada donde se indica el código de barras con datos relacionados al vehículo. Procesamiento de datos Los datos son tomados donde se realiza cada inspección y luego son almacenados en una base de datos. Actualmente hay dos sistemas de almacenamiento uno en batch y otro de línea a través de radiofrecuencia. Base de datos Sistema de datos estructurado y normalizado. Página 12

Aplicación de la metodología CRISP-DM Comprensión del negocio El objetivo del negocio es determinar comportamientos en la ocurrencia de daños y/o averías. De esto último también se puede inferir que es de utilidad para la toma de decisiones el poder determinar o definir los lugares donde se producen los daños y las imputaciones de las mismas. Comprensión de datos Identificación de autos, modelos, lugares, tipos de trasportes, empresas, partes, averías, gravedades, observación, fechas. Preparación de datos Número de chasis, Modelo, Fecha, Lugar, Parte, Tipo Avería, Gravedad, Observación. Página 13

Aplicación de la metodología CRISP-DM Modelado El conjunto de datos de entrenamiento fue almacenado en archivos con formato de hoja de cálculo y se dividió en función de los períodos establecidos previamente para el presente proyecto. Las cantidades de datos de entrenamiento para los respectivos modelos es variable en función del software utilizado, lo cual fue especificado previamente. Evaluación La ejecución de los modelos ha generado los datos esperados en función de los objetivos de negocio establecidos previamente para el proyecto. Si bien en el primer análisis se pudo decir que

Page 283: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 282 de287 Ing. Hugo Daniel Flores

se han cubierto todas las alternativas para lograr los objetivos de negocio y de minería de datos no se descartó la posibilidad de arribar a nuevas preguntas de negocio o nuevas aproximaciones de resultados. Página 14

Aplicación de la metodología CRISP-DM Desarrollo Árbol de Clasificación Construcción de un árbol que en cada nodo establece condiciones sobre atributos, divide el conjunto de casos en subconjuntos que cumplen cada condición. Los subconjuntos se vuelven a dividir añadiendo nuevos niveles al árbol hasta detenerse mediante algún criterio. Agrupamiento Técnica que agrupa los datos en función de una distancia sin utilizar ningún tipo de información externa para organizar los grupos. Modelo de Clasificación La diferencia con la primera técnica está en que en la predicción el atributo objetivo no es un atributo cualitativo discreto, sino es uno continuo. El objetivo de la predicción esta en encontrar el valor numérico del atributo objetivo para objetos no vistos. Página 15

Aplicación de la metodología CRISP-DM Desarrollo

Página 16

Aplicación de la metodología CRISP-DM

Tipos de Averías

0

1000

2000

3000

4000

5000

6000

Period o

Faltante 494 184 274 264 240 247 339 605 641 1771

Pintura saltada 935 790 812 598 490 271 136 237 609 334

Rayado - Rozado 2023 1628 1794 1792 1887 1499 1207 1278 4689 2223

Abollado 5338 2855 2375 1099 1126 1681 780 761 1016 751

2003 Semestre 1-04 Semestre 2-04 Semestre 1-05 Semestre 2-05 Semestre 1-06 Semestre 2-06 Semestre 1-07 Semestre 2-07 Semestre 1-08

Page 284: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 283 de287 Ing. Hugo Daniel Flores

Desarrollo

Página 17

Aplicación de la metodología CRISP-DM Desarrollo

Página 18

Aplicación de la metodología CRISP-DM Desarrollo Abollados

Capot, Observada.

Modelos

0

500

1000

1500

2000

2500

3000

3500

4000

4500

Periodo

M odelo 9 4143 1785 833 433 469 789 170 209 156 142

M odelo 17 2662 2616 3041 2002 1795 1482 260 125 30 38

M odelo 5 595 244 252 200 398 533 565 712 839 433

M odelo 20 546 319 632 574 266 441 1268 1403 3819 2571

M odelo 18 467 28 40 86 39 10 29 37 36 21

M odelo 13 436 562 457 35 70 125 106 270 358 190

M odelo 7 0 0 0 0 0 0 2 94 1747 1883

M odelo 8 0 0 0 465 608 285 28 88 75 26

2003 Semestre 1-04 Semestre 2-04 Semestre 1-05 Semestre 2-05 Semestre 1-06 Semestre 2-06 Semestre 1-07 Semestre 2-07 Semestre 1-08

Lugares

0

1000

2000

3000

4000

5000

6000

7000

8000

Period o

Subida a Buque 104 82 228 201 104 138 265 95 523 633

Retiro de Puerto 352 89 71 137 248 187 119 156 60 124

Ingreso a Puerto 443 343 491 510 550 497 1069 575 1167 958

Salida de Planta 511 69 53 642 1003 767 454 1457 4521 3020

Bajada de Buque 942 343 505 570 758 580 547 219 282 318

Subida Buque Puerto de Origen 6925 4741 4008 1849 1208 1585 144 517 635 454

2003 Semestre 1-04 Semestre 2-04 Semestre 1-05 Semestre 2-05 Semestre 1-06 Semestre 2-06 Semestre 1-07 Semestre 2-07 Semestre 1-08

Page 285: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 284 de287 Ing. Hugo Daniel Flores

Capot. Leve. Observada. Transferencia ubicación y línea de carga.

Página 19

Aplicación de la metodología CRISP-DM Desarrollo Rayados o rozados

Manijas externas de puertas traseras, Mediano. Panel trasero bajo baúl, Observada. Spoiler delantero, Observada. Tapa posterior de techo, Observada. Paragolpe delantero / Protector delantero, Observada. Paragolpe delantero / Superior, Mediano. Tapizado interno puerta delantera izquierda. Paragolpe delantero / Superior. Manijas externas de puertas traseras. Panel trasero bajo baúl. Paragolpe delantero / Protector delantero. Paragolpe delantero / Superior. Spoiler delantero. Tapa posterior de techo. Tapizado interno puerta delantera izquierda.

Página 20

Aplicación de la metodología CRISP-DM Desarrollo Faltantes

Manijas externas de puertas delanteras, Observada. Manijas externas de puertas delanteras. Grave. Leve. Observada. Modelo 8. Subida a Buque, Tapa acceso gancho remolque.

Página 21

Aplicación de la metodología CRISP-DM Desarrollo Pintura saltada

Llanta trasera derecha, Observada. Paragolpe delantero / Protector delantero, Observada. Guardabarro trasero derecho.

Page 286: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 285 de287 Ing. Hugo Daniel Flores

Llanta trasera derecha. Paragolpe delantero / Protector delantero. Mediano. Observada. Modelo 17, Llanta delantera derecha. Modelo 9, Mediano.

Página 22

Aplicación de la metodología CRISP-DM Desarrollo Predicción

Aerosol antipinchazos Alerón Cubierta delantera derecha Escape Guardabarro delantero derecho Guardabarro trasero derecho Llanta delantera derecha Llave Manijas externas de puertas traseras Manual Panel trasero bajo baúl Puerta delantera derecha Puerta trasera derecha Tapa acceso gancho remolque Taza

Página 23

Conclusión

1. La metodología CRISP DM es aplicable a la industria. 2. La aplicación de las técnicas de Árbol de Clasificación, Clustering y Modelo de Predicción

permiten obtener resultados satisfactorios. 3. Resulta óptimo el desarrollo y ejecución de la metodología en periodos semestrales. 4. La explotación de datos puede tomar diferentes formas: por periodos diferentes, modelos o

empresas específicas, puntos de control, tipos de averías o partes averiadas. 5. Los resultados obtenidos de la minería de datos pueden ser de utilidad para el desarrollo de

sistemas de información. 6. En referencia a los datos y estructura de datos de los sistemas de base de datos desde donde

se ha tomado la información se puede observar que los mismos son satisfactorios. Página 24

Conclusión En cuanto a los objetivos los mismos han sido logrados:

• Se han identificado daños y/o averías. • Se han determinado las responsabilidades en función de la avería y tipos de

transporte.

Page 287: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 286 de287 Ing. Hugo Daniel Flores

• Las imputaciones de los incidentes según el tipo de transporte se han establecido. • Se han determinado los tipos de averías y/o daños. • Se han determinado las partes averiadas y se ha podido establecer sus

comportamientos. • Se han especificado gravedades de daños y/o averías. • Se han definido e identificado los modelos de autos con daños especificando partes,

tipo de daño y gravedad. • Se han especificado lugares donde se producen daños y/o averías y se han definido

patrones de comportamiento. • Se han especificado estadísticamente tipos de transporte que producen daños y/o

averías como así también, partes, tipos de averías, gravedades, lugares donde se producen.

Page 288: TESIS de Maestría en Ingeniería en Sistemas de … · Universidad Tecnológica Nacional Facultad Regional Buenos Aires Dirección de Posgrado TESIS de Maestría en Ingeniería en

DETECCION DE PATRONES DE DAÑOS Y/O AVERÍAS

Página 287 de287 Ing. Hugo Daniel Flores