69
Equation Chapter 1 Section 1 Trabajo Fin de Grado Grado en Ingeniería de la Energía Técnicas de reconciliación de datos: Aplicación a industria Dep. Ingeniería Energética Escuela Técnica Superior de Ingeniería Universidad de Sevilla Autor: Marcos González Fernández Tutor: David Velázquez Alonso Sevilla, 2016

Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Embed Size (px)

Citation preview

Page 1: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Equation Chapter 1 Section 1

Trabajo Fin de Grado

Grado en Ingeniería de la Energía

Técnicas de reconciliación de datos: Aplicación a

industria

Dep. Ingeniería Energética

Escuela Técnica Superior de Ingeniería

Universidad de Sevilla

Autor: Marcos González Fernández

Tutor: David Velázquez Alonso

Sevilla, 2016

Page 2: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar
Page 3: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

iii

Trabajo Fin de Grado

Grado en Ingeniería de la Energía

Técnicas de reconciliación de datos: Aplicación a

industria

Autor:

Marcos González Fernández

Tutor:

David Velázquez Alonso

Profesor titular

Dep. Ingeniería Energética

Escuela Técnica Superior de Ingeniería

Universidad de Sevilla

Sevilla, 2016

Page 4: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar
Page 5: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

v

Trabajo Fin de Grado: Técnicas de reconciliación de datos: Aplicación a industria

Autor: Marcos González Fernández

Tutor: David Velázquez Alonso

El tribunal nombrado para juzgar el Proyecto arriba indicado, compuesto por los siguientes miembros:

Presidente:

Vocales:

Secretario:

Acuerdan otorgarle la calificación de:

Sevilla, 2016

Page 6: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

El Secretario del Tribunal

Page 7: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

vii

A la mínima persona que, en

alguna ocasión, haya despertado

en mi un afán de conocimiento.

Page 8: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar
Page 9: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

ix

Agradecimientos

a terminación del Trabajo Fin de Grado trae consigo numerosas implicaciones personales, ya

que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar una

meta clara: convertirme en ingeniero. Esta tarea no es nada sencilla, más aún teniendo cuenta

los tiempos que corren, los cuales hacen que asumir económicamente los vaivenes de una carrera sea cada

vez más complicado. Es por esto por lo que, en primer lugar, me veo obligado a agradecer su apoyo

incondicional, emocionalmente hablando, a todos los que han visto en mi un potencial y me han ayudado

a exprimirlo. A los cimientos de mi vida: mis padres, David y Rosa; mi hermana, Rosa; y mi abuelo,

Manolo. Ellos fueron los primeros que creyeron y confiaron en mí, y, muy seguramente, sin su cariño y

apoyo, no podría haber culminado tan satisfactoriamente este proyecto. Así que quiero aprovechar este

breve texto para mostrar el orgullo que siento de tenerlos cerca, y para desear que sigan haciéndolo mucho

más tiempo.

Ajenos al ámbito familiar, he de decir que, desde el colegio, he tenido muchos buenos profesores en mi

vida, los cuales han ayudado a estructurar mi cerebro tal y como lo concibo ahora. Sin embargo, los que

verdaderamente me han ayudado a definir mis intereses profesionales finales no son más que una minoría

que apareció en momentos clave de mi formación, alentándome a tomar un camino u otro. Aparte de todo

esto están David Velázquez, mi tutor, sin el cual no habría visto la luz este proyecto, y Mario, por su

inestimable apoyo en lo extraacadémico.

Para terminar, y aunque no sea algo tangible, he de agradecerle a la música. Por ser más que un trabajo

un desahogo, y por enseñarme un poco a ver desde una perspectiva artística todo este disparate de mundo.

A todos los anteriormente nombrados, agradecido estoy.

Marcos González Fernández

Sevilla, 2016

L

Page 10: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar
Page 11: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

xi

Resumen

as medidas que se obtienen de los procesos de las plantas térmicas son habitualmente empleadas

para tareas de control, evaluar rendimientos, optimizar la operación, programar la producción, etc.

Muy frecuentemente en estas plantas se dispone de más medidas que las estrictamente necesarias.

La reconciliación de datos trata de ajustar las medidas redundantes para que cumplan las leyes de conservación

de la masa y la energía, así como otras restricciones que incorpore el modelo matemático de un sistema cuya

complejidad puede llegar a ser extremadamente compleja. Se consigue así: a) una detección y eliminación de

los errores sistemáticos de medida; b) un conjunto sólido de medidas ajustadas; c) estimaciones de las variables

que no son medidas por métodos estadísticos y d) intervalos de confianza en los cuales los resultados son

aceptablemente ciertos.

En general, el objeto de este trabajo será presentar de una manera compactada los fundamentos de la

tecnología de la reconciliación de datos y la detección de gross errors -así como un estado del arte de dichas

tecnologías- para posteriormente diseñar, programar e implementar un módulo de reconciliación lineal en un

caso real de una red de hidrógeno avanzada. Asimismo, para familiarizar al lector con los conceptos que se

desarrollen, se presentarán una serie de ejemplos ilustrativos de otros tipos de casuísticas.

L

Page 12: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar
Page 13: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

xiii

Abstract

he measures obtained of the processes in thermal plants are usually used to control tasks, evaluate

performances, optimize the operation, program the production, etc. Very often in these plants they

have more measures than the strictly necessary. The data reconciliation consists in set the redundant

measures to comply with the laws of conservation of mass and energy, as well as other restrictions that

incorporates the mathematical model of a system whose complexity can get to be extremely complex. Doing

this we achieve: a) a detection and elimination of systematic errors of measurement; b) a solid set of adjusted

measurements; c) estimates of the variables that are not measured by statistical methods and d) confidence

intervals in which the results are acceptably certain.

In general, the object of this work will be to present an overview of the fundamentals of the data

reconciliation and gross error detection technology -as well as a state-of-the-art of them- and later design,

program and implement a module of linear reconciliation in a real case of an advanced hydrogen network. In

addition, to familiarize the reader with the concepts that are developed, a number of examples of other types of

cases will be presented.

T

Page 14: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Índice

Agradecimientos ix

Resumen xi

Abstract xiii

Índice xiv

Índice de Tablas xvi

Índice de Figuras xviii

Notación xx

1. Fundamentos de la reconciliación de datos y la detección de Gross Errors 21

1.1 INTRODUCCIÓN ........................................................................................................... 21 1.1.1 VISIÓN GENERAL 21 1.1.2 TÉCNICAS DE FILTRADO 22 1.1.3 BASES DE LA TECNOLOGÍA 24

1.2 FUNDAMENTOS TEÓRICO-MATEMÁTICOS ............................................................. 27 1.2.1 RECONCILIACIÓN DE DATOS 27 1.2.2 DETECCIÓN, IDENTIFICACIÓN Y REMEDIACIÓN DE ERRORES 32

1.3 APLICACIONES INDUSTRIALES ................................................................................. 36 1.3.1 RECONCILIACIÓN DE DATOS Y DETECCIÓN DE ERRORES DE MEDIDA EN

EQUIPOS PUNTUALES 37 1.3.2 ESTIMACIÓN DE PARÁMETROS Y RECONCILIACIÓN DE LOS MISMOS 39 1.3.3 RECONCILIACIÓN DE LA ENTRADA DE MATERIA PRIMA Y UTILITIES EN UNA

PLANTA COMPLETA 40 1.4 MEJORA DE LA INSTRUMENTACIÓN ........................................................................ 43

2. Ejemplo de reconciliación de datos 46

2.1 SISTEMA LINEAL, ESTACIONARIO, CON TODOS LOS FLUJOS MEDIDOS ............. 46

3. Aplicación a un caso real. Red de Hidrógeno 51

3.1 PRESENTACIÓN DEL CASO ........................................................................................ 51 3.2 RECONCILIACIÓN DEL NODO A.................................................................................. 53 3.3 RECONCILIACIÓN DEL NODO B.................................................................................. 58

4. Conclusiones 64

5. Desarrollo futuro 64

Referencias 67

Glosario 69

Page 15: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

xv

Page 16: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

ÍNDICE DE TABLAS

Tabla 1.1. - Distribución de Chi-Cuadrado para α = 5% , función del grado de redundancia

pág 35

Tabla 1.2. - Tipos de datos en un Sistema de Contabilidad de la Producción

pág 40

Tabla 2.1. - Ejemplo 2.1. Resultados de la primera iteración

pág 46

Tabla 2.2. - Ejemplo 2.1. Test de errores tras la primera iteración

pág 48

Tabla 2.3. - Ejemplo 2.1. Resultados de la segunda iteración

pág 49

Tabla 2.4. - Ejemplo 2.1. Test de errores tras la segunda iteración

pág 49

Tabla 3.1. - Nodo B. Resultados de la primera iteración

pág 59

Tabla 3.2. - Nodo B. Test de errores tras la primera iteración

pág 60

Tabla 3.3. - Nodo B. Resultados de la segunda iteración

pág 61

Tabla 3.4. - Nodo B. Test de errores tras la segunda iteración

pág 62

Page 17: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

xvii

Page 18: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

ÍNDICE DE FIGURAS

Figura 1.1. - El fenómeno del aliasing pág 23

Figura 1.2. - Reconciliación de datos y jerarquía de optimización de una planta pág 24

Figura 1.3. - Potencialidades del sistema de reconciliación de datos pág 26

Figura 1.4. - Precisión vs Exactitud pág 31

Figura 2.1. - Esquema del ejemplo pág 46

Figura 2.2. - Ajustes relativos de las variables pág 48

Figura 3.1. - Diagrama de la red de hidrógeno en Nm3/h pág 52

Figura 3.2. - Diagrama de la red de hidrógeno en términos de pureza (%) pág 53

Figura 3.3. - El proceso del PSA pág 54

Figura 3.4. - Zoom nodo A pág 54

Figura 3.5. - Medidas del nodo A tras filtrado (en kg/h de H2) pág 55

Figura 3.6. - Estados del nodo A tras reconciliación (en kg/h de H2) pág 56

Figura 3.7. - Ajuste absoluto (en kg/h de H2) pág 57

Figura 3.8. - Esquema del nodo B pág 58

Figura 3.9. - Ajustes relativos tras primera iteración pág 60

Figura 3.10. - Ajustes relativos tras segunda iteración pág 62

Page 19: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

xix

Page 20: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

NOTACIÓN

𝑦 Variable medida

�̂� Variable reconciliada

𝑥 Valor teórico de una variable

휀 Magnitud del Random Error

𝛿 Magnitud del Gross Error

𝑟𝑒𝑑 Grado de redundancia

𝜎 Desviación estándar

𝑁 Tamaño de una muestra estadística

𝐴 Matriz de incidencia

𝐸 Esperanza

V Matriz de varianzas

𝑊 Operador de la reconciliación

𝑎𝑑𝑗 Vector de ajustes

�̂� Matriz de varianzas-covarianzas

�̂� Estimaciones de variables no medidas

𝑃 Matriz de proyección

𝑋(1−𝛼)2 Distribución Chi-Cuadrado

𝐶𝑜𝑣 Covarianza

Page 21: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

1. FUNDAMENTOS DE LA RECONCILIACIÓN DE

DATOS Y LA DETECCIÓN DE GROSS ERRORS

1.1 INTRODUCCIÓN

1.1.1 VISIÓN GENERAL

isponer de medidas fiables y precisas es crucial en la mejora de los procesos químicos, petroquímicos y, en general, de cualquier industria de tratamiento de materias primas que sea altamente consumidora en energía. En la mayoría de las ocasiones, el cumplimiento de los objetivos propuestos está fuertemente

ligado al correcto modelado de los procesos, a una acertada estimación de los parámetros característicos y a una potente optimización. Estos tres factores dependen a su vez de los datos que recolecta la instrumentación de la planta o de los análisis de laboratorio.

Desafortunadamente, estas variables contienen información imprecisa de manera casi inherente a ellos, ya que están obtenidos por instrumentación imperfecta per se. Además, las duras condiciones del ambiente en el que estos se instalan, en adición a la falta de mantenimiento/calibrado y de la baja calidad de los sensores hacen que se acumule una relevante cantidad de errores.

Por lo general, los errores que afectan a los datos medidos pueden ser categorizados en dos clases principales:

Random errors, RE. Errores aleatorios. Aparecen siempre, en forma de ruido. Ni el

valor ni el signo del error puede ser predicho con certeza, ya que están causados por

una serie de fenómenos transitorios muy cambiantes e impredecibles, como

fluctuaciones en el suministro eléctrico, imperfecciones en la

transmisión/conversión de la señal, un mal muestreo de las señales o cambios en

las condiciones ambientales. La expresión general es:

𝑦𝑖 = 𝑥𝑖 + 휀𝑖

Siendo 𝑦 el valor de la variable medida, 𝑥 el valor teórico que habría de tener tal variable y 휀 el valor del RE.

Este tipo de errores son tan impredecibles que si se repitiera un experimento con el mismo equipo y las mismas condiciones ambientales el error variaría. Por tanto, este

D

Abrigamos muchos prejuicios si no dudamos,

alguna vez, de todo en lo que hallemos la

menor sospecha de incertidumbre.

-R. Descartes-

(1.1)

Page 22: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Fundamentos de la reconciliación de datos y la detección de Gross Errors

22

22

tipo de fenómenos sólo pueden ser caracterizados con distribuciones de probabilidad: generalmente se los considera independientes entre ellos y normalmente distribuidos con media cero

De esto se deriva que los random errors no suelen llegar a suponer un sesgo relevante de la información, además de que aparecen en todos los sensores a la vez, por lo que analizándolos de manera relativa entre ellos pierden importancia y se suelen despreciar.

Gross errors, GE. Causados por eventos no aleatorios, que pueden ser subdivididos

fundamentalmente en dos: los relacionados con las medidas erróneas: dados por el

mal funcionamiento de determinados equipos (descalibrado, corrosión...), los

cuales hacen que se obtengan datos inciertos; y en los relacionados con fallos del proceso (fugas, pérdidas no contabilizadas, errores de modelado...). Llega un

momento en el que estos errores se vuelven importantes y sesgan la veracidad de

la información del sistema. La expresión que siguen es:

𝑦𝑖 = 𝑥𝑖 + 휀𝑖 + 𝛿𝑖

Siendo todos los términos iguales a la expresión anterior, y siendo 𝛿 la magnitud del GE. Se observa por tanto que una variable que presente un gross error tendrá forzosamente también un random error, produciéndose un doble sesgado.

Es obvio que utilizar los datos de los sensores en bruto, sin emplear ninguna técnica de filtrado, puede afectar al óptimo funcionamiento de la planta (ya sea en la calidad, en la contabilidad o en la temporalización de los mantenimientos, por ejemplo) e incluso puede llegar a desembocar en situaciones de inseguridad. El objetivo es, por tanto, acotar el intervalo de confianza de los instrumentos hasta un nivel en el cual se pueda aceptar su información para tomar decisiones. Por lo tanto, cuestionar las medidas es una práctica común, y los random/gross errors habrán de ser siempre compensados o incluso eliminados.

1.1.2 TÉCNICAS DE FILTRADO

Con el filtrado de datos nos referimos a encontrar una estimación de los valores verdaderos de las medidas basándonos en información adicional, como puede ser el modelo del proceso. En general, filtrar las medidas de un proceso se puede realizar según dos tipos de técnicas: el filtrado estadístico y el filtrado basado en el modelo.

En los procesos en los que falta información precisa sobre el sistema, es decir, que no hay mucho conocimiento sobre lo que pasa, es siempre necesario rectificar los datos empleando filtros analógicos o digitales. Una inadecuada frecuencia de muestreo convierte una señal de alta frecuencia en otra de baja frecuencia artificialmente. Este fenómeno es conocido en ingeniería de telecomunicaciones como signal aliasing (Figura 1.1). Los filtros analógicos se usan para pre-filtrar los datos antes de muestrearlos y prevenir así el aliasing. Los filtros digitales se usan posteriormente para conseguir una mayor atenuación de los random errors (generalmente en el ruido de alta frecuencia). Estos tipos de filtros (p.ej. exponenciales o moving average) se usan básicamente para pre-procesar las

(1.2)

Page 23: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

23

señales, acondicionando los datos, y forman parte del Sistema de Control Distribuido (DCS). Además, en el pre-procesamiento se eliminan los valores atípicos (outliers), fijando los límites teóricos superiores e inferiores de las variables del proceso.

Figura 1.1. El fenómeno del aliasing

Si atendemos a las técnicas de filtrado basadas en los modelos, la principal es la reconciliación de datos (del inglés data reconciliation, DR para abreviar), también conocida como rectificación (data rectification). En esta técnica, se respeta tal cual un proceso que puede estar basado tanto en los principios básicos (balances másicos y entálpicos, ecuaciones de equilibrio químico, etc.), o en modelos empíricos (como pueden ser las redes neuronales artificiales), o en una combinación de ambos. La estimación de las variables del proceso se obtiene ajustando las medidas hasta que éstas satisfagan las restricciones del modelo. En este tipo de técnicas se explota por tanto la redundancia del sistema y las relaciones entre variables, consiguiendo un paquete de soluciones solvente en cada caso particular.

Dependiendo del tipo de restricciones del modelo, la reconciliación de datos puede clasificarse en estacionaria o dinámica, y en lineal, bilineal o no lineal. Más adelante se desarrollarán estos conceptos.

Es importante destacar que el pre-procesamiento de los datos ha de ser llevado a cabo con anterioridad a la reconciliación de datos (p.ej. es preferible no enviar ningún dato al módulo de reconciliación a enviarle un valor negativo de un flujo que no lo es). Por tanto, ambas técnicas no han de ser concebidas como antagonistas sino como complementarias, ya que cada una tiene una ubicación específica dentro del sistema de control avanzado.

Page 24: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Fundamentos de la reconciliación de datos y la detección de Gross Errors

24

24

He aquí una figura aclaratoria (Figura 1.2) de la jerarquía que se sigue:

Figura 1.2. Reconciliación de datos y jerarquía de optimización de una planta

1.1.3 BASES DE LA TECNOLOGÍA

En este sub-apartado trataré de asentar algunas ideas fundamentales sobre la tecnología objeto de este estudio, antes de su posterior desarrollo matemático.

En una planta, las variables de proceso suelen ser la temperatura, las presiones, la composición de un flujo, o los flujos másicos. La información que se obtiene del proceso suele generar redundancia, que se define como la sobre-determinación del espacio vectorial que forman dichas variables. En otras palabras, es la capacidad de averiguar un dato por varias vías distintas, debido a la implantación de más instrumentación de la estrictamente necesaria, y constituye uno de los conceptos fundamentales en la reconciliación de datos.

Definimos el concepto de grado de redundancia, red, como la diferencia entre el número de ecuaciones distintas del sistema y el número de variables sin medir. Aunque más adelante veremos otra manera de obtenerlo, en esencia, el grado de redundancia es:

𝑟𝑒𝑑 = 𝑝 − 𝑚 = 𝑛º 𝑑𝑒 𝑒𝑐𝑢𝑎𝑐𝑖𝑜𝑛𝑒𝑠 − 𝑛º 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 sin 𝑚𝑒𝑑𝑖𝑟

Por ejemplo, en un nodo tan simple como una división de un flujo en dos, atendiendo a la ecuación de continuidad, tan sólo serían necesarios 2 caudalímetros para conocer todos los flujos. El hecho de implantar 3 sensores nos da una redundancia de grado uno.

Medidas de los datos

Pre-procesado de los datos

Detección de GE. Reconciliación. Estimación de

Parámetros

MonitorizaciónOptimizaciónContabilidad

Modelo

(1.3)

Page 25: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

25

Cuando este suceso de la monitorización redundante se va repitiendo a lo largo de una planta, se tiene un sistema bastante complejo. Por tanto, una tarea esencial en la DR es evaluar la redundancia de los procesos, ya que en las técnicas de gross error detection que vendrán después de ella lo que se hará básicamente es obviar tantas medidas sospechosas de error como de grados de redundancia se disponga. En definitiva, iremos ‘gastando’ la sobre-determinación del sistema en aras de mejorar la precisión de éste.

No obstante, es importante destacar que el hecho de encontrar monitorización redundante en una planta estándar no es algo inmediato, ya que debido al elevado coste económico de ésta se tiende a poner la estrictamente necesaria.

Está claro que el rendimiento y la formulación del problema de optimización y su interpretación estadística van fuertemente ligados a la singularidad de las variables estimadas, y al peso que tenga cada una en el sistema. Por tanto, hay que llevar a cabo un cuidadoso procedimiento de clasificación de variables.

Aparte de la primera clasificación, ya comentada, de sistema lineal o no lineal, hemos de distinguir entre variables redundantes, no redundantes, calculables y no calculables. Así, en resumen, tenemos:

Medida, no redundante

Medida, redundante

No medida, calculable

No medida, no calculable

Por ejemplo, una variable no medida se define como no calculable si sólo puede ser determinada a través de las variables medidas. Por tanto, su estimación carece de significado e interés.

En el sistema de DR que aparece en la Figura 1.3 puede verse que el sistema es capaz de aumentar la fiabilidad de las medidas y de proporcionar un valor más probable para las variables no medidas, incluyendo los parámetros del modelo.

Si comentamos más ventajas de esta tecnología, vemos que todas las medidas reconciliadas y sus estimaciones obedecen estrictamente un modelo pre-determinado del proceso, esto es, que, a diferencia de las técnicas de filtrado genéricas, ésta es única para cada operación. La DR es capaz de calcular también la precisión de sus propios resultados mediante la computación de la desviación estándar de cada valor reconciliado o estimado. En otras palabras, es capaz de autocorregirse.

Además, tiene la capacidad de calcular fallos en los sensores o fugas del proceso, y puede determinar las ubicaciones óptimas para estos dispositivos de medida.

Por otra parte, con la DR es evidente que se consigue comprender mejor el proceso, el cual es capaz de operar más próximo a las especificaciones y a los rendimientos de diseño. Estos aspectos permiten incrementar los beneficios de la planta, y justifican la periodicidad más adecuada para el mantenimiento tanto de la instrumentación (calibrado) como de los equipos (limpieza y seguimiento).

Matemáticamente, el problema de optimización puede entenderse como un ajuste promediado. Los datos se ajustan para ser lo más parecido posible a las medidas brutas, pero estadísticamente consistentes con las restricciones (de igualdad y de desigualdad) y con todos los tipos de variables involucradas (medidas, no medidas y fijas).

Las restricciones de igualdad son por lo general los balances másicos, energéticos y de

Page 26: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Fundamentos de la reconciliación de datos y la detección de Gross Errors

26

26

composición, aunque también pueden ser usadas las ecuaciones de equilibrio de las reacciones si son considerablemente precisas. Las restricciones de no igualdad son los límites que les damos a las variables (p.ej., cuando le imponemos que no puedan ser negativos los flujos y concentraciones).

Imaginemos la gran cantidad de ecuaciones, de no linealidades, sesgos de información o pérdidas de variables clave que puede haber en una planta química compleja: se complica la tarea de casar los datos del proceso con los del modelo. Para tratar con esto, el procedimiento de la reconciliación debería comenzar con un modelo reducido de la planta (p.ej. los balances másicos de procesos estacionarios, ya que es lo más simple de evaluar). Por tanto, es vital conocer cómo aumentar progresivamente la complejidad y el realismo del modelo, con el objeto de no cometer errores de modelado en aspectos que a priori serían básicos.

Figura 1.3. Potencialidades del sistema de reconciliación de datos

Para terminar esta sección, hay que distinguir entre dos tipos principales de aplicaciones:

Reconciliación de equipos unitarios. Balances másicos y energéticos aislados.

La literatura especializada se centra en especial en columnas de

destilación/separación, como los craqueadores de naftas. También se aplica a

reactores, como reformadores y craqueadores catalíticos, o reactores de

pirólisis, entre otros.

Reconciliación de planta completa. Sistemas de contabilidad de la producción y

utilities del proceso (p.ej. energía consumida). Muchas refinerías ahorran una

Reconciliación de datos

Diseño y modernización de redes de sensores

Estimación de variables

observables y Parámetros del

modelo

Detección de Gross Errors

Ajuste de variables redundantes

Distribuciones de errores. Evaluación

de varianzas y covarianzas

Clasificación de variables

Modelado de procesos

Page 27: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

27

significante cantidad de dinero implantando estos sistemas. Frecuentemente,

muchos sistemas integrados de simulación de procesos, optimización y control

avanzado incluyen un módulo de reconciliación que precede a toda aplicación

que haga uso de los datos reales de la planta.

En cualquier caso, las aplicaciones aquí presentadas han sido sólo una introducción, y desarrollaremos sus potencialidades más adelante, en el apartado 1.3. de Aplicaciones Industriales.

1.2 FUNDAMENTOS TEÓRICO-MATEMÁTICOS

1.2.1 RECONCILIACIÓN DE DATOS

1.2.1.1 SISTEMAS LINEALES Y ESTACIONARIOS

Las primeras reconciliaciones de datos de sistemas estacionarios (Steady-State Data Reconciliation, SSDR) fueron presentadas por Kuehn y Davidson allá por el 1961. Por entonces el único objetivo era que éstas satisficieran los balances másicos de las plantas. Por lo tanto, tan sólo la concibieron como un problema de optimización por Ajuste de Mínimos Cuadrados con restricciones. Así:

mín 𝐹 = ∑ (𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑑𝑖𝑑𝑜 𝑖 − 𝑉𝑎𝑙𝑜𝑟 𝑟𝑒𝑐𝑜𝑛𝑐𝑖𝑙𝑖𝑎𝑑𝑜 𝑖

𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑖)

2

∀𝑖

= mín ∑ ( 𝑦�̂� − 𝑦𝑖

𝜎𝑖)

2

∀𝑖

Sujeto a:

𝐴 ∙ �̂� = 0

Donde 𝑨 es la matriz de incidencia que representa los balances másicos del sistema en estado estacionario y, en este caso, considera que todas las variables involucradas han sido medidas, o lo que es lo mismo, que todas sus filas son linealmente independientes. Además, se toma como hipótesis principal que las medidas no contienen gross errors, esto es, que su valor esperado es cero. La matriz de incidencia es una matriz formada únicamente por ceros, unos y menos uno, cuyo número de columnas es el número de variables diferentes y el número de filas los nodos del sistema.

𝐴 = (↑ ← 𝑁º 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒𝑠 →

𝑁º 𝑑𝑒 𝑛𝑜𝑑𝑜𝑠 ⋯ ⋯ ⋯↓ ⋯ ⋯ ⋯

)

Asimismo, la matriz 𝑨 puede adoptar formas distintas dependiendo de si todos los flujos son medidos o no. En este segundo caso habría que descomponerla en dos matrices diferentes.

Más adelante, en el apartado 2.1, veremos un ejemplo aclaratorio del caso lineal.

Definimos la desviación estándar de una medida como:

(1.4a)

(1.4b)

(1.5)

Page 28: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Fundamentos de la reconciliación de datos y la detección de Gross Errors

28

28

𝜎𝑖 ≡ 𝑠 = √(∑ (𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑑𝑖𝑑𝑜 𝑖 − 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎)2𝑁

𝑖=1 )

𝑁 − 1

La desviación estándar simula la fiabilidad (precisión) de un instrumento, y supondremos que es constante en un estado estacionario de un sensor dado. Si la elevamos al cuadrado obtenemos la varianza, que refleja la dispersión de los datos con respecto a su media. En un sistema de reconciliación de datos, las variables son ponderadas en base a su varianza. Las variables con poca variabilidad pueden considerarse bastante constantes (precisas), y se les otorga una ponderación mayor en el procedimiento. A las variables muy cambiantes se las considera más imprecisas y tendrán un peso menor en el ajuste.

Los errores de medida siguen una distribución normal de media cero y varianza conocida 𝜎𝑖

2. Como se explicó en la ecuación (1.1), los efectos de los random errors contribuyen de manera aditiva, aunque usualmente oscilan en torno al cero. Esta característica puede ser descrita usando las propiedades estadísticas de las variables aleatorias. Significa que el valor esperado es cero y su varianza viene dada por:

𝑣𝑎𝑟(휀𝑖) = 𝐸[휀𝑖2] = 𝜎𝑖

2

donde 𝜎𝑖2 es la desviación estándar del error de medida 휀𝑖.

A continuación, dividiremos el problema según dos enfoques, dependiendo de si todos los flujos han sido medidos o no.

- Reconciliación lineal con todos los flujos medidos.

La realidad es que podríamos resolver un sistema introduciendo la ecuación general en cualquier motor de optimización, tratándola como un algorítmo genético, pero sería lento y trabajoso.

El problema descrito más arriba, en el que todas las variables son medidas, puede ser resuelto de manera analítica con matrices si se emplean multiplicadores de Lagrange –tras un extenso desarrollo matemático que no mostraré aquí, véase Narasimhan (2000)-, tal y como se ve en la Ec. (1.8).

�̂� = 𝑦 − 𝑉 ∙ 𝐴𝑇 ∙ (𝐴 ∙ 𝑉 ∙ 𝐴𝑇)−1 ∙ 𝐴 ∙ 𝑦

Siendo 𝑽 una matriz cuyas diagonales son las varianzas de las medidas, y 𝑨 la matriz de las restricciones.

La ecuación anterior es la ecuación fundamental de la reconciliación de datos, escrita en forma matricial, y se aprecia mejor si se escribe de la siguiente forma:

�̂� = [𝐼 − 𝑉 ∙ 𝐴𝑇 ∙ (𝐴 ∙ 𝑉 ∙ 𝐴𝑇)−1 ∙ 𝐴] ∙ 𝑦

Visto de esta forma se sustrae que lo que está dentro de los corchetes es un operador constante que reconcilia las variables. A este operador, muy potente a efectos de computación, lo llamaremos 𝑾. Se deduce que las únicas variables importantes a la hora de reconciliar son 𝑽 y 𝑨 (ambos parámetros siempre conocidos y fáciles de determinar, lo que es una ventaja) y, en resumen, se cumple:

�̂� = 𝑊 ∙ 𝑦

(1.6)

(1.7)

(1.8)

(1.9)

(1.10)

Page 29: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

29

Se llama ajuste, 𝒂𝒅𝒋, al vector que contiene las diferencias entre las mediciones y las variables reconciliadas. Un ajuste puede ser positivo o negativo, y refleja cuánta modificación ha tenido que hacerse del set de datos originalmente sesgado.

𝑎𝑑𝑗𝑖 = 𝑦𝑖 − 𝑦�̂�

La matriz de varianzas-covarianzas, �̂�, de las variables reconciliadas �̂� viene dada por:

�̂� = 𝑉 − 𝑉 ∙ 𝐴𝑇 ∙ (𝐴 ∙ 𝑉 ∙ 𝐴𝑇)−1 ∙ 𝐴 ∙ 𝑉

Es una matriz simétrica, cuyos elementos diagonales son las varianzas, y los no diagonales las relaciones entre variables. Esta matriz será la que nos informe del peso de la reconciliación en cada una de las variables, es decir, cuáles habrán sido las medidas más modificadas.

- Reconciliación lineal con algunos flujos medidos y otros sin medir.

En el caso más común, que es que no todos los flujos de la planta sean medidos por un sensor, la forma de plantear el problema se vuelve diferente. Lo que suele hacerse es que se plantean los balances másicos en determinados nodos para hacer el sistema más simple, lo que implica que ciertos flujos han de ser estimados. Según este procedimiento, el sistema reduce su grado de redundancia, y habrá de volverse más selectivo a la hora de dotar de una prioridad u otra a los datos. En otras palabras, como hay menos valores, cada uno de ellos tendrá mayor responsabilidad sobre el modelo, y por tanto será más relevante encontrar los errores.

El principal cambio que se produce puede verse en la matriz de incidencia 𝑨, ya que las restricciones de la reconciliación dependen ahora de dos tipos de variables, los valores reconciliados para los flujos medidos (�̂�) y las estimaciones de los flujos sin medir (�̂�).

La matriz de incidencia, por tanto, ha de ser dividida en dos: la de flujos medidos (𝐴𝑦) y

la de flujos no medidos (𝐴𝑧).

Ahora, el problema de reconciliación puede ser reescrito así:

𝑚𝑖𝑛𝑖𝑚𝑖𝑧𝑎𝑟 𝐹(�̂�, �̂�) = (𝑦 − �̂�)𝑇 ∙ 𝑉−1 ∙ (𝑦 − �̂�)

𝑠𝑢𝑗𝑒𝑡𝑜 𝑎 𝐴𝑦 ∙ �̂� + 𝐴𝑧 ∙ �̂� = 0

La solución puede ser abordada eliminando primero las variables no medidas, �̂�, de la ecuación de restricciones. Para ello multiplicamos por una matriz de proyección, 𝑷, que se obtendrá haciendo un procedimiento de factorización Q-R de la matriz 𝑨𝒛. Debido a su complejidad, y a que se sale del alcance del proyecto, no voy a desarrollarlo, pero al final se obtiene que:

𝐴𝑧 = [𝑄1 𝑄2] ∙ [𝑅1

0]

Y la matriz de proyección que buscamos no es más que la traspuesta de 𝑸𝟐:

𝑃 = 𝑄2𝑇

Por simplicidad, estas descomposiciones Q-R se pueden hacer directamente con softwares de computación matemática. De esta manera, la ecuación a resolver queda:

(1.11)

(1.12)

(1.13a)

(1.13b)

(1.14)

(1.15)

Page 30: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Fundamentos de la reconciliación de datos y la detección de Gross Errors

30

30

�̂� = 𝑦 − 𝑉 ∙ (𝑃 ∙ 𝐴𝑦)𝑇

[(𝑃 ∙ 𝐴𝑦) ∙ 𝑉 ∙ (𝑃 ∙ 𝐴𝑦)𝑇

]−1

∙ (𝑃 ∙ 𝐴𝑦) ∙ 𝑦

Que es el vector de variables medidas reconciliadas, parecido al del caso anterior.

Las variables no medidas se despejarían por tanto de la expresión:

𝐴𝑧 ∙ �̂� = 𝐴𝑦 ∙ �̂�

�̂� = −(𝐴𝑧𝑇 ∙ 𝐴𝑧)−1 ∙ 𝐴𝑧

𝑇 ∙ (𝐴𝑦 ∙ �̂�)

Al final, obtenemos un resultado muy parecido al del caso anterior, sólo que está descompuesto en dos vectores distintos, el de medidas y estimaciones.

Llegados a este punto, puede darse que el sistema con variables medidas y no medidas sea lo suficientemente redundante o no. Esto modificará ligeramente la manera de obtener la matriz de proyección 𝑷, aunque no ahondaremos mucho en ese caso.

Unificando los dos tipos de reconciliación vistos hasta ahora, podemos seguir el siguiente procedimiento para reconciliar un conjunto de variables cualesquiera:

Paso 1. Conocido el caso, descomponemos la matriz 𝑨 en términos de 𝑨𝒚 y 𝑨𝒛. Si la

matriz 𝑨𝒛 está rellena entera de ceros, significa que todos los flujos están medidos,

por lo que resolvemos por el primer procedimiento que explicamos. Si la matriz 𝑨𝒛

no es nula, pasamos al Paso 2.

Paso 2. Averiguamos el rango de la matriz 𝑨𝒛

Paso 3. Si el rango de 𝑨𝒛 es mayor o igual que el número de variables sin medir (N),

todas las variables no medidas son observables, y llevamos a cabo la reconciliación

con las ecuaciones de este punto (2.2.3.). En el caso contrario, avanzamos al Paso

4.

Paso 4. Si el rango de Az (r), es menor que N, entonces al menos N-r variables NO

pueden ser estimadas desde la información disponible. Esto es porque el sistema

no es lo suficientemente redundante. Se busca entonces una matriz π para obtener

la matriz P de proyección, tal que:

𝐴𝑧 ∙ 𝜋 = [𝑄1 𝑄2] ∙ [𝑅1 𝑅2

0 0]

Paso 5. Obtener la matriz de proyección, 𝑷 = 𝑸𝟐𝑻. Una vez aquí, proceder con la

reconciliación tal y como dicen las ecuaciones (1.13a) y (1.13b). Nótese que sólo las

variables medidas y redundantes participan en la reconciliación. Las medidas no

redundantes están identificadas por la matriz 𝑸𝟐𝑻𝑨𝒚. Obtenemos las estimaciones

de las variables medidas.

Paso 6. Calcular las variables que no han sido medidas con la siguiente ecuación:

�̂�𝑟 = −𝑅1−1 ∙ 𝑄1

𝑇 ∙ 𝐴𝑦 ∙ �̂� − 𝑅1−1 ∙ 𝑅2 ∙ �̂�𝑁−𝑟

Sólo las variables no medidas de �̂�𝒓, correspondientes a las filas de ceros en la matriz

𝑹𝟏−𝟏 ∙ 𝑹𝟐, pueden ser calculadas.

Y hasta aquí las técnicas de reconciliación lineal de sistemas estacionarios. Inspirados en todo esto, los investigadores centraron sus esfuerzos en dos vías de investigación

(1.16)

(1.17)

(1.18)

(1.19)

(1.20)

Page 31: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

31

principales. En primer lugar, aplicaron los fundamentos de la reconciliación de datos de sistemas lineales y estacionarios (SSDR) a sistemas no lineales y dinámicos; en segundo lugar, trabajaron cómo lidiar con esto en presencia de gross errors, los cuales alterarían las hipótesis de distribución normal con media cero.

1.2.1.2 PRECISIÓN VS EXACTITUD

Aunque en el lenguaje coloquial ‘preciso’ y ‘exacto’ se usan a menudo como conceptos equivalentes, en estadística hay que establecer una distinción entre ellos, en especial cuando hablamos de características de los sensores.

La desviación estándar es una expresión de la precisión de una medida. Cuanto más pequeña sea 𝜎, más precisa es la medida y más probable es que un RE sea próximo a cero, esto es, que repitiendo el mismo experimento en las mismas condiciones es más probable que se obtengan valores parecidos. El concepto de exactitud está asociado a la veracidad, que es cómo de cerca está la lectura del instrumento del valor ‘verdadero’, es decir, cuando la media de todas las mediciones es muy próxima a la teórica que debería obtenerse. Luego, un sistema de medición puede ser exacto, pero no preciso; preciso, pero no exacto; ninguna de las dos cosas; o ambas.

Figura 1.4. Precisión vs Exactitud. Mientras que la primera imagen es poco exacta y poco precisa, la segunda imagen es poco exacta pero altamente precisa.

1.2.1.3 SISTEMAS NO LINEALES

Las restricciones de conservación estacionarias que empleamos para describir muchos procesos químicos son no lineales en realidad. Sólo si estamos interesados en reconciliar balances de flujos únicamente, las técnicas lineales bastan. Incluso bajo algunas restricciones, muchos procesos pueden ser descritos usando técnicas bilineales.

En cambio, si se quieren tener en cuenta las relaciones de equilibrio termodinámico o las complejas correlaciones entre propiedades termodinámicas y físicas, entonces hay que emplear la reconciliación no lineal. La característica principal de las reconciliaciones de este tipo es que las restricciones vienen dadas tanto por ecuaciones como por inecuaciones, esto es, que algunos balances no dan cero.

Page 32: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Fundamentos de la reconciliación de datos y la detección de Gross Errors

32

32

La expresión es:

min�̂�

𝜙[𝑦(𝑡), �̂�(𝑡); 𝜎] = 𝑚𝑖𝑛 ∑ ( 𝑦�̂�(𝑡) − 𝑦𝑖(𝑡)

𝜎𝑖)

2

∀𝑖

Sujeto a:

𝐴 ∙ �̂�(𝑡) = 0

𝐵 ∙ �̂�(𝑡) < 0

Siendo la matriz 𝐵 una matriz similar a 𝐴, pero con las restricciones de las inecuaciones. El problema de reconciliación no lineal es similar al Error-in-all Variables Method (EVM), un método de regresión estadística que supone que existen errores de medida en todas las variables del proceso. Por tanto, la reconciliación de datos es un caso especial de la estimación EVM en el que la optimización está sujeta a constantes.

Aunque dado el limitado alcance de este trabajo no ahondaremos en los métodos de resolución no lineales, podemos resumirlos principalmente en dos:

Métodos de linealización sucesiva. El primer método que se empleó. Consiste en

linealizar la restricción no lineal empleando los desarrollos en serie de Taylor de

primer orden. Una vez dicha restricción se comporta como lineal, se reconcilia

como lo explicado hasta ahora.

Este método tiene la ventaja de ser relativamente simple y rápido, aunque años después se demostró que los métodos de programación no lineal eran más precisos.

Métodos de programación no lineal. Existen varios métodos, casi todos basados

en gradientes como el método de Gauss-Newton, Gauss-Marquardt o el del

Gradiente Reducido Generalizado. Sin embargo, en general, la Programación Cuadrática Sucesiva es el método más preciso, ya que nuestra función objetivo

es una función cuadrática.

La ventaja de estos métodos es que pueden soportar tanto restricciones lineales como no lineales de manera explícita, pues emplean los motores de optimización de los softwares matemáticos. La principal desventaja es que requieren bastante más tiempo de computación que con el método de linealización.

1.2.2 DETECCIÓN, IDENTIFICACIÓN Y REMEDIACIÓN DE ERRORES

La técnica de la reconciliación depende de manera crucial de la asunción de que en un set de datos sólo existen random errors, y que los errores sistemáticos no están presentes ni en las medidas ni en las ecuaciones del modelo. Si esta asunción no es válida, como ocurre con bastante frecuencia, se lleva a cabo la reconciliación directamente de los datos medidos, y los resultados pueden llegar a ser muy imprecisos y a veces no servir. Por ello, es importante identificar tanto los errores sistemáticos como los gross errors antes de

(1.21a)

(1.21b)

(1.21c)

Page 33: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

33

obtener la reconciliación final.

En apartados anteriores, se hizo especial hincapié en que la DR sólo podía ser llevada a cabo si estaban presentes las restricciones. Los mismo sucede con la detección de gross errors: si no se dispone de las restricciones para comprobar las medidas, no puede realizarse. Por tanto, ambas técnicas han de hacerse conjuntamente cuando es necesario.

Como se explicó en la introducción, hay dos tipos de gross errors. Unos están relacionados con la mala operación del instrumento, e incluyen los sesgos en las mediciones, descalibrado, los fallos totales o mal funcionamiento en las bajas frecuencias (drifting). Los otros tipos están relacionados con las restricciones, e incluyen pérdidas no contabilizadas de materia y energía, resultado de fugas en equipos o mal modelado de parámetros.

Para detectar y eliminar estos errores hay desarrolladas varias estrategias, aunque antes de poder describirlas es necesario preguntarse qué requisitos han de cumplir dichas estrategias. Esto también nos permite establecer una relación entre ellas y saber qué podemos esperar de cada una. Toda técnica de detección de gross error ha de tener:

Habilidad para detectar la presencia de uno o más errores en los datos.

Habilidad para identificar el tipo y la localización de las variables sospechosas

de contener un GE.

Habilidad para estimar la magnitud del error.

Habilidad para compensar/eliminar esos errores.

Aunque no las trataremos aquí, existen también técnicas que permiten lidiar con varios errores a la vez, las técnicas de Multiple Gross Error Detection, MGED. Asimismo, puede que no todas las estrategias reúnan todos los requisitos arriba mencionados, ya que la estimación de la magnitud, aunque útil, no es estrictamente necesaria y no se hace siempre. Nos centraremos en una estrategia simple y efectiva para identificar errores individuales: la estrategia de los tests.

1.2.2.1 1. DETECCIÓN: EL GLOBAL TEST (GT)

Lo primero que hay que hacer es determinar si el sistema tiene errores, para ello buscamos un número absoluto que nos da una idea de la cantidad de error que éste contiene.

Recordamos que el vector de ajuste refleja la modificación que ha experimentado cada uno de los datos. A priori podría pensarse que la variable que mayor ajuste reciba será la más sospechosa de contener un GE, pero esto no siempre es así, ya que, dentro de un sistema complejo, los errores pueden concatenarse y presentar valores modificados en puntos distintos a los suyos, incluso aun cuando el sistema no contenga errores (recordemos que reconciliación no implica gross errors). Hemos de adimensionalizar cada ajuste, dividiéndolo por la desviación estándar.

Page 34: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Fundamentos de la reconciliación de datos y la detección de Gross Errors

34

34

De nuevo, vemos que el problema de reconciliación de datos viene dado por la ecuación:

Minimizar 𝑓 = ∑ ( 𝑦�̂� − 𝑦𝑖

𝜎𝑖)

2

𝑖, 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠𝑚𝑒𝑑𝑖𝑑𝑎𝑠

𝑆𝑢𝑗𝑒𝑡𝑜 𝑎 ℎ𝑘(𝑦�̂�) = 0 𝑘 = 1, … , 𝐾

Donde la función objetivo es el sumatorio de los términos

( 𝑦�̂� − 𝑦𝑖

𝜎𝑖)

2

que representa una distribución de probabilidad Chi-Cuadrado, 𝑋2(𝜈), con grado de libertad 𝜈. El grado de libertad es igual al grado de redundancia, 𝑟𝑒𝑑, explicado en la ecuación (1.3).

Toda esta breve introducción nos permite presentar al Global Test, GT, como el sumatorio de todos los ajustes adimensionalizados:

𝐺𝑇 = ∑ ( 𝑦�̂� − 𝑦𝑖

𝜎𝑖)

2

𝑖, 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠𝑚𝑒𝑑𝑖𝑑𝑎𝑠

< 𝑋(1−𝛼)2 (𝑟𝑒𝑑)

donde 𝑋(1−𝛼)2 (𝑟𝑒𝑑) es el valor límite superior de la distribución Chi-Cuadrado, en la que

no se esperan errores, y 𝛼 es el nivel de confianza, tomado generalmente como 𝛼 =5% (0.05). Un desarrollo completo de la ecuación (1.24) requeriría de la ayuda de otras hipótesis y una distinción entre errores del primer y segundo tipo (véase Mah, 1990). Para nuestros propósitos, podemos simplificar diciendo que si 𝐺𝑇 es menor que 𝑋(1−0.05)

2 (𝑟𝑒𝑑),

no se espera encontrar gross errors en el sistema. Por el contrario, cuando 𝐺𝑇 supera el valor del test, podemos afirmar, con un 95% de certeza, que el sistema tiene -al menos-, un error de medida.

(1.22a)

(1.22b)

(1.23)

(1.24)

Page 35: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

35

En la Tabla 1.1 se facilitan los estadísticos necesarios para aplicar los test:

Tabla 1.1

Distribución de Chi-Cuadrado para 𝜶 = 𝟓% , función del grado de redundancia

𝒓𝒆𝒅 𝑿(𝟏−𝟎.𝟎𝟓)𝟐 𝒓𝒆𝒅 𝑿(𝟏−𝟎.𝟎𝟓)

𝟐

1 3.84 15 25.0

2 5.99 20 31.4

3 7.82 25 37.0

4 9.49 30 43.8

5 11.1 35 49.8

6 12.6 40 55.8

7 14.1 45 61.8

8 15.5 50 67.5

9 16.9 100 124

10 18.3 200 234

1.2.2.2 2. IDENTIFICACIÓN: EL MEASURE TEST (MT)

Una vez conocido el resultado del test, queremos averiguar cuál o cuáles son las variables más sospechosas de contener un error, para ello empleamos el Measure Test, MT. Este test consiste en ordenar de mayor a menor en un vector unos parámetros llamados 𝑀𝑇𝑖 , siendo el mayor el correspondiente a la medida con más posibilidades de contener un error. Aquí, utilizando de nuevo los multiplicadores de Lagrange, Mah (1990) desarrolló la siguiente expresión:

𝑀𝑇𝑖 = |𝑎𝑑𝑗𝑖|

√𝑉𝑖𝑖

donde 𝑎𝑑𝑗𝑖 son los elementos del vector de ajuste 𝑎𝑑𝑗, en valor absoluto, y 𝑉𝑖𝑖 son las diagonales de la matriz de covarianza de 𝑎𝑑𝑗:

𝑉 = 𝑐𝑜𝑣(𝑎𝑑𝑗) = 𝑄 ∙ 𝐴𝑇 ∙ (𝐴 ∙ 𝑄 ∙ 𝐴𝑇)−1 ∙ 𝐴 ∙ 𝑄

O, en definitiva:

𝑀𝑇𝑖 = |𝑦𝑖 − 𝑦�̂�|

√𝐶𝑜𝑣𝑖𝑖(𝑦𝑖 − 𝑦�̂�)

(1.24)

(1.25)

(1.26)

Page 36: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Fundamentos de la reconciliación de datos y la detección de Gross Errors

36

36

En la ecuación (1.26), 𝑀𝑇𝑖 es un ajuste estandarizado, que sigue una distribución normal con media = 0 y varianza = 1. De nuevo, los valores mayores de 𝑀𝑇𝑖 serán los primeros que habrá que revisar como sospechosos de error. A la hora de utilizar la ecuación (1.25), la matriz 𝐴 ha de contener sólo restricciones lineales y, en general, 𝑄, la matriz de varianza-covarianza, ha de ser diagonal.

1.2.2.3 3. REMEDIACIÓN DE GROSS ERRORS

Cuando se detecte un error de medida con el Global Test y estos se hayan ordenado con el Measure Test, debe actuarse en dos direcciones distintas. Por un lado, debe revisarse el proceso de obtención de las medidas redundantes más sospechosas de error (y posiblemente también las hipótesis implícitas en el modelo matemático, como la suposición de estado estacionario, la ausencia de fugas, etc.). Por otra parte, han de revisarse los resultados del problema de reconciliación cuando se eliminan una a una las medidas sospechosas. Se espera que si una medida sospechosa 𝑦𝑖 se declara no medida, se obtendrá como resultado de la reconciliación subsiguiente una reducción drástica de 𝐹. Puede demostrarse que cuando sólo se elimina una medida redundante 𝑦𝑖 , el nuevo valor de la reconciliación 𝐹∗ puede obtenerse por el procedimiento que se sigue cuando hay algunos flujos sin medir, esto es, introduciendo esa variable en la matriz 𝐴𝑧 , y reduciendo en uno el grado de redundancia. Este procedimiento recibe el nombre de Serial Elimination, SE y es un proceso iterativo que terminará de repetirse, bien cuando el Global Test deje de superarse o bien cuando el sistema deje de ser lo suficientemente redundante como para ser reconciliado.

Después de cada iteración se comprueba el cumplimiento del test global. Si ocurre:

𝐹∗ < 𝑋(1−𝛼)2 (𝑟𝑒𝑑 − 1)

estaremos en condiciones de avalar la hipótesis de que la medida sospechosa eliminada es realmente responsable del error global detectado. Esto es, estaremos reduciendo la redundancia del sistema en aras de mejorar la veracidad. No debe pensarse sin embargo que esta forma de proceder es una panacea. Puede ocurrir que ninguna o más de una medida cumplan el criterio anterior. También debe tenerse en cuenta que un Gross Error en una medida no redundante no es detectable, y si está presente, corromperá los valores calculados del resto de las variables. Sin embargo, este suceso no es habitual, ya que normalmente con la eliminación de los valores más significativos del MT se consigue hacer que el sistema gane bastante fiabilidad.

1.3 APLICACIONES INDUSTRIALES

La tecnología de la reconciliación de datos es ampliamente utilizada hoy día en una extensa variedad de industrias químicas y petroquímicas, así como en otros procesos industriales. Ésta puede ser llevada a cabo de manera offline o conectada mediante aplicaciones en línea, ya sean herramientas de optimización o de control avanzado de procesos.

(1.27)

Page 37: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

37

A continuación, haremos una aproximación a la mayoría de los usos industriales de esta tecnología. Aún sin entrar en excesivo detalle, podemos distinguir tres tipos:

1. Reconciliación de datos y detección de errores de medida en equipos puntuales

2. Estimación de parámetros y reconciliación de los mismos

3. Reconciliación de la entrada de materia prima y utilities en una planta completa.

Sistemas de contabilidad de la producción.

El texto de este apartado es, en su mayoría, una adaptación/traducción del capítulo 11 del libro de Narasimhan: Data Reconciliation and Gross Error Detection (2000).

1.3.1 RECONCILIACIÓN DE DATOS Y DETECCIÓN DE ERRORES DE MEDIDA

EN EQUIPOS PUNTUALES

La primera aplicación comercial que se le dio a la reconciliación de datos se remonta a finales de los 80, y surgió para detectar y eliminar los errores de medida que aparecían en los balances másicos y energéticos de diferentes procesos químicos. Hasta entonces se conocía el procedimiento teórico, y era empleado de manera manual por los ingenieros de planta con fines contables. Los datos en bruto se usaban para el modelado, simulación y optimización del proceso. Algunas técnicas de filtrado estadístico de datos aparecían en aplicaciones de control, pero ninguna tan eficaz como la reconciliación de datos. El resultado era un pobre rendimiento de estos sistemas, ya que los datos de entrada venían erróneos de por sí.

En la actualidad, muchos sistemas integrados de simulación de procesos, optimización y control incluyen un módulo de reconciliación, el cual los precede y trata los datos para que éstos no contengan errores, con una mejora sensible de la precisión. Muchas de las implementaciones de estos software aparecen en refinerías y plantas petroquímicas. Los usos más primitivos de la reconciliación son para equipos aislados, especialmente columnas de destilación o separación. En estas aplicaciones off-line, los flujos y las composiciones de las entradas y los productos son reconciliados haciendo balances de materia en toda la columna. A este tipo de sistemas se les llama bilineales.

En el caso de los equipos de tratamiento de crudo, los flujos de petróleo son modelados dividiéndolos en los pseudocomponentes que los forman, y los balances se llevan a cabo usando la curva de destilación de cada flujo, la cual es obtenida experimentalmente en el laboratorio. Estas aplicaciones son muy utilizadas normalmente antes de las simulaciones off-line. Sin embargo, en las optimizaciones de procesos on-line es más apropiado subdividir las plantas en subsistemas, por ejemplo, el tren de precalentamiento, el calentador del crudo, las chimeneas o la dehexanizadora.

La producción química emplea reconciliaciones en plantas de etileno, de amoniaco, de metanol o de gas de síntesis, entre otras. Otras aplicaciones industriales interesantes para esta tecnología pueden ser el procesamiento de minerales, el monitorizado y limpieza de una planta de pulpa de papel o la industria del destilado de bebidas alcohólicas.

Todas estas industrias son sólo unos pocos ejemplos. Algunos de estos casos son implementaciones on-line, en los que es necesario que un DCS (Sistema de Control Distribuido) proporcione un histórico de datos. Por supuesto, es necesario filtrar

Page 38: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Fundamentos de la reconciliación de datos y la detección de Gross Errors

38

38

previamente y eliminar valores atípicos.

Para implementar adecuadamente una reconciliación, Charpentier hio un resumen con una serie de directrices a tener en cuenta:

Las desviaciones estándar de los instrumentos de medida son muy importantes, y

debería ser empleado un procedimiento para estimarlas sistemáticamente.

La redundancia es otro factor importante al reconciliar e identificar los gross errors.

Algunas veces puede ser necesario añadir instrumentación adicional para alcanzar

el nivel de redundancia deseado. Obviamente, la óptima colocación de estos

sensores también influye, con el objetivo de obtener estratégicamente los datos

más deseados.

La detección de gross errors ha de estar siempre seguida por una corrección y un

checkeo de la instrumentación. Los problemas sin corregir en los sensores

obviamente deterioran la calidad de la solución adoptada.

La reconciliación o validación de datos es un problema complejo que puede requerir

más de una técnica diferente para hallarle respuesta. Como los flujos y

temperaturas importantes de una planta pueden ser no redundantes, a veces es

suficiente con hacer tan sólo un filtrado y validación de las medidas para obtener

una solución general.

Un sistema de reconciliación de datos potente debería ser lo suficientemente

flexible como para soportar cambios en la configuración de los procesos, o en las

desviaciones estándar de las variables, así como tratar con medidas perdidas y

aceptar ecuaciones de varios tipos, incluidas las restricciones de procesos distintas

de cero (inecuaciones).

En adición a esto, Bagajewicz y Mullick propusieron otra serie de guías y desafíos:

Cuando se aplica en refinerías, las cuales presentan una gran variedad de

composiciones diferentes, ensayar y caracterizar adecuadamente los flujos es

clave. Con una composición imprecisa, los resultados pueden no satisfacer los

balances de materia, y algunas medidas a priori correctas pueden ser identificadas

como errores.

Con los balances másicos y energéticos se mejora la redundancia de los flujos y se

obtienen reconciliaciones más precisas.

Promediar medidas o asumir el estado estacionario en algunos procesos no es

siempre posible. En ocasiones hay que desarrollar software de reconciliación

dinámica (on-line), en especial en los módulos de control más avanzados.

Cuanto más riguroso sea el modelo con la realidad no tiene por qué ser más preciso

dando una solución, pero sí es cierto que permite fusionar la DR y la obtención de

parámetros característicos en una sola pasada, ya que es un modelo más potente.

A día de hoy es necesario mejorar la precisión en la detección de GE, ya que ninguno

de los métodos y estrategias que existen dan una solución efectiva para tratar con

todos los tipos distintos o ubicaciones de estos simultáneamente.

Si atendemos a los programas informáticos, la mayoría de softwares comerciales sobre

Page 39: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

39

esta tecnología (DATACON, DATREC, ReCON, VALI o RAGE, etc.) tienen la común característica de emplear rigurosamente los modelos del sistema -que se introducen manual y gráficamente según donde se aplique-, lo cual hace más difícil la detección y ubicación de errores en el espacio del sistema. Sin embargo, algunos nuevos programas como ROMeo están basados en la optimización on-line en bucle cerrado, de manera que llegan a obtener mejores resultados en la detección de errores.

1.3.2 ESTIMACIÓN DE PARÁMETROS Y RECONCILIACIÓN DE LOS

MISMOS

Uno de los problemas asociados con la reconciliación de datos es la estimación de los parámetros de los modelos. Como ya se ha comentado, los algoritmos que se emplean en esta tecnología utilizan explícitamente los modelos de las plantas, en las cuales puede no conocerse ningún parámetro, o estos pueden variar según la operación. La mayoría de estos parámetros –como los coeficientes de transferencia de calor, los factores de ensuciamiento, las eficiencias de las bandejas en las columnas de destilación, las eficiencias de los compresores, etc.- son valores fijos a la hora de optimizar los procesos; por lo tanto, es necesario invertir en la precisión de sus estimaciones.

Un primer enfoque para la estimación de parámetros consiste en resolverla de manera simultánea al problema de reconciliación. De esta forma, los parámetros del modelo pueden ser tratados como simples variables no medidas dentro del sistema, apareciendo como incógnitas en el vector a reconciliar, o como parámetros que son modificados siguiendo algoritmos de procesos no lineales, hasta dar con las medidas adecuadas de la planta. El principal problema que surge con esta aproximación es que, en presencia de gross errors, los parámetros pueden ser mal ajustados o algunas medidas pueden ser confundidas precisamente con gross errors, debido a la mala calidad de los parámetros del modelo. Para obtener una solución precisa tanto en las variables medidas como en los parámetros, normalmente se emplea un proceso iterativo, que obviamente consume bastante tiempo, en especial con los modelos más detallados.

Un enfoque alternativo consiste en separar y resolver secuencialmente los dos problemas. En primer lugar, se lleva a cabo la reconciliación de los datos y se detectan los errores de medida, empleando únicamente los balances generales de materia y energía. Los parámetros se estiman posteriormente, empleando el set de variables recién reconciliado. Los resultados obtenidos empleando este método, al que llamamos secuencial, son idénticos a los del enfoque simultáneo si no hay parámetros estimados a priori. Es más, las estimaciones del método secuencial pueden no concordar siempre con los límites de los valores teóricos y esperables de los parámetros, por ejemplo, obteniéndose rendimientos más pequeños o elevados de lo esperable. Para evitar este problema es habitual emplear también un procedimiento iterativo. En general, este enfoque secuencial se utiliza en problemas de estimación que conectan con aplicaciones de control de procesos más avanzadas, debido a lo potente que son sus resultados. Sin embargo, debido a que el tiempo computacional es una limitación importante en estas aplicaciones, tan sólo se realiza una iteración normalmente.

Page 40: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Fundamentos de la reconciliación de datos y la detección de Gross Errors

40

40

1.3.3 RECONCILIACIÓN DE LA ENTRADA DE MATERIA PRIMA Y UTILITIES

EN UNA PLANTA COMPLETA

Plantear una reconciliación en una planta completa es una herramienta muy importante a la hora de llevar la contabilidad de las materias primas o las utilities, conocer la productividad o monitorizar la energía consumida por los procesos. Muchas refinerías ahorran enormes cantidades de dinero anualmente aplicando estas técnicas. El término que se emplea habitualmente para este tipo de reconciliaciones de plantas completas es el de contabilidad de la producción (literal del inglés ‘production accounting’); por lo tanto, emplearemos este término para las descripciones en esta sección. Contabilidad del beneficio (‘Yield accounting’) es otro de los términos empleados con bastante frecuencia.

En un sistema de contabilidad de la producción interactúan de manera simultánea varios grupos humanos distintos de la misma planta. El departamento encargado de la operación proporciona los datos de entrada y recopila los valores reconciliados. Los supervisores de la instrumentación obtienen los estados de los sensores, y los recalibra cuando es necesario. Los ingenieros de proceso, el personal contable y financiero, y los responsables de la planificación y la temporalización se encargan de elaborar informes del estado de la planta con regularidad (bien sean diarios, semanales o mensuales) para llevar a cabo la contabilidad de la producción. Esta coordinación en la obtención de datos es el primer requisito indispensable.

La siguiente tabla (Tabla 1.2) muestra los distintos tipos de datos requeridos para una reconciliación en una planta completa:

Tabla 1.2

Tipos de datos en un Sistema de Contabilidad de la Producción

Tipo de dato

Descripción

Característicos de la tipología de la planta Equipos del proceso, tanques, nodos y flujos de conexión

Datos del proceso Variables clave para caracterizar cada equipo del proceso y las utilities

Inventario de tanques Un inventario del contenido de cada equipo acumulador

Movimientos de materia en la planta (de un equipo a otro equipo o tanque) y trasvases (de tanque a tanque)

Datos de los movimientos: tiempo de inicio/parada, nodo de inicio, nodo de fin, cantidad transferida

Page 41: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

41

Mezclas Datos de las mezclas: tiempo de inicio/parada, nodo de inicio y de destino, volumen de los tanques y cantidad a mezclar

Recipientes Datos de los recipientes: tiempo de inicio/parada, nodo de inicio y de destino, cantidad recibida

Cargas de materias primas Datos de las cargas: tiempo de inicio/fin, nodo de inicio y de destino, cantidad medida

Factores de precisión de los sensores Tolerancia, fiabilidad, antigüedad, etc. de cada instrumento de medida

Laboratorio Resultados de los test en los laboratorios (densidad, %H2O, composiciones, etc.)

Datos adicionales de entrada Datos sin especificar o modificados que pueden ser utilizados por el modelo antes del cálculo de los balances. Aquí se incluyen valores perdidos, valores específicos, ajustes, etc.

Con el objetivo de tener unos datos y valores horarios de mayor calidad, la contabilidad de la producción se integra normalmente con el histórico de la planta y el sistema de gestión. Algunos valores son obtenidos automáticamente del histórico, pero otros han de ser introducidos manualmente, con la consiguiente incertidumbre. El error humano es un factor que obviamente afecta a la precisión de los datos (y en consecuencia a los resultados de la reconciliación). Es por esto por lo que algunos tipos de datos son más cruciales que otros.

Veverka y Madron (1997) describieron un procedimiento empírico para detectar errores de funcionamiento, como pueden ser los flujos perdidos o las orientaciones incorrectas de los flujos. Para ello definieron el residuo de un balance (o déficit), que se expresa como:

𝑟 = 𝑒𝑛𝑡𝑟𝑎𝑑𝑎𝑠 − 𝑠𝑎𝑙𝑖𝑑𝑎𝑠 − 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑐𝑖ó𝑛

El residuo para cada nodo se compara con un valor crítico, al que llamamos 𝑟𝑐𝑟𝑖𝑡. Si en un nodo particular se cumple que 𝑟 > 𝑟𝑐𝑟𝑖𝑡, deducimos que el balance en ese nodo es inconsistente. El principal problema surge en cómo fijar el valor de 𝑟𝑐𝑟𝑖𝑡 en cada nodo. Una parte importante de la inconsistencia de los balances en los nodos se debe a los errores en los datos, y es por tanto admisible. El resto de la inconsistencia se debe a un error de diseño. El valor de 𝑟𝑐𝑟𝑖𝑡 puede ser obtenido de un análisis estadístico del residuo 𝒓, el cual se modela como una variable aleatoria.

(1.28)

Page 42: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Fundamentos de la reconciliación de datos y la detección de Gross Errors

42

42

Las inconsistencias más graves en los balances ocurren debido a cambios frecuentes (generalmente diarios) en algunos movimientos de la planta. Obviamente, la topología de muchos procesos de una refinería es cuanto menos dinámica, y en muchas ocasiones aparecen ‘flujos temporales’ que pueden ser cero o distintos de cero dependiendo del día, ser bypaseados o incluso ser redirigidos a un tanque o equipo diferente cada vez. Se deriva por tanto que los errores reconciliando estos sistemas son muy frecuentes, ya que tenemos que tener un sistema capaz de adaptar la matriz de restricciones según convenga. Kelly propuso una estrategia un poco más compleja que encontraba las constantes erróneas en los flujos de materia, e iba seguida de una detección de GE. Esta estrategia se basa en un algoritmo que previamente elimina una serie de combinaciones de medidas, y lo que busca es simplificar la función objetivo. Lo novedoso es que antes surgía en este punto un complicado problema de combinatoria, y Kelly lo solventó con su algoritmo, ya que conseguía reducir bastante el número de combinaciones posibles para eliminar.

Un buen método de detección de gross errors es crucial para un sistema de contabilidad, ya que estos están expuestos a muchas fuentes distintas de error. En presencia de errores topológicos o de medida importantes, los resultados reconciliados pueden llegar a ser insignificantes. La tarea de la GED, sin embargo, es bastante compleja en este tipo de problemas, ya que le es muy difícil distinguir entre los que son verdaderamente errores de medida y los errores topológicos. Por si fuera poco, las fugas y pérdidas, y la existencia de flujos sin medir, añaden un nivel más de complejidad. Se invierte mucho esfuerzo investigando cómo resolver este tipo de problemas y buscando algoritmos que proporcionen soluciones más precisas.

Como ya se ha visto, algunos flujos no medidos son observables, y pueden ser estimados basándonos en las relaciones con los flujos medidos, pero la precisión de estas estimaciones a veces deja que desear, ya que se propagan los errores por el sistema. Una manera alternativa de obtener estimaciones de los flujos no medidos y otras variables implicadas en la reconciliación es con los típicos cálculos de la ingeniería química, que pueden ser realizados por un simulador. Reconciliar los equipos antes que la planta completa puede ser otra solución posible. En cualquier caso, con la suficiente redundancia pueden obtenerse estimaciones razonables para las magnitudes no representadas en el modelo.

A la hora de estimar las pérdidas (materiales y energéticas) surge un problema más complicado para reconciliar una planta completa. Por ejemplo, en una refinería hay infinidad de fuentes de pérdidas de ambos tipos, como pueden ser las llamaradas, las emisiones de compuestos volátiles orgánicos, los purgadores, los accesorios, bombas o intercambiadores, y las pérdidas de los tanques (bien sea por evaporación o por pérdidas de líquido). Y, además de estas pérdidas reales, están las causadas por medidas mal hechas, o errores calculando densidades en el laboratorio, fugas por saturación de líneas o errores de sincronización en las lecturas de los tanques.

Hay muchos modelos de pérdidas y de estimaciones de fugas disponibles de manera gratuita. En EEUU, algunas agencias gubernamentales, como el American Petroleum Institute (API) o la Environmental Protection Agency (EPA), elaboran publicaciones regularmente con procedimientos para predecir emisiones, pérdidas en tanques y fugas varias. Para una reconciliación de una planta completa, es necesario especificar primero cómo se van a emplear estos procedimientos. En general, hay tres formas de incluir las estimaciones de pérdidas en el modelo de la reconciliación:

Page 43: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

43

1. Tratar las pérdidas como flujos no medidos, y volver a estimarlos

basándonos en los datos medidos. La ventaja de este método es que no es

necesaria una ‘buena’ estimación de los flujos de pérdidas, pero se requiere

una observación de todos ellos, lo cual es muy trabajoso de obtener en una

planta real.

2. Modelar las fugas por separado, creando un modelo de la planta que incluya

los errores (conocido como ‘gross error model’). Se emplea posteriormente

un Test de Máxima Verosimilitud para detectar fugas y estimar el orden de

magnitud de las fugas (o pérdidas). Este método está limitado si hay muchas

fugas en el modelo (se vuelve un complejo problema de combinatoria;

también puede no darse la redundancia necesaria como para estimar con

precisión).

3. Tratar a las pérdidas y fugas como flujos ‘pseudo-medidos’. Las

estimaciones de estas faltas se usan como valores ’medidos’, y se les da una

desviación estándar relativamente más alta que a los flujos reales.

Posteriormente, se reconcilian conjuntamente unos con otros.

Algunos softwares típicos para reconciliar plantas completas o para llevar la contabilidad de la producción son OpenYield y SIGMAfine, ambos de pago.

1.4 MEJORA DE LA INSTRUMENTACIÓN

En esta sección se comentará brevemente el campo del diseño y la mejora de instrumentación como una de las potencialidades con más perspectiva de la reconciliación de datos. No se va a hablar de cómo ubicar sensores ni de optimización on-line, pues corresponde a las disciplinas del control automático. Las redes de sensores han de ser capaces de tratar con los gross error de manera efectiva, detectándolos si son importantes y evitando una corrupción de los datos en caso de no ser detectados.

Una red de sensores robusta debería:

a) Ser precisa: La precisión de las variables clave obtenidas mediante la

reconciliación de datos debería satisfacer las necesidades de la monitorización,

el control y la contabilidad de la producción.

b) Detectar gross errors eficientemente: Esto se conecta con la redundancia del

sistema. Cuantas más medidas tengamos mayor es la capacidad de detección.

c) Conservar una cierta precisión cuando se eliminan los GE: Ya que después de la

Serial Elimination utilizamos los sensores restantes hemos de tener garantías

de que éstos siguen siendo precisos con las variables clave.

d) Ser fiables: Si los instrumentos se rompen a menudo tendremos una fuente

frecuente de errores.

El problema de la mejora de la instrumentación consiste en alcanzar una cierta robustez en la red de sensores al mínimo coste. La precisión se define aquí como la varianza de los estimadores. La disponibilidad es la probabilidad de que un sensor no de un fallo en un tiempo dado. La fiabilidad es la misma probabilidad, pero en un periodo que va desde el

Page 44: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Fundamentos de la reconciliación de datos y la detección de Gross Errors

44

44

cero hasta el momento del primer fallo.

Madron (1992) propuso que se revisaran los antiguos métodos, pues sólo se centraban en la precisión. Cinco años después, Bagajewicz (1997) presentó el primer método que minimizaba el coste y se centraba en la robustez. Más adelante asentaron las bases del diseño de redes, que, sin entrar en profundidad, tiene por planteamiento:

𝑀𝑖𝑛𝑖𝑚𝑖𝑧𝑎𝑟 {𝐶𝑜𝑠𝑡𝑒 𝑇𝑜𝑡𝑎𝑙}

𝑠. 𝑎. 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 {𝑃𝑟𝑒𝑐𝑖𝑠𝑖ó𝑛

𝐹𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑅𝑜𝑏𝑢𝑠𝑡𝑒𝑧

donde el coste total incluye los costes de mantenimiento, que no es más que aumentar la disponibilidad de las variables. En el caso de que lo que queramos sea modernizar una planta, el coste total corresponde al coste de reubicar los instrumentos, así como el coste de adquirir nuevos. Si nos centramos exclusivamente en el problema de la detección de fallos, el criterio de diseño que habrá de seguirse será:

𝑀𝑖𝑛𝑖𝑚𝑖𝑧𝑎𝑟 {𝐶𝑜𝑠𝑡𝑒 𝑇𝑜𝑡𝑎𝑙}

𝑠. 𝑎. 𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 {

𝑂𝑏𝑠𝑒𝑟𝑣𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑅𝑒𝑠𝑜𝑙𝑢𝑐𝑖ó𝑛𝐹𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑅𝑜𝑏𝑢𝑠𝑡𝑒𝑧

La combinación de ambos criterios permite diseñar redes capaces de estimar variables clave, que pueden emplearse luego en monitorización, contabilidad de la producción y estimación de parámetros, así como en los diagnósticos y diseño de alarmas (entendidas en este contexto como una manera de detectar fugas), que es probablemente una de las metas a largo plazo de esta tecnología.

En definitiva, el diseño de instrumentación y, más importante, la mejora de ésta, es una tecnología menos madura que la reconciliación de datos, y en consecuencia no se ha alcanzado una aplicación extendida en la industria. Naturalmente, de esto se deriva que mientras la industria invierte una ingente cantidad de dinero anualmente en reconciliar datos, la mejora de la instrumentación se está quedando atrás, lo cual haría los sistemas más fiables desde el momento de su diseño. Asimismo, todavía existen algunos retos teóricos que, de momento, están sin explorar.

Casi igual de importantes son los avances que se están haciendo en el diseño de alarmas eficientes y a bajo precio. Además, aún se estudia la manera de introducir directamente otras técnicas de control automático avanzado como restricciones adicionales del problema de diseño cost-optimal. Estas técnicas pueden ser, entre otras, las redes neuronales o los análisis de zona muerta.

Hay que decir que aún no existe un software comercial aún para el diseño de redes de sensores, aunque han aparecido algunos prototipos. Se espera que esta tendencia cambie pronto, ya que la tecnología es ya lo suficientemente madura conceptualmente como para abordar la eficiencia computacional.

(1.29)

(1.30)

Page 45: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

45

Page 46: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Ejemplo de reconciliación de datos

46

46

2. EJEMPLO DE RECONCILIACIÓN DE DATOS

continuación, a efectos de ilustrar brevemente lo explicado, y antes de realizar enseñar la aplicación real a una planta, se analizará un caso sencillo de reconciliación de datos. Se tratará de un sistema en el que todos los flujos han

sido medidos. Dicho sistema ha sido simulado con una herramienta informática programada específicamente para dicha tarea.

2.1 SISTEMA LINEAL, ESTACIONARIO, CON TODOS LOS

FLUJOS MEDIDOS

El caso que vamos a analizar es un sistema con 4 nodos, correspondientes a 4 solicitaciones de una planta, y 6 variables, todas medidas por un sensor (en este caso caudales). Las ubicaciones de los sensores estarán representadas por las aspas verdes.

Puede verse en la imagen:

Figura 2.1. Esquema del ejemplo

Primero nos centraremos en crear la matriz 𝑨 de las restricciones, en este caso lineales, ya que las únicas imposiciones que le damos son los balances másicos. Así, en este primer caso la matriz será una 4x6:

𝐴 = [

1 −1 1 0 0 0

0 0 0 −1 0 0

0 0 1 0 0 0

0 −1 0 1 1 −1

]

Recordemos que las filas representan cada uno de los nodos ordenados y las columnas

A

Page 47: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

47

los distintos flujos, con signo positivo si son entrantes y negativo si son salientes. El grado de redundancia del sistema es el rango de la matriz A, que en este caso es 4.

Para entender mejor el proceso, lo que haremos será simular una operación real creando un vector de 1000 medidas aleatorias, que girarán en torno a un punto de operación dado. La variabilidad que se presenta a lo largo de tantas medidas se debe fundamentalmente al ruido de los sensores (random errors), por lo que, a priori, no se esperan gross errors en el sistema. El punto de operación viene dado por el valor teórico. Posteriormente, se determinará su varianza y se procederá a la reconciliación.

El resumen de resultados es el siguiente:

Tabla 2.1

Ejemplo 2.1. Resultados de la primera reconciliación

Flujo Valor teórico

Valor medido

Valor reconciliado

Ajuste Ajuste relativo

Varianza

t/h t/h t/h t/h % t2/h2

1 6.000 12.041 9.058 -2.982 -24.77 0.338

2 4.000 6.045 6.579 +0.534 +8.83 1.995

3 2.000 2.022 2.479 +0.457 +22.59 1.640

4 4.000 3.956 6.579 +2.623 +66.32 4.179

5 2.000 2.027 2.479 +0.452 +22.31 0.733

6 6.000 5.983 9.058 +3.075 +51.39 0.388

Puede verse como los valores reconciliados cumplen el balance másico. Observando este gráfico de barras (Figura 2.2), de los ajustes relativos, podría pensarse a priori que, en caso de existir un error, éste estará en el flujo nº 4. Ahora veremos que no es así, debido a que en los test se ponderan las variables según su peso en el sistema.

Page 48: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Ejemplo de reconciliación de datos

48

48

Figura 2.2. Ajustes relativos de las variables. En tanto por ciento.

Si sometemos al sistema a los test de errores, y posteriormente a su remediación, pueden sacarse algunas conclusiones:

Tabla 2.2

Ejemplo 2.1. Test de errores tras la primera iteración

NIVEL DE CONFIANZA

GRADO DE REDUNDANCIA

VALOR TEST VALOR CRÍTICO

GLOBAL TEST 95% 4 52.91 9.49

CONCLUSIÓN TEST NO SUPERADO EL SISTEMA TIENE ERRORES

MEASUREMENT TEST

VARIABLE VALOR MTi

6 1.4321

1 1.3891

4 1.2220

2 0.2487

3 0.2127

5 0.2106

CONCLUSIÓN SE ELIMINA LA MEDIDA 6

Page 49: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

49

Tras eliminar la medida 6, se procede a reconciliar de nuevo el sistema, pero esta vez por el método que se sigue cuando hay algunos flujos sin medir, reduciendo para ello en 1 el grado de redundancia y estimando el valor que debería adoptar dicha variable.

Tabla 2.3

Ejemplo 2.1. Resultados de la segunda reconciliación

Flujo Valor teórico

Valor medido

Valor reconciliado

Ajuste Ajuste relativo

Varianza

t/h t/h t/h t/h % t2/h2

1 6.000 12.041 11.703 -0.338 -2.81 0.338

2 4.000 6.045 8.041 +1.995 +33.01 1.995

3 2.000 2.022 3.662 +1.640 +81.11 1.640

4 4.000 3.956 3.956 +0.000 +0.00 4.179

5 2.000 2.027 2.027 +0.000 +0.00 0.733

Flujo Valor teórico

Valor estimado

t/h t/h

6 6.000 11.703

Ahora volvemos a someter al sistema al test global para ver si ha sido suficiente:

Tabla 2.4

Ejemplo 2.1. Test de errores tras la segunda iteración

NIVEL DE CONFIANZA

GRADO DE REDUNDANCIA

VALOR TEST VALOR CRÍTICO

GLOBAL TEST 95% 3 3.97 7.81

CONCLUSIÓN TEST SUPERADO EL SISTEMA NO TIENE ERRORES

Vemos que, en efecto, la variable 6 era la que nos causaba problemas y que tras su eliminación el sistema ha ganado en fiabilidad. En caso de que con una primera iteración

Page 50: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Ejemplo de reconciliación de datos

50

50

hubiese seguido sin superarse, puesto que el sistema es aun lo suficientemente redundante, podríamos haber seguido eliminando medidas. En ese caso la siguiente medida que hubiéramos suprimido hubiera sido la que ocupa la posición 2 en el Measure Test, es decir, el flujo 1.

Page 51: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

51

3. APLICACIÓN A UN CASO REAL. RED DE

HIDRÓGENO

3.1 PRESENTACIÓN DEL CASO

l hidrógeno industrial es utilizado principalmente en la conversión de las fracciones más pesadas del petróleo en otras más ligeras por el proceso del hidrocracking. También es requerido en la limpieza de los combustibles fósiles en

un proceso llamado hidrodesulfuración. Asimismo, es un componente principal en la producción de amoniaco industrial -que a su vez es la base de la mayoría de fertilizantes- y, más minoritariamente aun, en la producción de pilas de hidrógeno.

Debido a que no se encuentra habitualmente en la naturaleza de manera natural, es necesario producirlo, y la industria encargada de ello es altamente consumidora de energía. Actualmente, es obtenido en su mayoría (el 95% aprox.) a partir de combustibles fósiles, bien mediante el reformado con vapor (steam reforming), mediante la oxidación parcial del metano o por la gasificación del carbón. Aunque parece que tiene perspectiva, todavía no está muy extendida su obtención a partir de fuentes renovables (biomasa) o con electrolisis.

El caso que se va a analizar corresponde a una planta real de producción de hidrógeno de alta pureza mediante el steam reforming de naftas ligeras. Posteriormente, este hidrógeno es empleado en la fabricación de ciclohexano, benceno y para hidrodesulfurar gasóleos, querosenos y naftas.

En general, este tipo de industrias invierte mucho dinero anualmente en eficiencia energética para mejorar procesos. Si entendemos la reconciliación de datos como otra manera de mejorar en eficiencia mediante la mejora de los modelos, su importancia es vital. En nuestro caso particular el objetivo radica en la búsqueda de un producto de alta pureza: en un proceso con una ingente cantidad de instrumentación y equipos, es necesario conocer con certeza los flujos absolutos y parciales que se manejan.

Si observamos con detenimiento los diagramas del proceso, puede verse como en multitud de nodos no se conservan los balances másicos. Se realizará la reconciliación de dos nodos que ofrecen una singularidad particular.

En el primero de los nodos se hará una reconciliación dinámica lineal de las purezas de H2 antes de la entrada en el PSA, un equipo que puede conseguir elevarla hasta a un 99.99%. Cuando decimos que es dinámica es porque han sido analizados datos del histórico de la planta en casi 5800 registros distintos, lo cual permite obtener una idea más fidedigna de la actuación de los sensores, y de los puntos de funcionamiento habituales.

El segundo nodo que se ha elegido es una bifurcación especialmente crítica de un flujo que se divide en cinco, y puede observarse claramente como no se cumplen los balances. Lo que haremos será reconciliarlo linealmente en torno a un único punto de funcionamiento, esto es, suponiendo estado estacionario.

E

Page 52: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Aplicación a un caso real. Red de Hidrógeno

52

52

Nuevamente, todo el tratamiento de la información y la reconciliación recaerá sobre la herramienta que programamos, particularizándolo para este caso concreto, lo cual es muestra del potencial de aplicabilidad que ofrece esta tecnología.

A continuación, tenemos el diagrama del balance másico del proceso completo, expresado en Nm3/h (el cual convertiré a kg/h). El recuadro amarillo es el nodo anterior al PSA del que reconciliaremos las purezas (Nodo A); el recuadro rojo es el nodo que se reconciliará másicamente (Nodo B):

Figura 3.1. Diagrama de la red de hidrógeno en Nm3/h.

A

B

Page 53: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

53

En el siguiente diagrama podemos observar el mismo proceso, pero expresado en términos de pureza (en tantos por ciento):

Figura 3.2. Diagrama de la red de hidrógeno en términos de pureza (%)

En cualquier caso, ya que en el contexto global no se aprecia bien, cuando analicemos cada nodo haremos un zoom más exhaustivo sobre cada uno de ellos.

3.2 RECONCILIACIÓN DEL NODO A

El Pressure Swing Adsorption (PSA) es actualmente el proceso más ampliamente extendido en cualquier tipo de planta purificadora de hidrógeno que siga un proceso de steam reforming, debido a la alta pureza que se obtiene a su salida (del orden del 99.99%).

Consiste en un proceso cíclico complejo que utiliza lechos fijos de adsorbente sólido (zeolita o carbón activo generalmente) para eliminar las impurezas presentes en el gas. Estas impurezas quedan retenidas en él.

El proceso cíclico consta de cuatro pasos:

Al primer lecho llega la corriente del gas de alimentación a purificar. Está en la fase

de adsorción y produce hidrógeno puro a baja presión.

A

B

Page 54: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Aplicación a un caso real. Red de Hidrógeno

54

54

Mientras tanto, el segundo lecho está en la fase de despresurización, que libera gas

a presión para purgar el tercer y cuarto lecho.

El tercer lecho se purga a baja presión con el fin de eliminar impurezas.

En el último lecho se vuelve a comprimir por el gas procedente del segundo lecho.

Este lecho queda listo para hacer de nuevo una adsorción.

Una vez hecho esto, el ciclo continúa: el lecho 4 queda listo para la adsorción, pasando a ser ahora el número 1. El número 1 pasa a ser el número 2 donde se despresuriza, el 2 pasa a ser el 3 y el 3 pasa a ser el 4 y así sucesivamente.

Figura 3.3. El proceso del PSA

El nodo A se sitúa justo antes del PSA, cuando después del recuperador de hidrógeno se hace una mezcla con el gas sobrante de otras aplicaciones (offgas). La pureza de los flujos de entrada es del 70.5% y del 72.1%. Justo a la entrada del PSA tenemos aproximadamente un 71.8% de pureza.

Figura 3.4. Zoom nodo A. Aparecen las purezas medias, medidas en %

B

C

A

71.8

Page 55: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

55

La peculiaridad de este caso en particular es que va a ser reconciliado dinámicamente, esto es, en continuo a lo largo de una muestra de casi 5800 medidas.

Antes de hacer la reconciliación hemos de ver el estado inicial de los datos que nos llegan, pasándoles un filtrado previo para eliminar los valores atípicos (outliers), que disten un 95% de la mayoría de valores de la muestra. Estos outliers no tienen importancia si se van estudiando las medidas hora a hora, ya que suponen cambios abultados en la operación por motivos determinados, y han de considerarse. Sin embargo, como estudiamos una muestra tan grande, estos picos tan exagerados lo único que hacen es sesgar las medidas. Por lo tanto, todos los valores eliminados son declarados como NaNs (no-números) y se excluyen de los cálculos.

En definitiva, se filtran los datos para que las varianzas de los flujos no tomen valores desmesurados, además de ser un procedimiento más realista de lo que sucede en la planta real.

Figura 3.5. Medidas del nodo A tras filtrado (en kg/h de H2). Para 5784 registros

El gráfico amarillo de abajo corresponde a la diferencia entre los tres flujos (A-B-C). Podemos ver que, en efecto, no se cumplen los balances másicos. El gráfico de las diferencias muestra cantidades demasiado elevadas y poco admisibles, por lo que claramente será necesario reconciliar para acercar esta diferencia al cero.

Para llevar a cabo esta reconciliación, primero hemos de estudiar la varianza típica de

Page 56: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Aplicación a un caso real. Red de Hidrógeno

56

56

cada sensor analizando un estado estacionario -debido a que carecemos de información técnica sobre dichos sensores-, y obtenemos valores bastante elevados (del orden de 104), que nos dan una idea del precario estado de las mediciones inicialmente. Obviamente, en una aplicación de una planta completa en la que se dispusiera de datos de varianzas reales, generalmente de los catálogos de la monitorización, la precisión de los ajustes aumentaría.

Figura 3.6. Estados del nodo A tras reconciliación (en kg/h de H2)

Tras la reconciliación, puede verse como las diferencias entre los flujos son ahora del orden de 10-11, es decir, un descuadre en los balances que es prácticamente cero, por lo que puede afirmarse con certeza que el nodo ha sido reconciliado satisfactoriamente.

En el siguiente gráfico podemos ver el ajuste absoluto de cada medida, en el que hemos eliminado los valores atípicos. No aparece ningún valor que sea llamativo o sospechoso en principio, excepto un pico al principio que puede deberse a un cambio en la operación.

Page 57: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

57

Figura 3.7. Ajuste absoluto (en kg/h de H2)

Sin embargo, la reconciliación no siempre implica la existencia de gross errors. La peculiaridad de este nodo particular es que, a pesar de que podría pensarse que han tenido que ajustarse mucho las unidades, cuando lo sometemos al test de errores, éste no se supera. Por tanto, podemos afirmar que el nodo está en bastante buen estado con respecto a los Gross Errors y que no hay que eliminar o compensar ningún sensor.

-Observaciones

El motivo por el cual no ha sido detectado nada puede deberse a una mezcla entre la existencia de random errors y la simpleza del nodo (de su matriz 𝐴 por tanto). Además, la poca redundancia no ofrece muchas posibilidades a la hora de realizar los tests. Podría ser necesario hacer la reconciliación incluyendo a más de un nodo, tratando de abarcar más flujos y obteniendo por ello una redundancia mayor.

En cualquier caso, los resultados obtenidos así suponen una mejoría para la planta, ya que ofrecen una monitorización más fiel de lo que ocurre en un equipo tan crucial como el PSA y, aunque de momento no sea necesario obviar, habria que estar atento al comportamiento de los flujos en el orden que muestra el Measure Test, esto es, en especial al flujo A.

Page 58: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Aplicación a un caso real. Red de Hidrógeno

58

58

3.3 RECONCILIACIÓN DEL NODO B

A continuación, se va a reconciliar un nodo especialmente estratégico dentro de la planta, ya que es la bifurcación de un flujo en cinco, y se observa fácilmente que no cumple con los balances de materia. A diferencia del anterior, este nodo será reconciliado de manera estacionaria, ya que no se poseen datos del histórico, y en lugar de trabajar con purezas, lo haremos con valores absolutos de los flujos en kg/h.

En el siguiente diagrama puede observarse resaltada en amarillo la bifurcación de la que hablamos, en el primero la vemos sobre el esquema de la planta y en el segundo aparece aislada. Consta de 2 sub-nodos unidos por un tramo intermedio (X) del que no se disponen medidas, por lo que en conjunto deberá ser tratada como un caso con algunos flujos medidos y otros sin medir. Las unidades del diagrama de arriba están expresadas en Nm3/h de H2, las cuales convertimos a kg/h para realizar los balances másicos y la reconciliación, según la relación:

1 𝑁𝑚3 𝐻2 = 0.0899 𝑘𝑔 𝐻2

Figura 3.8. Esquema del nodo B. En kg/h de H2

1

2

X

6

5

4 3

3104 kg/h

1040 kg/h

921 kg/h

860 kg/h

103 kg/h 710 kg/h

Page 59: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

59

Realizamos el balance de materia al sistema para ver que, en efecto, existe un error considerable y el sistema ha de ser reconciliado:

3104 − 1040 − 710 − 103 − 860 − 921 = −530 𝑘𝑔

El primer problema que surge en la reconciliación de este nodo es en la asignación de las varianzas, ya que no disponemos de una muestra para obtenerlas, tan sólo de una medida en estacionario. Para solventar esto, lo que hicimos fue buscar en la bibliografía 1 los valores típicos que suelen tomar, y se decía que es normal que éstas oscilen entre el 5 y el 12 por ciento del valor medio, así que asignamos aleatoriamente uno de estos porcentajes a cada uno de los flujos y proseguimos.

Así, tras introducirle al sistema las matrices de las restricciones, y teniendo en cuenta que el flujo intermedio, X, no ha sido medido, obtenemos los resultados de una primera iteración, tal y como refleja la Tabla 3.1:

Tabla 3.1.

Nodo B. Resultados tras la primera iteración

Flujo Valor teórico

Valor medido

Valor reconciliado

Ajuste Ajuste relativo

Varianza

kg/h kg/h kg/h kg/h % kg2/h2

1 - 3104 3256.54 -152.54 -4.91 155.2

2 - 1040 978.67 +61.33 +5.90 62.4

3 - 710 661.15 +48.85 +6.88 49.7

4 - 103 89.84 +13.16 +12.78 13.4

5 - 860 741.66 +118.34 +13.76 120.4

6 - 921 785.22 +135.78 +14.74 138.2

Flujo Valor teórico

Valor estimado

kg/h kg/h

X 2064 2278

1 Veverka, V.V. and F. Madron 1997. Material and Energy Balancing in the Process Industries—From Microscopic Balances to Large Plants.

Page 60: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Aplicación a un caso real. Red de Hidrógeno

60

60

Analizando nuevamente si se cumplen los balances de materia, vemos que, en efecto, la gran diferencia que existía antes de reconciliar ha sido reducida prácticamente a cero:

3256.54 − 978.67 − 661.15 − 89.84 − 741.66 − 785.22 = 0 𝑘𝑔

En el siguiente gráfico de barras observamos los ajustes relativos a las variables:

Figura 3.9. Ajustes relativos tras primera iteración. En tanto por ciento.

Puede observarse como el flujo 1 ha sido reducido casi un 5%, mientras que los tres últimos han sido aumentados casi un 15% cada uno. Este factor nos hace pensar que el sistema se encuentra en bastante mal estado, ya que no es una sola la variable sobre la que recaía originalmente el error.

Para confirmar lo anterior, lo que hacemos es someter al sistema a los test de errores. Sabiendo que el grado de redundancia es sólo de 1 (recordemos, el grado de la matriz de restricciones), en caso de tener que eliminar alguna medida no tendríamos mucho margen de rectificación, puesto que el valor crítico de la distribución Chi-Cuadrado es muy reducido.

Tabla 3.2

Nodo B. Test de errores tras la primera iteración

NIVEL DE CONFIANZA

GRADO DE REDUNDANCIA

VALOR TEST VALOR CRÍTICO

GLOBAL TEST 95% 1 520.91 3.84

CONCLUSIÓN TEST NO SUPERADO EL SISTEMA TIENE ERRORES

Page 61: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

61

MEASUREMENT TEST

VARIABLE VALOR MTi

1 1.4733

6 1.3115

5 1.1430

2 0.5924

3 0.4718

4 0.1271

CONCLUSIÓN SE ELIMINA LA MEDIDA 6*

*En este caso en particular vamos a eliminar la medida que ocupa la posición 2 del MT, es decir, el flujo 6, ya que la primera es de especial importancia por ser el único flujo entrante en el sistema y no conviene eliminarlo. El motivo principal es que supone la salida de un equipo importante, e interesa conocerlo, pero además es por precaución, para que en un futuro pudieran realizarse más conexiones a la línea principal. Asimismo, según el test, entre la primera y la segunda posición no hay tanta diferencia, por lo que esta elección no supone un problema grave.

Así, tras eliminar la medida del flujo 6, procedemos a realizar la segunda iteración:

Tabla 3.3.

Nodo B. Resultados tras la segunda iteración

Flujo Valor teórico

Valor medido

Valor reconciliado

Ajuste Ajuste relativo

Varianza

kg/h kg/h kg/h kg/h % kg2/h2

1 - 3104 2952.7 +151.3 +4.87 155.2

2 - 1040 1100.8 -60.83 -5.85 62.4

3 - 710 758.45 -48.45 -6.82 49.7

Page 62: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Aplicación a un caso real. Red de Hidrógeno

62

62

4 - 103 116.05 -13.053 -12.67 13.4

5 - 860 977.37 -117.37 -13.65 120.4

Flujo Valor teórico

Valor estimado

kg/h kg/h

X 2064 2278

6 - 703

Si observamos el gráfico de los ajustes relativos, vemos como en la segunda iteración se han invertido los signos de todos los ajustes, para compensar la eliminación del flujo 6.

Figura 3.10. Ajustes relativos tras segunda iteración. En tanto por ciento.

Volvemos a realizar el test de errores, en éste caso sólo el Global Test, debido a que ya hemos gastado la redundancia del sistema:

Tabla 3.4

Ejemplo 2.1. Test de errores tras la segunda iteración.

NIVEL DE CONFIANZA

GRADO DE REDUNDANCIA

VALOR TEST VALOR CRÍTICO

GLOBAL TEST 95% 0 12.37 3.84

Page 63: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

63

CONCLUSIÓN TEST PRÁCTICAMENTE SUPERADO

ASUMIMOS QUE EL SISTEMA YA NO TIENE ERRORES

Vemos como, en efecto, el hecho de eliminar el flujo 6 ha hecho que el sistema reduzca el valor de su Global Test en un 77%. Debido a que ya no disponemos de más redundancia para eliminar, decidimos tomar la medida como válida, asumiendo que el sistema ya no tiene errores.

- Observaciones

Se demuestra que, a pesar de no siempre ofrecer resultados inmediatamente satisfactorios, las aplicaciones de las técnicas de detección de GE ofrecen un gran potencial a la hora de dotar de sentido a los balances en una industria. Asimismo, en caso de que hubiéramos dispuesto de más datos para analizar la industria más en su conjunto -en lugar de nodo a nodo-, tal vez hubiéramos podido implantar un sistema de monitorización de la producción, mezclar la reconciliación con la economía de la planta, y utilizarlo como una herramienta para mejorar la eficiencia energética.

En cualquier caso, el hecho de haber creado un código capaz de reconciliar datos de manera automática, puede abrir una posibilidad a su implantación en softwares de eficiencia energética, ya que hasta ahora parece que estos se ejecutan únicamente como módulos aislados.

Page 64: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Conclusiones

64

64

4. CONCLUSIONES

n este trabajo se ha desarrollado un estado del arte de las técnicas de reconciliación de datos y de detección de gross errors. Una de las conclusiones a las que se ha llegado es que, aunque es una tecnología bastante madura

atendiendo a su antigüedad, no lo es tanto por su extensión en el mundo industrial, ya que son numerosas las plantas que no vigilan con detenimiento el estado de su monitorización. Uno de los enfoques propuestos en este trabajo demuestra que puede ser aplicada tanto de manera dinámica (on-line) como estática, consiguiendo bastante más precisión que otras técnicas de filtrado de datos.

Atendiendo a los casos realizados, el motivo por el cual en ocasiones no han sido detectados gross errors puede deberse a una mezcla entre la existencia de abundante ruido y la simpleza de los nodos analizados (de su matriz 𝐴 por tanto). Esto es debido a que la poca redundancia no ofrece muchas posibilidades a la hora de realizar los tests. En dichas ocasiones sería necesario probar a hacer la reconciliación incluyendo a más de un nodo, tratando de abarcar más flujos y obteniendo por ello una redundancia mayor.

De cualquier manera, los resultados obtenidos únicamente con la reconciliación suponen una mejoría para cualquier planta, ya que ofrecen una monitorización más fiel a la realidad y, aunque en ocasiones no sea necesario obviar medidas, ésta puede ser empleada también como un indicativo de aquellos sensores que precisan un mantenimiento más inmediato.

Por tanto, las aplicaciones de las técnicas de detección de GE ofrecen un gran potencial a la hora de dotar de pleno sentido a los balances en una industria, muy sesgados en ocasiones, y suponen un potente nexo de unión entre los campos del control automático y la eficiencia energética, tan carente en ocasiones de datos veraces.

5. DESARROLLO FUTURO

a productividad de las fabricas podría mejorar si se aplicaran técnicas distintas de recogida y extracción de datos, dado que estas no están muy extendidas entre la geografía española. Según el diario El Economista, el 89% de los responsables de

producción de las empresas fabriles españolas declara desconocer las aplicaciones prácticas de tecnologías como el Big Data, los sistemas de gestión MES o la reconciliación de datos.

Aparece aquí un potencial futuro bastante claro para las técnicas explicadas en este trabajo, el cual nos indica que hay aún mucho terreno por recorrer en su implantación a nivel nacional. El primer paso por tanto es la concienciación sobre su importancia.

Además, si la reconciliación se aplica a una escala mayor, es decir, con miras a una

E

L

Page 65: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

65

planta completa, puede ser posible la implantación de un sistema que monitorice de manera fidedigna la producción y las utilities -en ocasiones descontroladas por los mismos encargados-, lo cual, si se mezcla aparte con la economía de la planta, puede ser empleado como una herramienta para mejorar la eficiencia energética y reducir costes materiales.

Para este trabajo se ha desarrollado un prototipo de herramienta capaz de reconciliar datos de manera automática, la cual reduce el problema a una simple interfaz y facilita su implantación tanto de manera on-line como off-line. Todo esto puede abrir una posibilidad a la implantación, como un módulo aparte, en softwares de eficiencia energética industrial, lo cual podría significar un avance en la calidad de las soluciones que estos ofrecen, sin suponer necesariamente un incremento considerable en su coste.

Asimismo, si todas estas técnicas se fueran realizando desde las fases tempranas del diseño de redes, es decir, si se aplicaran criterios distintos en la elección de la monitorización, se iría ganando en eficiencia energética y económica sin que esto supusiera necesariamente un aumento de los costes de inversión.

Page 66: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

Desarrollo futuro

66

66

Page 67: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

67

REFERENCIAS

ATAURIMA ARELLANO, Miguel 2013. Matlab y Simulink para Ingeniería, Nivel I. Universidad de Ciencias y Humanidades, UCH. Lima, Perú.

Bagajewicz M., DATA RECONCILIATION AND INSTRUMENTATION UPGRADE. OVERVIEW AND CHALLENGES

Benqlilou, Chouaib 2004. THESIS: Data Reconciliation as a Framework for Chemical Processes Optimization and Control. Dpt. of Chemical Engineering, Universitat Politècnica de Catalunya.

Braunschweig, B. & Gani, R. 2002. Software Architectures and Tools for Computer Aided Process Engineering. Elsevier Science B.V.

Conceptos básicos en sensores.

Adaptado de: instrumentacionelectronicai.wordpress.com/tag/resolucion/

FILLON M.; MEYER, M. et al. 1995. Data reconciliation based on elemental balances applied to batch experiments. Elsevier, Great Britain.

KNOPF, F. Carl 2012. Modeling, Analysis and Optimization of Process and Energy Systems. Louisiana State University. Baton Rouge, LA

LOZANO, M. y REMIRO J. 2002. Clasificación de variables y reconciliación de datos en ingeniería de procesos. Dpto. Ingeniería Mecánica, Universidad de Zaragoza, Centro Politécnico Superior.

Madron F. 1992, Process Plant Performance, Measurement Data Processing for Optimization and Retrofits. Ellis Horwood, England.

MAH, R.S.H. 1990. Chemical Process Structure and Information Flows. Butterworths, Stoneham, MA.

Narasimhan, S. & C. Jordache 2000. Data Reconciliation and Gross Error Detection: An Intelligent Use of Process Data. Gulf Publishing Company, Houston, TX.

Page 68: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

68

68

North Carolina St. Univ., USA; Univ. of Ottawa, Canada 2003. Module: Introduction to Data Reconciliation using Mathworks Matlab.

Romagnoli, J.A. & M.C. Sanchez 2000. Data Processing and Reconciliation for Chemical Process Operations. Academic Press, London.

Veverka, V.V. and F. Madron 1997. Material and Energy Balancing in the Process Industries—From Microscopic Balances to Large Plants. Elsevier, Amsterdam.

WIKIPEDIA.com. "Precisión y Exactitud". De libre acceso. // “Pressure Swing Adsorption Technology”. De libre acceso.

Xiaolong Jiang, Pei Liu, Zheng Li 2014. Data reconciliation and gross error detection for operational data in power plants. Tsinghua University, Beijing.

Page 69: Trabajo Fin de Grado - bibing.us.esbibing.us.es/proyectos/abreproy/90920/fichero/TFG... · que supone el punto y final a todo el esfuerzo realizado durante estos años para alcanzar

69

GLOSARIO

RE: Random Error

GE: Gross Error

DR: Data Reconciliation

SSDR: Steady-State Data Reconciliation

EVM: Error-in-all Variables Method

MGED: Multiple Gross Error Detection

GT: Global Test

MT: Measure Test

SE: Serial Elimination

DCS: Sistema de Control Distribuído