19
CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN 22.1 Control de calidad y detección de errores El control de calidad comienza con la selección de] sitio de recolección de datos y el mantenimiento de los instrumentos. El objetivo del control de calidad es asegurar la mayor estandarización posible de los datos primarios antes que se envíen a los usuarios. 22.1.1 Inspección de las estaciones Es esencial, que las estaciones sean inspeccionadas periódicamente para asegurar el funcionamiento correcto de los instrumentos de medición y la calidad de las observaciones. El nivel del cero de la escala de las estaciones hidrométricas y de las estaciones de observación del agua subterránea debe verificarse por lo menos una vez al año. Estas inspecciones pueden ser independientes a la inspección de rutina y a las visitas de mantenimiento. En algunos países, es frecuente que las inspecciones sean efectuadas por oficinas regionales por lo menos una vez al año, con visitas menos frecuentes efectuadas por un inspector de la oficina central. Para una estación de aforo de caudales, estas inspecciones tienen por objetivo la estabilidad de la curva de caudales, la realización de las tareas de inspección que se enumeran más adelante y la revisión de la concordancia entre la escala limnimétrica y los puntos de referencia de nivel, permanente, para verificar que la escala no ha cambiado. Como se recomienda efectuar un mínimo de diez mediciones de caudal por año en una estación de aforo, la mayoría de las estaciones deberían ser inspeccionadas regularmente al menos dos veces al año. El programa de inspección debería incluir también las visitas de un técnico o de un inspector bien calificado inmediatamente después de cada inundación importante, a fin de controlar la estabilidad de la sección fluvial y de las escalas limnimétricas. A veces, el observador debería poder realizar esas tareas de inspección, llevándolas a cabo durante las visitas de recolección de datos y de observación (sección 21.4). Las tareas del inspector son: a) tomar nota y registrar cualquier cambio del sitio de observación (sería útil tomar fotografías y hacer un croquis); b) tomar medidas para mejorar o restaurar el sitio de observación (por ejemplo, la remoción de árboles que pudieran afectar la medición de los pluviómetros); c) verificar los instrumentos y hacer cualquier reparación de campo o ajuste necesarios; d) examinar el libro de registros del observador; e) instruir al observador, si procede, sobre los procedimientos de observación y el mantenimiento de rutina de los instrumentos; f) repetir al observador la importancia que tiene el archivo rápido de datos exactos y completos; g) informar al observador sobre cualquier observación especial que pueda requerirse (por ejemplo, lecturas más frecuentes durante los períodos de crecida y tormentas). A fin de desempeñar efectivamente la tarea e), el inspector debe estar informado de los errores hechos por los observadores, en especial de cualquier error que se repita. Esta información debería remitirse regularmente al inspector por los funcionarios encargados de los procedimientos preliminares de comprobación y detección de errores. Los resultados de estas inspecciones deberían incluirse en los archivos de descripción de la estación (sección 21.2.2.). 22.1.2 Control preliminar de los datos La diferencia entre el control preliminar y la detección de errores es más bien arbitraria. Los procedimientos incluidos en el control preliminar en un país pueden ser incluidos en la detección de error en otro. Asimismo, el uso de la computadora en el proceso de datos puede cambiar las definiciones de control preliminar. Por ejemplo, cuando los datos son recogidos manualmente y luego transferidos a una forma legible por la computadora (diskette, cinta magnética u hojas legibles por el lector óptico), el término de control preliminar se refiere a los procedimientos efectuados antes de a la transferencia de los datos a una máquina que permita un proceso ínformático. Cuando los datos son recogidos directamente en forma digital, el control previo a la primera máquina que los procesa se limitará a la identificación exacta (identificación de la estación, de las fechas del inicio y finalización de esta secuencia de datos y la identificación apropiada del tipo de datos de que se trate, como los parámetros muestreados y la frecuencia del muestreo). En estas condiciones, el control de calidad de los datos sólo puede realizarse con medios informáticos. Para datos recogidos manualmente, el control preliminar debería incluir generalmente las etapas siguientes: a) registrar la fecha de recepción del informe; b) verificar que la información es completa y exacta, por ejemplo, fecha, nombre y número de identificación de la estación si se requiere en el proceso mecánico ulterior; c) controlar que la estación ha dado los datos completos; d) verificar la operación aritmética realizada por el observador;

CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

Page 1: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación

CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN

22.1 Control de calidad y detección de errores El control de calidad comienza con la selección de] sitio de recolección de datos y el mantenimiento de los instrumentos. El objetivo del control de calidad es asegurar la mayor estandarización posible de los datos primarios antes que se envíen a los usuarios. 22.1.1 Inspección de las estaciones Es esencial, que las estaciones sean inspeccionadas periódicamente para asegurar el funcionamiento correcto de los instrumentos de medición y la calidad de las observaciones. El nivel del cero de la escala de las estaciones hidrométricas y de las estaciones de observación del agua subterránea debe verificarse por lo menos una vez al año. Estas inspecciones pueden ser independientes a la inspección de rutina y a las visitas de mantenimiento. En algunos países, es frecuente que las inspecciones sean efectuadas por oficinas regionales por lo menos una vez al año, con visitas menos frecuentes efectuadas por un inspector de la oficina central. Para una estación de aforo de caudales, estas inspecciones tienen por objetivo la estabilidad de la curva de caudales, la realización de las tareas de inspección que se enumeran más adelante y la revisión de la concordancia entre la escala limnimétrica y los puntos de referencia de nivel, permanente, para verificar que la escala no ha cambiado. Como se recomienda efectuar un mínimo de diez mediciones de caudal por año en una estación de aforo, la mayoría de las estaciones deberían ser inspeccionadas regularmente al menos dos veces al año. El programa de inspección debería incluir también las visitas de un técnico o de un inspector bien calificado inmediatamente después de cada inundación importante, a fin de controlar la estabilidad de la sección fluvial y de las escalas limnimétricas. A veces, el observador debería poder realizar esas tareas de inspección, llevándolas a cabo durante las visitas de recolección de datos y de observación (sección 21.4).

Las tareas del inspector son: a) tomar nota y registrar cualquier cambio del sitio de observación (sería útil tomar fotografías y hacer un croquis); b) tomar medidas para mejorar o restaurar el sitio de observación (por ejemplo, la remoción de árboles que pudieran afectar

la medición de los pluviómetros); c) verificar los instrumentos y hacer cualquier reparación de campo o ajuste necesarios; d) examinar el libro de registros del observador; e) instruir al observador, si procede, sobre los procedimientos de observación y el mantenimiento de rutina de los instrumentos; f) repetir al observador la importancia que tiene el archivo rápido de datos exactos y completos; g) informar al observador sobre cualquier observación especial que pueda requerirse (por ejemplo, lecturas más frecuentes

durante los períodos de crecida y tormentas). A fin de desempeñar efectivamente la tarea e), el inspector debe estar informado de los errores hechos por los observadores, en especial de cualquier error que se repita. Esta información debería remitirse regularmente al inspector por los funcionarios encargados de los procedimientos preliminares de comprobación y detección de errores. Los resultados de estas inspecciones deberían incluirse en los archivos de descripción de la estación (sección 21.2.2.). 22.1.2 Control preliminar de los datos La diferencia entre el control preliminar y la detección de errores es más bien arbitraria. Los procedimientos incluidos en el control preliminar en un país pueden ser incluidos en la detección de error en otro. Asimismo, el uso de la computadora en el proceso de datos puede cambiar las definiciones de control preliminar. Por ejemplo, cuando los datos son recogidos manualmente y luego transferidos a una forma legible por la computadora (diskette, cinta magnética u hojas legibles por el lector óptico), el término de control preliminar se refiere a los procedimientos efectuados antes de a la transferencia de los datos a una máquina que permita un proceso ínformático. Cuando los datos son recogidos directamente en forma digital, el control previo a la primera máquina que los procesa se limitará a la identificación exacta (identificación de la estación, de las fechas del inicio y finalización de esta secuencia de datos y la identificación apropiada del tipo de datos de que se trate, como los parámetros muestreados y la frecuencia del muestreo). En estas condiciones, el control de calidad de los datos sólo puede realizarse con medios informáticos. Para datos recogidos manualmente, el control preliminar debería incluir generalmente las etapas siguientes: a) registrar la fecha de recepción del informe; b) verificar que la información es completa y exacta, por ejemplo, fecha, nombre y número de identificación de la estación

si se requiere en el proceso mecánico ulterior; c) controlar que la estación ha dado los datos completos; d) verificar la operación aritmética realizada por el observador;

Page 2: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación

e) comparar el informe del observador con los datos registrados.

En muchos países esta última etapa puede ser efectuada por medios mecánicos. Las correcciones deberían introducirse de manera legible y en una tinta de color diferente al que se usa para rellenar el formulario original, asegurándose de que la información original no resulte tachada o hecha ¡legible.

Ciertos controles preliminares deberían también aplicarse a los datos provenientes de indicadores de registro continuo. Las horas registradas al principio y al final del gráfico, y en el control a cualquier tiempo intermedio, deberían verificarse para determinar si necesitan aplicarse correcciones de tiempo, o para determinar la magnitud de la corrección. Debería ponerse especial atención para determinar si la corrección de tiempo se debe a la interrupción del reloj o si se puede prorratear razonablemente en el período del gráfico. Además, el control de las observaciones de instrumentos de registro deberían hacerse sobre el gráfico, para permitir las correcciones de los datos registrados, si fuera necesario.

En algunos casos de datos recogidos manualmente, los cálculos de los datos observados se hacen antes de que los datos estén listos para la transferencia a una máquina en forma legible. Frecuentemente, estos cálculos son demasiados complejos para ser efectuados por el observador, y deben hacerse en una oficina central. Un ejemplo es el calculo de la evaporación de un lago a partir de datos auxiliares y de datos de evaporación en un tanque. En algunos países, estos cálculos pueden ser hechos por medios mecánicos (computadora o calculadora).

A veces, los informes de los observadores son incompletos, pero las observaciones que faltan pueden estimarse o interpolarse. Por ejemplo, durante la disminución del nivel de agua de un río en una temporada seca, la interpelación de datos de 1 0 a 30 días puede ser justificada si las observaciones de precipitación y la temperatura indican que no fue importante el aporte de lluvia o la fusión de la nieve. En el caso de datos de precipitaciones diarias, se pueden estimar las observaciones faltantes para uno o dos días, si la tormenta que produjo la precipitación ha aportado cantidades bastante uniformes en las estaciones de observación circundantes. Todos los valores interpelados o estimados deberían ser claramente indicados, como en el registro original y en las publicaciones y debería prestarse especial atención para estar seguro de que las condiciones permiten una interpelación razonablemente exacta. 22.1.3 Detección del error La eficiencia de los procedimientos de control de calidad depende mucho de la posibilidad de utilizar o no una instalación de proceso de datos. Un resumen de las prácticas y principios generales para el proceso de datos por los medios informáticos figura en la Guía de prácticas climatológicas [1] de la OMM. La aplicación de esos procedimientos supone que se dispone de una instalación de proceso de datos. Cuando no se dispone de este equipo, estas actividades pueden ser emprendidas a mano, con ayuda del personal administrativo y el personal técnico. Incluso si se usan métodos de proceso mecánico en datos recogidos manualmente, los ajustes a las observaciones originales deberían hacerse con gran cuidado por los técnicos experimentados o por personal profesional. Las técnicas para el control de calidad de los datos difieren por diversos elementos. La base de la mayoría de procedimientos de control de calidad, para datos de temperatura y precipitación recogidos manualmente, son tablas de máquina, de la serie de datos diarios, por distrito o región. Estas tablas permiten detectar, en una lectura sencilla, las estaciones en las que los datos tienen siempre un error o tuvieron errores graves en la medición de la precipitación o la temperatura. Sin embargo, debe tenerse cuidado antes de cambiar los datos de una observación. Un estudio del informe, un control de las observaciones de la estación (con respecto a la calidad de su registro), y una evaluación de los factores que produjeron el suceso (para asegurarse que los datos en cuestión no pueden ser una anomalía natural) son necesarios antes de corregir un error aparente. La alteración debería ser codificada para indicar que se ha hecho un cambio a los datos originales y se conservarán los detalles de las modificaciones efectuadas. Otro método que puede usarse para comprobar las fluctuaciones relativas de un elemento observado en un período determinado es el uso de varios tipos de relaciones matemáticas (por ejemplo, polinomios). El valor calculado es comparado con el valor observado en el tiempo. Si la diferencia entre los dos no excede la tolerancia establecida con anterioridad, los datos son considerados como correctos. Si se exceden los limites, entonces se debería hacer una investigación.

Como los datos de flujo fluvial varían de manera continua en el tiempo y en el espacio, es posible verificar la fiabilidad de la observación por métodos de interpolación o por métodos estadísticos. El control de la coherencia interna entre caudales observados puede también haberse realizado por:

a) evaluación cualitativa de la correspondencia entre caudales medidos en estaciones adyacentes; b) evaluación cualitativa de la correspondencia entre caudales medidos y su valor durante la medición anterior; c) control aproximado del valor del caudal, observando que cae dentro de la gama de valores previos para la fase dada en

el régimen del río; d) evaluación aproximada de la correspondencia entre el valor medido y las variaciones normales durante el período

anterior.

El control inforinático de la calidad de los datos primarios es objetivo y permite un control completo de los informes individuales, resultando superfluo cualquier otro control de los resultados derivados del análisis de esos datos primarios.

Page 3: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación

Cabe destacar que el único método absolutamente seguro para decidir si se deben aceptar o rechazar los resultados excepcionales, es examinar con mucho cuidado las condiciones en las que se obtuvieron estas observaciones. 22.1.4 Resultados del control de calidad

Para datos recogidos manualmente y transcriptos luego en forma adaptada al proceso informática, los errores detectados por controles preliminares o por procedimientos de detección de error, deberían ser tratados como se indica a continuación: a) la corrección debe ser hecha en forma legible sobre el original y debe llevar las iniciales del funcionario que hace la

corrección; b) las tarjetas perforadas que contienen los datos erróneos deben ser corregidas y la corrección debe trasladarse a las

copias existentes de la observación y a los datos que puedan haber derivado de observaciones erróneas; c) el observador de la estación debe ser informado del error. Si el error es de tipo sistemático, causado por el mal

funcionamiento de los instrumentos o por no haber utilizado los procedimientos correctos, el inspector debe ir a la estación para tratar de resolver el problema (sección 2 l. l. l);

d) una nota del error debe hacerse en el libro de registro o en el archivo de descripción de la estación (sección 21.2.2). Esta manera de proceder permite un control permanente de la calidad de las observaciones en todas las estaciones y que los inspectores sepan cuales son las estaciones donde se cometen errores con frecuencia.

Para los datos recolectados en forma de tarjeta perforada, los errores detectados y verificados deben ser corregidos en los resúmenes producidos por la computadora. El registro original del procesador no debe ser alterado, pero los símbolos o anotaciones deberían ser incluidos en la elaboración final indicando los valores rechazados en base a si los datos son procesados automática o semi automáticamente. Por ejemplo, para registros de ríos, registrados automáticamente a intervalos de tiempo uniforme, un test de diferencia secuencial puede ser usado para prestar atención a los valores registrados que cambian más que el dado por el test de diferencia. Después de la inspección manual de esos valores, algunos serán rechazados y otros aceptados. Las tablas de síntesis de los resultados serán después revisadas y codificadas (sección 22.3) teniendo en cuenta las convenciones admitidas, pero no se alterarán los datos originales. Todas esas correcciones deben ser totalmente documentadas.

22.2 Procedimientos de validación En el primer nivel, el recolectar controlará cuidadosamente los datos, los evaluará y los preparará para la etapa siguiente. El recolectar puede así mejorar la calidad de los datos antes de que sean sometidos al sistema de procesamiento. Los controles de calidad deberían aplicarse para verificar los datos. Estos controles se basan en la aplicación de controles de lectura para detectar errores en tiempo y en magnitud. Los test de calibración de instrumentos son examinados y evaluados según criterios de uniformidad y de desviación de las medidas. Se hace un examen visual de las lecturas secuenciales o de trazos registrados a la luz de modelos usan métodos de proceso mecánico en datos recogidos manualmente, los ajustes a las observaciones originales deberían hacerse con gran cuidado por los técnicos experimentados o por personal profesional. Las técnicas para el control de calidad de los datos difieren por diversos elementos. La base de la mayoría de procedimientos de control de calidad, para datos de temperatura y precipitación recogidos manualmente, son tablas de máquina, de la serie de datos diarios, por distrito o región. Estas tablas permiten detectar, en una lectura sencilla, las estaciones en las que los datos tienen siempre un error o tuvieron errores graves en la medición de la precipitación o la temperatura. Sin embargo, debe tenerse cuidado antes de cambiar los datos de una observación. Un estudio de¡ informe, un control de las observaciones de la estación (con respecto a la calidad de su registro), y una evaluación de los factores que produjeron el suceso (para asegurarse que los datos en cuestión no pueden ser una anomalía natural) son necesarios antes de corregir un error aparente. La alteración debería ser codificada para indicar que se ha hecho un cambio a los datos originales y se conservarán los detalles de las modificaciones efectuadas. Otro método que puede usarse para comprobar las fluctuaciones relativas de un elemento observado en un período determinado es el uso de varios tipos de relaciones matemáticas (por ejemplo, polinomios). El valor calculado es comparado con el valor observado en el tiempo. Si la diferencia entre los dos no excede la tolerancia establecida con anterioridad, los datos son considerados como correctos. Si se exceden los limites, entonces se debería hacer una investigación. Como los datos de flujo fluvial varían de manera continua en el tiempo y en el espacio, es posible verificar la fiabilidad de la observación por métodos de interpolación o por métodos estadísticos. El control de la coherencia interna entre caudales observados puede también haberse realizado por:

a) evaluación cualitativa de la correspondencia entre caudales medidos en estaciones adyacentes; b) evaluación cualitativa de la correspondencia entre caudales medidos y su valor durante la medición anterior; c) control aproximado del valor del caudal, observando que cae dentro de la gama de valores previos para la fase dada en el régimen del río; d) evaluación aproximada de la correspondencia entre el valor medido y las variaciones normales durante el período anterior.

El control informática de la calidad de los datos primarios es objetivo y permite un control completo de los informes individuales, resultando superfluo cualquier otro control de los resultados derivados del análisis de esos datos primarios. Cabe destacar que el único método absolutamente seguro para decidir si se deben aceptar o rechazar los resultados excepcionales, es examinar con mucho cuidado las condiciones en las que se obtuvieron estas observaciones.

Page 4: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación

22.1.4 Resultados del control de calidad Para datos recogidos manualmente y transcriptos luego en forma adaptada al proceso informática, los errores detectados por controles preliminares o por procedimientos de detección de error, deberían ser tratados como se indica a continuación:

a) la corrección debe ser hecha en forma legible sobre el original y debe llevar las iniciales del funcionario que hace la corrección; b) las tarjetas perforadas que contienen los datos erróneos deben ser corregidas y la corrección debe trasladarse a las copias existentes de la observación y a los datos que puedan haber derivado de observaciones erróneas; c) el observador de la estación debe ser informado del error. Si el error es de tipo sistemático, causado por el mal funcionamiento de los instrumentos o por no haber utilizado los procedimientos correctos, el inspector debe ir a la estación para tratar de resolver el problema (sección 2 l. l. l); d) una nota del error debe hacerse en el libro de registro o en el archivo de descripción de la estación (sección 21.2.2). Esta manera de proceder permite un control permanente de la calidad de las observaciones en todas las estaciones y que los inspectores sepan cuales son las estaciones donde se cometen errores con frecuencia.

Para los datos recolectados en forma de tarjeta perforada, los errores detectados y verificados deben ser corregidos en los resúmenes producidos por la computadora. El registro original del procesador no debe ser alterado, pero los símbolos o anotaciones deberían ser incluidos en la elaboración final indicando los valores rechazados en base a si los datos son procesados automática o semi automáticamente. Por ejemplo, para registros de ríos, registrados automáticamente a intervalos de tiempo uniforme, un test de diferencia secuencias puede ser usado para prestar atención a los valores registrados que cambian más que el dado por el test de diferencia. Después de la inspección manual de esos valores, algunos serán rechazados y otros aceptados. Las tablas de síntesis de los resultados serán después revisadas y codificadas (sección 22.3) teniendo en cuenta las convenciones admitidas, pero no se alterarán los datos originales. Todas esas correcciones deben ser totalmente documentadas. 22.2 Procedimientos de validación En el primer nivel, el recolectar controlará cuidadosamente los datos, los evaluará y los preparará para la etapa siguiente. El recolectar puede así mejorar la calidad de los datos antes de que sean sometidos al sistema de procesamiento. Los controles de calidad deberían aplicarse para verificar los datos. Estos controles se basan en la aplicación de controles de lectura para detectar errores en tiempo y en magnitud. Los test de calibración de instrumentos son examinados y evaluados según criterios de uniformidad y de desviación de las medidas. Se hace un examen visual de las lecturas secuenciales o de trazos registrados a la luz de modelos previstos o de comportamiento simultáneo de variables relativas que también han sido registradas. En base a esta evaluación, el observador aplicará códigos de calidad o verificará esos registros in situ. Los códigos indican si el registro es considerado de calidad buena o si es defectuoso, y el grado de confianza expresado en términos de la exactitud de los datos. En esta etapa, cualquier documentación detallada que compruebe la interpretación debe ser adjuntada a los datos, para el beneficio de futuros usuarios. 22.2.1 Procedimientos generales Se debe reconocer desde el comienzo que las técnicas de validación de datos nunca pueden ser hechas automáticamente en su totalidad. Mientras algunas variables tienen rangos estrictamente limitados de validez, que la computadora puede verificar, la mayoría de las variables de las series temporales tienen una distribución de probabilidad asintótica, que la computadora sólo reconoce si hay un valor sospechoso. A la mayoría de los valores extremos se les puede comprobar si son correctos, y de ser así son de vital importancia para la aplicación de todos los datos hidrológicos. En estas variables, por lo tanto, la computadora debe ser usada sólo para aceptar o indagar datos, pero no para rechazarlos. Los valores que parecen sospechosos para la computadora deben ser analizados por una persona competente. Las ventajas de las técnicas de validación de la computadora radican en su objetividad y uniformidad. Los datos de todas las fuentes son sometidos al mismo examen. La computadora también permite el uso de controles complejos de algoritmos, imposibles de aplicar mediante técnicas manuales. Estos algoritmos pueden ser complejos en términos de contenido matemático o en la cantidad y el tipo de datos de control que son usados. Otra ventaja es la eliminación de la tediosa verificación manual de datos. La computadora permite al especialista agrupar en conjuntos las reglas de validación que informarán solamente los datos que se consideren necesarios para finalizar la inspección. En los informes de validación deberían estar bien indicados, normalmente por el uso de indicadores o códigos (claves), los valores dudosos y las razones de esta incertidumbre. Como ayuda adicional a cualquier proceso ulterior de corrección de errores, algunos sistemas informáticos también suministran estimaciones de valores probables. Cuando se decide aplicar un procedimiento de validación complejo a cualquier variable dada, se debe tener en cuenta la exactitud a la que la variable puede ser observada y la capacidad del sistema para corregir los errores detectados. Es corriente realizar la validación de bases de datos, y al mismo tiempo actualizar los procesos de validación a un ritmo mensual, semanal o anual.

Page 5: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación

Un aspecto organizativo importante de la validación es la posibilidad de repartir las tareas de validación de datos entre centros de terreno equipados con microcomputadoras para la entrada de datos y una computadora central para procesar los datos. Como la mayoría de las microcomputadoras tienen programas informáticos estándar de entrada de datos, que incorporan opciones de validación de datos, no es necesario crear nuevos programas. Los controles de validación in situ podrían incluir controles absolutos para datos y códigos variables, y controles relativos para determinar el valor de la variación. Las tablas y representaciones gráficas de datos de aporte también pueden ser controlados manualmente. Este sistema reduciría considerablemente el coeficiente de error de datos obtenidos en el centro donde la validación es más elaborada, por ejemplo, podrían realizarse controles entre varias estaciones. Quizás una de las ventajas más importantes de este procedimiento es que la responsabilidad de la mayor parte del proceso de validación incumbe a los mismos observadores. 22.2.2 Técnicas combinadas Estas técnicas se basan en la informática para formatear los datos, facilitando el control manual. Los dos formatos son las tablas recapitulativas y las representaciones gráficas. Las tablas recapitulativas pueden reunir datos procedentes de estaciones seleccionadas, estaciones vecinas donde se mide la misma variable o una variable con un comportamiento parecido. No hay duda de que el control visual de los datos diagramados en función del tiempo, realizado por un personal con experiencia, es una técnica rápida y efectiva para detectar datos anormales. Por esta razón, la mayoría de los sistemas de validación de datos permite producir diagramas de intervalos de tiempo en la pantalla de la computadora o con ayuda de impresoras o mesas trazadoras. Si los datos originales de intervalos de tiempo proceden de un registro gráfico, éste puede ser comparado directamente con el gráfico que resulte del tratamiento informática. Es particularmente útil para esta comparación la escala de valores impresos para equiparar el gráfico original, lo que permite que los controles se hagan por superposición de ambas curvas. Esta técnica de control detecta errores debidos a la entrada de datos. La superposición también puede ser hecha para gráficos de estaciones cercanas, lo cual es muy simple pero muy eficaz para controlar la homogeneidad entre varias estaciones. Los gráficos de series cronológicas pueden contener simplemente los rastros observados, pero, para mayor utilidad, deben mostrar también los límites superior e inferior, (límites de confianza estadística o registro previo de los extremos) para ayudar en el proceso manual de interpretación. Los gráficos pueden ser usados en las unidades observadas o la computadora puede ser programada para transformarlos. El ejemplo mas común de esta técnica es el uso de gráficos logarítmicos de crecidas de ríos y niveles de agua subterránea. La figura 22.1 es un gráfico logarítmico de corrientes fluviales diarias y de los valores máximo y mínimo registrados previamente. Para identificar las tendencias a largo plazo en series cronológicas, se pueden utilizar las curvas de valores acumulados que son fácilmente calculados y diagramados gracias a la informática. La figura 22.2 muestra un gráfico típico de la curva de valores acumulados, que permite controlar la homogeneidad de las mediciones de precipitaciones a largo plazo. Los diagramas pueden usarse para el control manual de la variación espacial. Un medio simple es un diagrama de la posición de las estaciones junto con el número de identificación y el valor de los datos registrados. Esta técnica se usa mucho para el control mensual y anual de datos de las precipitaciones o del agua subterránea en una zona determinada. Los programas informaticos más complejos pueden interpolar datos en el espacio y en diagramas de isolíneas. A fin de examinar la amplia gama de técnicas disponibles para los sistemas de validación automático de datos es útil distinguir los errores absolutos, los errores relativos y los errores físico-estadísticos. Los controles absolutos implican que esos datos o códigos de valores tengan una gama de valores que no tienen ninguna posibilidad de ser excedidos. Así, las coordenadas geográficas de una estación deben estar ubicadas dentro de los límites del país, la fecha debe estar entre el 1 y el 31 y, en un sistema numérico de códigos, el valor 43A no puede existir. Los datos que no correspondan a estas condiciones deben ser incorrectos, y en general es una tarea fácil la identificación y de corregir el error.

Los controles relativos incluyen: a) una gama prevista de variables; b) el cambio máximo esperado en una variable entre observaciones sucesivas; c) la diferencia máxima esperada en las variables entre estaciones cercanas.

La definición del ámbito de variaciones aceptables requiere tomar ciertas precauciones para que el volumen de búsqueda no sea muy importante. Durante las primeras etapas del desarrollo de la base de datos, es aconsejable asignar límites de tolerancia bastantes amplios. Estos límites pueden ser acotados posteriormente, cuando se obtuviesen mejores datos estadísticos sobre las variaciones del parámetro analizado. Si bien se requiere un análisis exhaustivo de las series históricas, las gamas esperadas para controles relativos (método a» deberían ser calculadas para distintos intervalos de tiempo, incluido el intervalo en que los datos fueron observados. Esto es necesario porque la varianza de datos disminuye con el incremento de tiempo. Los niveles fluviales diarios primero se compararían con una gama esperada de valores diarios para un período de tiempo determinado, por ejemplo, el mes en curso. Ahora bien, como es posible que cada valor diario pueda caer en la gama esperada, pero que el conjunto entero de datos sea sistemáticamente falso, demasiado alto o bajo, los controles posteriores se realizarán en un período de tiempo más largo. Así, al final de cada mes, el promedio de los valores diarios del mes en curso debe ser comparado con el promedio a largo plazo del mes dado. En forma similar, al final de cada año hidrológico, el promedio para el año en curso se debe comparar con el promedio anual a largo plazo. Esta técnica es de aplicación general en hidrología a todas las series de datos cronológicos.

Page 6: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación

El método de comparar cada dato con la observación precedente, (método b», se refiere sobre todo a las variables que muestran correlación serial importante, por ejemplo, la mayoría de tipos de datos del nivel de agua. Un ejemplo de la aplicación de esta técnica para presentar datos se expone más adelante. Cuando la correlación es muy fuerte (por ejemplo, niveles de agua subterránea), se podrían efectuar períodos múltiples de comparación como se describe en el método anterior a). Las observaciones diarias de aguas subterráneas podrían primero ser controladas, en comparación con la tasa diaria de variación esperada, mientras que la variación total mensual podría ser, por lo tanto, comparada con las variaciones mensuales esperadas. El método c) es una variación del método b), pero usa criterios de cambios aceptables en el espacio más bien que en el tiempo. Este tipo de control es particularmente efectivo para valores de niveles y caudales de ríos de la misma cuenca, aunque en cuencas más grandes algunos datos rezagados serán necesarios antes de hacer las comparaciones entre las estaciones. Para otras variables hidrológicas, la utilidad de esta técnica depende de la densidad de la red de observaciones en relación con la variación espacial de la variable. Un ejemplo es la conversión de la precipitación total a unidades sin dimensión, utilizando el coeficiente de los valores observados para algún promedio a largo plazo de valores de la estación. De esta manera se reducen las diferencias causadas por las características de la estación. Los controles geoestadísticos incluyen el uso de la regresión entre variables relativas para predecir valores esperados. Ejemplos de este tipo de control son la comparación de niveles de agua con precipitación total y la comparación de la evaporación de tanque con la temperatura. Estos controles son particularmente importantes para observaciones a partir de una red poco densa, donde la única forma de control es la comparación con valores de variables interrelacionadas procedentes de redes de observación más densas. Otra categoría de controles geoestadísticos es usada para verificar si los datos son conformes con leyes físicas y químicas. Este tipo de control se usa mucho para los datos de calidad del agua. La mayoría de los controles relativos y geoestadísticos descritos antes están basados en el uso de series cronológicas, de correlación, de regresión múltiple y de técnicas de superposición de superficies [2]. 22.2.3 Procedimientos específicos de validación En la mayoría de los ejemplos, los procedimientos generales descritos antes son medios suficientes para detectar datos sospechosos. Sin embargo, algunos de estos procedimientos han sido adoptados y extendidos en una manera más específica para equiparar las características de algunos tipos de datos.

Page 7: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación
Page 8: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación

22.2.3.1 Datos climatológicos Cuando se consideran procedimientos de control de calidad general, se indicó que esa validación de datos climatológicos por métodos de comparación entre estaciones es discutible en muchos casos a causa de la dispersión de las estaciones climatológicas. Así, las técnicas básicas de validación aplicadas son los controles de variación, los controles de la tasa de variación y, de particular importancia, los controles de homogeneidad entre variables relativas observadas en el mismo sitio. Por ejemplo, todo dato psicrométrico anotado debe ser controlado o recalculado para ver si la temperatura seca excede o es igual al valor de la temperatura húmeda o del punto de rocío y, según los datos obtenidos, la temperatura del punto de rocío y/o la humedad relativa deben calcularse y controlarse con relación a los datos inscritos. Asimismo, la relación empírica entre los datos procedentes de un tanque de evaporación o de un lisímetro y de otras variables observadas podrían dar amplias indicaciones de datos sospechosos en la etapa de validación. Ajustes más complejos para la evaluación de la evaporación y la evapotranspiración son hechos normalmente en etapas posteriores al procedimiento primario. Para todos los datos climatológicos, los códigos de estaciones y de variables deben validarse y, cuando proceda, los valores sospechosos deben acompafíarse de valores de calibración del sensor y de la variación de los parámetros medidos. En la Guía de prácticas climatológicas [1] de la OMM figuran más detalles relativos a los procedimientos de control de la calidad de los datos climatológicos. 22.2.3.2 Datos de precipitación

Page 9: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación

Como la precipitación es un fenómeno hidrológico muy importante y altamente variable, existen muchas estaciones pluviométricas y, por lo tanto, una amplia cantidad de datos. La mayoría de los países ya tienen sistemas bien establecidos para el control de calidad y el archivo de datos pluviométricos. Un sistema usado por la Oficina Meteorológica del Reino Unido para el procesamiento de los datos pluviométricos diarios se describe en la Guía de prácticas climatológicas de la OMM. Los errores que ocurren en la recolección y el procesamiento de datos pluviométricos son casi universales, por ello este sistema debería servir como modelo para otros países. La fiabilidad de un sistema que usa comparación entre estaciones se relaciona con la densidad de la red. En zonas de escasa cobertura de pluviómetros hay una creciente tendencia a instalar radares pluviométricos (sección 7.6). Los valores regionales obtenidos en algunas instalaciones suministran datos excelentes para la validación y para zonas que no tienen estaciones pluviométricos. Otra aplicación de los datos de radar con fines de validación es para zonas sujetas a intensas tormentas localizadas, por ejemplo, en la mayoría de países tropicales. 22.2.3.3 Datos de hielo y nieve Si bien el equivalente en agua de la nieve tomada en los pluviómetros puede ser validado junto con datos de precipitación, otras variables de nieve y de hielo son más difíciles de controlar. Los datos sobre el alcance de la cobertura de nieve pueden ser validados sólo por una síntesis manual durante mucho tiempo de las observaciones de campo, por datos aéreos o por imágenes satelitales (sección 7.5). Se están desarrollando algunas técnicas que sirven para la interpretación automática de imágenes satelitales sobre la extensión de la nieve (y el nivel de profundidad y el equivalente en agua). A pesar de que estas técnicas son prometedoras, todavía existen problemas para diferenciar entre extensión de nieve y cobertura de nubes, además la resolución de imagen es, en general, insuficiente. Por otra parte, salvo que se use un sistema de información geográfico, los datos sobre la extensión de nieve sólo pueden almacenarse en forma de totales para toda la superficie de la cuenca. Los datos de profundidad de nieve y equivalentes de agua requieren mucha validación manual y verificación, mediante la integración de datos procedentes de rutas nivométricas, indicadores de nieve y pluviómetros convencionales. La gran variación espacial en la cobertura de nieve hace difíciles las comparaciones entre estaciones. De todos modos, hay técnicas para estimar la fiabilidad estadística de las observaciones de rutas nivométricas cuando la nieve se derrite. Los factores de grado día son ampliamente usados para las correlaciones, y si la nieve derretida representa una proporción importante de la corriente fluvial, se deben usar las relaciones entre la escorrentía y el equivalente en agua de la nieve. Las relaciones de temperatura del aire (y del agua), son valiosas no sólo para el cálculo de factores de grado-día sino también para la validación de la cobertura de hielo y los datos de espesor, así como en la predicción (o el pronóstico) de formación de hielo y las fechas de deshielo. Los datos relativos a la nieve y al hielo, cuantitativos o cualitativos, son importantes datos de validación para una amplia gama de otras variables hidrológicas. Por ejemplo, datos de niveles de río anómalos durante los meses de invierno pueden ser explicados y posiblemente corregidos si se dispone de datos sobre la naturaleza y el alcance de las condiciones del hielo. 22.2.3.4 Datos de niveles de agua Las técnicas para representar gráficamente los datos y realizar tablas con ellos, y los controles de la proporción de cambio descritos anteriormente, son muy usados para los datos sobre el nivel del agua. La superposición de registros de niveles de agua, procedentes de estaciones vecinas, es en general útil sobre todo si las estaciones están situadas sobre el mismo sistema fluvial. La figura 22.3 contiene gráficos muy interesantes y, aunque describen el caudal, también se pueden aplicar a los niveles de agua. El diagrama cubre un período de 13 meses y permite observar cualquier discontinuidad que pueda aparecer entre las actualizaciones anuales sucesivas de la base de datos principal. Cuando el intervalo de muestreo es relativamente corto, por ejemplo 15 minutos para la mayoría de registros digitales, se deben usar técnicas más complejas de reconocimiento de forma. Estas técnicas desarrolladas para datos de niveles por el Instituto de Hidrología del Reino Unido, reconocen que hay modelos que son considerados aceptables y otros que son considerados como sospechosos (véase la figura 22.4). El control de forma se aplica sucesivamente a todos los valores de 15 minutos, para cada medidor, en secuencias de cuatro. El código de forma en cuestión y las cuatro lecturas sospechosas se imprimen fuera en una fila de interrogantes cada vez que una forma sospechosa es detectada por el sistema. Para evitar que formas sospechosas sean impresas innecesariamente (por ejemplo, cuando el registrador digital busca una variación pequeña en el nivel del agua), una lista de errores mínimos debe ser incluida en la rutina del programa. Si la diferencia entre lecturas de etapas sucesivas es menor que ese mínimo, el valor sospechoso no es registrado. 22.2.3.5 Datos de aforos de río Un procedimiento útil de control para los aforos de río es diagramar el nivel de agua promedio mientras se mide, y las profundidades verticales en el corte transversal. Estos datos deben estar disponibles a partir del archivo de descripción de la

Page 10: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación

estación o de uno de los archivos asociados. Las diferencias del perfil pueden ser causadas por el observador o por un error en la entrada de datos, o pueden deberse a variaciones reales en el nivel del lecho, pero cualquiera que sea la causa deberían ser investigadas. Sobre la base de esta serie de información, la computadora puede programarse para evaluar la sección transversal del área asociada con cada vertical

Los procesos restantes de validación dependen del nivel de agregación de datos, introducidos, por ejemplo datos básicos de terreno o velocidades calculadas manualmente. Las velocidades pueden ser incluidas como anotaciones en la sección transversal del diagrama. El usuario debe decidir si los procedimientos de control son simplemente para establecer la exactitud de la operación de entrada de datos, o si se está desarrollando un sistema para el cálculo de la corriente. En el último caso, los cálculos de la corriente se realizan normalmente para controlar los valores manuales obtenidos sobre el terreno para el uso inmediato. Si las medidas son hechas para establecer o verificar una curva de calibración, la corriente calculada puede ser diagramada (manual o automáticamente) sobre la curva existente de calibración para identificar los valores sospechosos o las variaciones según los intervalos de confianza de las medidas. Para todas las mediciones, el programa de validación debe controlar: el número de identificación de la estación de aforo, el tipo de molinete y de hélice, los códigos de métodos de análisis y, cuando sea posible, las combinaciones válidas de éstos. Es también útil para cualquier diagrama o copia impresa que contenga la información y cualquier coeficiente de calibración pertinente. La publicación de la OMM titulada Manual on Stream Ganging, contiene más información sobre la medición de caudales.

22.2.3.6 Datos de calidad del agua La amplia gama de variables en la calidad del agua ha resultado en el uso de procedimientos de validación relativamente sencillos para la calidad del agua. Dichos criterios son normalmente controles absolutos de análisis de códigos, controles relativos a gamas esperadas y controles físico-químicos de algunas interrelaciones. Si los controles de gamas son realizados sin datos históricos, debe anotarse que las gamas válidas de muchas variables estarán asociadas con la finalidad para la cual fue tomado el muestreo, y la localización con el punto de muestreo. Así, los niveles de sales disueltas encontradas en las muestras de agua potable serán menores que los encontrados en aguas usadas, salobres o marinas. Como los controles físico-químicos son muy efectivos, su utilización está muy generalizada. La tabla 2.1 contiene ejemplos de pruebas físico-químicas, usadas para tipos de agua muy variada. Si algunos valores de las variables han sido determinados en el laboratorio, todos los datos asociados pueden ser recalculados para verificación. Todos los datos de calidad del agua, la estación y los códigos de análisis pueden ser controlados para su validez y si es posible, para la validez de sus combinaciones. 22.2.3.7 Datos de sedimentos Como para los datos de calidad del agua, los cálculos de masa balanceada pueden ser realizados si se tienen suficientes datos. Si existe una curva de calibración de sedimentos para la sección muestreada, la diferencia entre el valor muestreado y la curva puede ser analizada desde el punto de vista de la estadística y/o por examen visual. 22.2.4 Datos faltantes Cuanto más completos son los datos, más útiles son. El tiempo empleado en la reconstitución de registros faltantes, durante la etapa anterior al procesamiento, puede pagar grandes dividendos cuando los datos finales son usados o analizados. Es preferible que estas primeras estimaciones sean hechas por la persona encargada de recolectar los datos, pues esta persona puede aprovechar sus conocimientos de la localidad. Es frecuente el caso, sin embargo, en que registros defectuosos son solamente reconstruidos con el gasto de grandes cantidades de tiempo, o que esa recuperación requiera acceso a los datos procesados de otra fuente que cubra el mismo período. En este caso, puede no ser práctico tratar de diferir la transmisión de los datos restantes hasta que sean los datos faltantes reconstituidos. Se debe tomar una decisión sobre si la persona que recopila los datos completa las series o las sintetiza de manera más eficaz durante el proceso terciario.

Page 11: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación
Page 12: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación

22.3 Codificación de datos Los sistemas de codificación deberían ser detallados y flexibles. A las personas que recopilan los datos se les debería alentar a utilizar numerosas posibilidades. Además de la aplicación de códigos para orientar al procesamiento, los comentarios deberían incluirse en esta etapa. Estos comentarios dan una descripción general de los datos dentro de los períodos de tiempo definidos y deberían adjuntarse automáticamente cuando los datos se presentan a los usuarios. El objetivo principal del uso de códigos es hacer los archivos más compactos y más claros. Las etapas siguientes permiten definir y utilizar los códigos: a) definir los datos que deben ser codificados. Son normalmente de la categoría de datos descriptivos que se usan

frecuentemente (por ejemplo, el nombre de ubicaciones, las variables medidas, los métodos de análisis, las unidades de medición y los indicadores de calidad de datos);

b) decidir cuándo la codificación debe ser realizada. Si el objetivo es que el registro y los documentos de entrada de datos sean compatibles, la codificación debe realizarse en el momento de adquisición de datos por el observador hidrólogo o el técnico de laboratorio. Aunque mucho menos deseable, los datos también pueden codificarse al introducirlos en la

Page 13: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación

computadora. Esto detiene el proceso de entrada de datos y requiere la intervención de un operador más capacitado y con más experiencia;

c) estudiar la posibilidad de utilizar sistemas de codificación existentes (nacional o internacional) para algunos datos. Los inventarios de códigos para variables, métodos de análisis de laboratorio, y unidades de medición codificadas han sido desarrollados por varios países. La adopción de dichos sistemas de códigos permiten el intercambio de datos y reducen la necesidad de dedicar recursos en hacer nuevas listas de códigos; d) obtener o preparar listas de códigos, incorporar los códigos en el informe y la forma de entrada de datos y en los sistemas informáticos, incluso instrucciones para la codificación (y listas de códigos pertinentes en las hojas de instrucciones técnicas; e) capacitar observadores en el uso de códigos y para controlar la manera de rellenar los formularios desde el inicio del sistema de códigos. Este control debería ser hecho por varios meses para permitir que el técnico se familiarice con los códigos. f) La mayoría de los códigos usados en hidrología son numéricos. Sin embargo, se utilizan también combinaciones diferentes de códigos alfabéticos o alfanuméricos para registros de tarjetas perforadas y en otros ámbitos que utilizan datos más descriptivos, como la clasificación del uso de tierras y suelo. El código utilizado en sistemas hidrológicos se describe más adelante en el NAQUADAT Dictionnary of Parameter Codes [5]; 22.3.1 Códigos de ubicación Los códigos normalmente existen para la cuenca o subcuenca y es muy útil incorporarlos en archivos de datos de descripción de estación (sección 21.2). Esto permite la identificación rápida de todas las estaciones (o de las estaciones que miden variables seleccionadas) en una sola cuenca o grupo de cuencas. La sección 21.2 contiene más información relativa a la numeración de estaciones. 22.3.2 Códigos para las variables (parámetros) Se refiere al grupo más grande de códigos. La proporción de variables hidrológicas y conexas que se necesitan incluir en una base de datos puede ser considerable. Afortunadamente, varios institutos hidrológicos han publicado una lista de códigos de variables (el Environment Canada [5] y el Department of Environment del Reino Unido [6]). La lista de códigos normalmente comprende para la variable, cuatro o cinco dígitos de código, la definición del texto de variable y posiblemente algunas abreviaciones o sinónimos. Un carácter distintivo de esas variaciones entre las listas es la inclusión de las unidades de medición y/o técnicas de análisis (particularmente para datos derivados de laboratorio) en la definición o en sus mismos códigos. Así, en un sistema, el código 08102 se refiere al oxígeno disuelto medido en mg/I, usando un medidor de oxígeno disuelto, mientras que otro sistema describe la misma variable como 0126 (oxígeno disuelto) con un código de unidad de medición de 15, donde 0126 y 15 son entradas en la lista de códigos pertinentes a mg/l y metro, respectivamente. Los objetivos y usos de esas listas de códigos figuran en los diccionarios de datos. La tabla 22.2 contiene un extracto del diccionario de códigos hidrológicos, mientras que la tabla 22.3 un extracto de un diccionario de calidad de¡ agua. En el primer ejemplo, se usan dos códigos, uno para la variable, el otro para la unidad; mientras que en el segundo sólo hay uno. En este último diccionario se distinguen las técnicas de análisis que deben aplicarse a las muestras de aguas subterráneas G), lagos L) y ríos R), y se indica el nivel de exactitud requerido para el método de análisis. El trabajo que implica la preparación de dichos diccionarios es tan grande que es recomendable utilizar la lista de códigos existentes. 22.3.3 Códigos de calificación de datos Es usual y altamente recomendado, tener una serie de códigos disponible para que el observador hidrológico y el técnico de laboratorio puedan emplear en la calificación de datos anormales o inciertos, lo que permitirá en el futuro una utilización más segura de estos datos. Hay básicamente dos grupos de calificaciones, la primera puede ser considerada como la situación real (fiabilidad) de los valores de datos y la segunda indica algunas condiciones exteriores que pueden dar un estado anormal de los datos. Para ambos grupos, el código usado es normalmente de carácter alfabético único, conocido también como una bandera. Las banderas para la fiabilidad de los datos son:

E - valor estimado, considerando que la estimación es relativamente buena; S - valor sospechoso, se supone que es incorrecto, pero no hay medios para verificarlo; G - valores inferior al límite de calibración o de medición; L - valor inferior al límite de detección (valor situado en el límite); V - Valor fuera de la gama de variaciones normalmente aceptables, pero que ha sido controlado y verificado.

Banderas para las condiciones exteriores: 1 - presencia de hielo (o hielo represado);

Page 14: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación
Page 15: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación

S - presencia de nieve; F - presencia de heladas; D - estación sumergida (durante una crecida); N - resultados procedentes de un laboratorio no normalizado (calidad controlada); P - resultados procedentes de un laboratorio parcialmente controlado desde el punto de vista de la calidad. Las banderas deben ser introducidas, si procede, y se guardarán con los datos que

se relacionan. Los procedimientos de validación de datos realizados por computadora pueden generar más banderas; en ese caso se pueden usar los mismos códigos. 22.3.4 Códigos de datos faltantes Es muy importante diferenciar entre datos faltantes y datos registrados con valor cero. Si el sitio de un valor numérico faltante es dejado en blanco, la mayoría de las computadoras lo interpretarán como un cero que agregan automáticamente, lo cual se presta a confusión. Como no se puede utilizar un carácter alfabético en un sistema de datos numéricos, el problema de los datos faltantes no puede resolverse al agregar una "M" (faltante). Una posibilidad es poner el código M como bandera de dato separada; pero en los sistemas donde no se usan banderas, se deberá introducir un valor físicamente imposible, por ejemplo -999, para indicar al sistema de procesamiento de datos la presencia de un valor que falta. Si es necesario, ese valor puede ser transformado en un espacio blanco o "-" en el fichero de salida.

Page 16: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación
Page 17: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación
Page 18: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación
Page 19: CAPITULO 22 CONTROL DE DATOS Y CODIFICAClÓN Control …documentacion.ideam.gov.co/openbiblio/bvirtual/012406/Cap22.pdfencargados de los procedimientos preliminares de comprobación

22.3.5 Códigos de transmisión Todos los sistemas de transmisión de datos hacen uso de alguna forma de códigos, cuyo objetivo es asegurar que la información sea transmitida rápida y seguramente. En el caso de sistemas totalmente automatizados, la información debe necesariamente ser codificada antes de ser procesada. Por esta razón, los códigos son normalizados. Esto permite que la información sea transmitida y enviada en una forma compatible con el sistema de proceso previsto. Dicho procesamiento es precedido, en general, por un control de calidad de los datos. Los códigos de transmisión se examinan en detalle en la sección 4.4.

Referencias

1. Organización Meteorológica Mundial, 1983: Guía de prácticas climatológicas. Segunda edición. OMM-N' 100, Ginebra. 2. Organización Meteorológica Mundial/Organización de las Naciones Unidas para la Agricultura y la Alimentación, 1985: Guidelines for Computerized Data Processing in Operational Hydrology and Land and Water Management. OMM-N' 634, Ginebra. 3. Instituto de Hidrología de¡ Reino Unido, 1974: A System for Quality Control and Processing of Streamflow, Rainfall and Evaporation Data (D.T. Pluiston, y A. Hill, Informe No. 15. 4. Organización Meteorológica Mundial, 1980: Manual on Stream Gauging. Volúmenes I y II, Informe de hidrología operativo No. 13, OMM-No. 519, Ginebra. 5. Environment Canada, 1973: NAQUADAT Dictionnary of Parameter Codes. Iniand Waters Directorate, Environment Canada, Ottawa. 6. U.K. Department of Environment, 1981: Hydrological Determinand Dictionary. Water Archive Manual N' 5, Water Data Unit.