45
Guía de auto-aprendizaje en SDMX n. 4 Libro del estudiante Definición de estructura de datos

Guía de auto-aprendizaje en SDMX n. 4 Libro del a de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos 3/45 1 Objetivo del libro Este libro tiene

Embed Size (px)

Citation preview

Guía de auto-aprendizaje en SDMX n. 4

Libro del estudiante

Definición de estructura de datos

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

1/45

Autor Eurostat, Dirección A: Cooperación en el Sistema Estadístico Europeo;

cooperación internacional; recursos

Unidad A6: Cooperación estadística

Última

actualización

Noviembre 2012

Versión 1.0

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

2/45

TABLA DE CONTENIDOS

1 OBJETIVO DEL LIBRO .............................................................................................................................. 3

2 MODELO DE INFORMACIÓN SDMX (SDMX-IM): ESTRUCTURAS DE DATOS ........................... 4

2.1 OBJETIVO DE ESTE CAPÍTULO ...................................................................................................................... 4

2.2 MODELO DE INFORMACIÓN SDMX (SDMX-IM) Y DIRECTRICES ORIENTADAS AL CONTENIDO .................. 4

2.3 OBTENER UNA ESTRUCTURA DE DATOS PARA MIS DATOS .......................................................................... 4

2.3.1 Desde un número hasta datos estadísticos ....................................................................................... 4

2.3.2 De una tabla a la estructura de datos .............................................................................................. 5

3 PASO A PASO: CREACIÓN DE UNA DEFINICIÓN DE ESTRUCTURA DE DATOS ...................... 7

3.1 OBJETIVO DE ESTE CAPÍTULO ...................................................................................................................... 7

3.2 DATOS EN FORMATO DE SERIE TEMPORAL (TIME SERIES) ......................................................................... 10

3.3 DATOS EN FORMATO TRANSVERSAL (CROSS-SECTIONAL) ........................................................................ 11

3.4 CONSTRUCCIÓN DE UNA DEFINICIÓN DE ESTRUCTURA DE DATOS PARA DATOS DE SERIE TEMPORAL ........ 13

3.4.1 Conceptos ....................................................................................................................................... 13

3.4.2 Listas de códigos (Code Lists) ........................................................................................................ 15

3.4.3 Dimensiones, atributos, grupos y medidas ..................................................................................... 17

3.5 DEFINICIONES ADICIONALES PARA LA REPRESENTACIÓN DE DATOS TRANSVERSALES .............................. 19

3.6 CONSTRUCCIÓN DE LA ESTRUCTURA DE DATOS SDMX-ML .................................................................... 21

3.7 FORMATO TRANSVERSAL ESPECIAL (CENSO) ........................................................................................... 23

4 CREACIÓN PASO A PASO DE LA DSD PARA EL EJEMPLO DE TURISMO ................................ 26

4.1 DATA STRUCTURE WIZARD (DSW) .......................................................................................................... 26

4.2 CREACIÓN DE UNA DSD DE TURISMO CON EL DSW ................................................................................. 27

4.2.1 Definición de listas de códigos ....................................................................................................... 27

4.2.2 Definición de esquema de concepto (Concept Scheme) ................................................................. 29

4.2.3 Definición de una DSD ................................................................................................................... 32

4.2.4 Exportar DSD ................................................................................................................................. 40

5 GUÍA DE IMPLEMENTACIÓN DE MENSAJES ................................................................................... 42

6 GLOSARIO .................................................................................................................................................. 44

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

3/45

1 Objetivo del libro

Este libro tiene como objetivo proporcionar una comprensión y visión completas sobre las

definiciones de estructuras de datos (DSD - Data Structure Definitions) y la forma de crear un

artefacto DSD a partir de un ejemplo de tabla de datos. Esto incluye:

La definición de los componentes del DSD;

La creación paso a paso de artefactos (artefact) DSD;

Mensajes de estructuras SDMX-ML (SDMX-ML Structure Message);

La guía de implementación de mensajes (MIG - Message Implementation Guide).

Al final de este libro, el usuario deberá ser capaz de crear un artefacto DSD y entender cómo

funciona, y también crearlo a partir de una tabla de datos estadísticos.

El libro del estudiante es el cuarto de una serie de 8 libros del estudiante (ver Tabla 1- Libros

del estudiante sobre SDMX) que juntos proporcionan una información completa para el

dominio de SDMX, con una atención particular en el modelo de datos.

Ref. Título

[01] Introducción a SDMX

[02] El modelo de información SDMX

[03] Mensajes SDMX-ML

[04] Definición de estructura de datos

[05] Definición de estructura de metadatos

[06] Tecnologías basadas en XML usadas en SDMX

[07] Arquitecturas SDMX de método pull para compartir datos – Parte

1

[08] Arquitecturas SDMX de método pull para compartir datos – Parte

2

Tabla 1 – Libros del estudiante sobre SDMX

Prerrequisitos

Se recomienda con fuerza la lectura del primer libro del estudiante para obtener una visión

global del modelo de información SDMX y los conceptos básicos de las estructuras de datos y

metadatos. El estudio del segundo libro del estudiante podría ayudar a comprender la

aplicación detallada de los objetos del modelo de información utilizados en las definiciones de

estructuras de datos.

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

4/45

2 Modelo de información SDMX (SDMX-IM): estructuras de datos1

2.1 Objetivo de este capítulo

El objetivo de este capítulo es resumir la introducción que se hace de SDMX-IM en el libro

“Introducción a SDMX”.

Se presentará la nomenclatura usada en las definiciones de estructuras de datos (Data

Structure Definitions) y se explicarán las diferentes partes que conforman un ejemplo de

definición de estructura de datos SDMX (SDMX Data Structure Definition).

2.2 Modelo de información SDMX (SDMX-IM) y directrices orientadas al contenido

El modelo de información SDMX (SDMX Information Model)) proporciona una forma de

modelar datos estadísticos, metadatos estructurales, metadatos de referencia (reference

metadata) y procesos de intercambio de datos mediante la representación de conceptos,

relaciones, restricciones, reglas, y operaciones que especifican la semántica de datos de un

dominio estadístico dado.

Las directrices orientadas al contenido (Content Oriented Guidelines) es un conjunto de

propuestas para la armonización de la aplicación del modelo de información SDMX (SDMX

Information Model), con el fin de proporcionar soluciones concretas para la interoperabilidad

en el intercambio de datos y metadatos entre organizaciones.

2.3 Obtener una estructura de datos para mis datos

2.3.1 Desde un número hasta datos estadísticos

Los datos estadísticos se representan mediante números, tales como: 11353511

Si solo nos fijamos en el número, no tendremos ninguna pista sobre su significado. Como dato

estadístico, puede medir un fenómeno concreto (también conocido como “observación”). Para

identificar lo esencial de esta medición debemos encontrar las respuestas a las siguientes

preguntas:

¿Cuál es el tema?

¿Qué unidades son las que mide?

¿A qué país o región geográfica se aplica? (si es que la hubiera)

¿Cuándo se realizó la medición y con qué frecuencia se midió?

1 El modelo de información SMDX (SDMX Information Model), las directrices orientadas al

contenido (Content Oriented Guidelines) y las estructuras de datos se presentan en el

primer libro “Introducción a SDMX”. El modelo de información SMDX se explica con más

detalle en el libro del estudiante n. 2 "El modelo de información SDMX”.

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

5/45

Cada pregunta se refiere a una idea o “concepto” usado para describir datos. Así pues, las

preguntas de arriba nos llevan a hablar de conceptos descriptores como el tema estadístico,

unidad de medida, país, fecha y frecuencia.

Conforme damos respuesta a las preguntas anteriores, los datos van cobrando sentido:

El tema es “población total”;

La unidad de medida es “número de personas”;

El país es “Bélgica”;

La fecha es “1 de enero de 2001” y la frecuencia es “anual”.

Este ejemplo muestra cómo definir datos estadísticos con un conjunto de descriptores de

conceptos.

Siguiendo este ejemplo, una definición de estructura de datos (DSD - Data Structure

Definition) puede definirse de la siguiente forma:

Una DSD (familia clave - Key Family) especifica un conjunto de conceptos descriptores

(conceptos que describen e identifican a un conjunto de datos (Dataset)). Nos dice qué

conceptos son dimensiones (identificación y descripción), y qué conceptos son atributos

(solamente descripción), y nos aporta un nivel de asociación para cada uno de estos conceptos

basados en la estructura de empaquetado (conjunto de datos, grupo, serie/sección,

observación) así como su estado (obligatorio contra condicional). También especifica qué

listas de códigos proporcionan posibles valores a las dimensiones, como también los posibles

valores para los atributos, ya sean listas de códigos o campos de texto libre. Puede usarse una

definición de estructura de datos para describir datos de serie temporal y tablas de datos

transversales (Cross-Sectional) y multidimensionales.2

2.3.2 De una tabla a la estructura de datos

Los datos estadísticos presentados en tablas pueden transformarse y obtener así una estructura

de datos SDMX. Aquí se presenta un ejemplo de datos mensuales en la tabla 2.

2 Se proporcionan ejemplos de serie temporal (Time Series), y tablas de datos

transversales (Cross-Sectional) y multidimensionales en el libro del estudiante n. 1

Introducción a SDMX.

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

6/45

Exportaciones e Importaciones de Madera del país

“BÉLGICA” al mes con el país “FRANCIA” ajustadas por

temporadas.

(En millones de Euros). Año 2008.

Facturas Pagos

DIMENSIONES CLAVE M:BE:3:300:FR M:BE:2:300:FR

Enero 130 100

Febrero 120 110

Marzo 145 105

Abril 150 120

… … …

Tabla 2 - Ejemplo: datos estadísticos en tabla con formato de serie temporal

(Time Series)

De la tabla 2 se pueden obtener los siguientes conceptos estadísticos/descriptores con sus

correspondientes valores:

1. Frecuencia, con el valor: M de mensual;

2. País que informa, con el valor: BE “Bélgica”;

3. Sentido del flujo, o tipo de transacción con los valores: 2 para crédito, recepciones o

bienes (exportaciones), 3 para débito, pagos o bienes (importaciones);

4. Tema/variable con el siguiente valor: 300 para ingresos;

5. País asociado/Empresa: FR de FRANCIA;

6. Periodo de tiempo, que define el periodo de observación para la serie temporal (Time

Series);

7. Formato de tiempo, que proporciona el formato para la dimensión (Dimension)

temporal descrita;

8. Unidad de medida con diferentes valores, por ejemplo, EUR – Euros;

9. Unidad múltiplo, en el ejemplo el múltiplo es millones.

Dado el orden que se muestra arriba, la clave para esta serie de datos tendría la forma

M:BE:3:300:FR (los dos puntos “:” separan los valores de dimensión (Dimension)). Esta

sería la correspondencia: ingresos (=300) de importaciones (3=débito/pagos/bienes)

mensuales (=M) del país/ empresa o área que informa (=Bélgica) al área asociada (=Francia).

En relación con los conceptos, el siguiente paso es distinguir entre dimensiones

(Dimensions), atributos (Attributes) y medidas (Measures). Las dimensiones clave (Key

Dimensions) contribuyen a la identificación concreta de una serie de datos o (más

globalmente) de un conjunto de datos (Dataset). Éstas se vinculan a nivel de serie. Los

atributos (Atributes) proporcionan información adicional y pueden vincularse a diferentes

niveles. Las medidas contienen el valor observado durante un período de tiempo (datos de

serie temporal (Time Series)). Los conceptos dimensión de tiempo (período de tiempo), que

no forman parte de la clave, y el atributo de formato de tiempo, completan las definiciones

que son necesarias.

La serie temporal en el ejemplo se expresa en millones de euros. Los conceptos “unidad” y

“unidad múltiplo” no contribuyen a las identificaciones de las series; solamente proporcionan

información adicional a los datos de las tablas. En consecuencia, actúan como atributos que

especifican descripción adicional de los datos.

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

7/45

Los conceptos que van del 1 al 5 son obligatorios para lograr un clara identificación de los

datos de serie temporal. Se consideran dimensiones (Dimensions) y forman la clave de la

estructura de datos (tal como se ha mostrado más arriba).

Se proporciona una definición más formal de una muestra de estructura de datos en la tabla 3.

Ha de tenerse en cuenta que en este ejemplo concreto solo se usan dos conceptos específicos

de dominio estadístico (tema de balance de pagos, sentido del flujo/tipo de transacción). La

mayoría del resto de conceptos son en realidad conceptos de dominio transversal (Cross

Domain) SDMX, provenientes de las directrices orientadas al contenido SDMX (COG -

Content Oriented Guidelines)3, que se deberían aplicar siempre que sea posible.

Pos.

en

clave

Dimensión o

Atributo

Nombre del

concepto Identificador

Nivel de

asociación

Lista de

códigos

1 Dimensión Frecuencia FREQ CL_FREQ

2 Dimensión Área de informe/referencia

REF_AREA CL_AREA

3 Dimensión Tipo de datos para estadísticas de balance de pagos

DATA_TYPE_BOP CL_DATA_TYPE_BOP

4 Dimensión Tema de balance de pagos

BOP_ITEM CL_ BOP_ITEM

5 Dimensión Área asociada COUNT_AREA CL_AREA

Dimensión Período de tiempo TIME_PERIOD

Atributo Formato de tiempo TIME_FORMAT Serie CL_TIME_FORMAT

Atributo Unidad de medida UNIT Serie CL_UNIT

Atributo Unidad múltiplo UNIT_MULT Serie CL_UNIT_MULT

Tabla 3 – Estructura de muestra de datos

3 Paso a paso: creación de una definición de estructura de datos

3.1 Objetivo de este capítulo

El objetivo de este capítulo es el de seguir los pasos necesarios para la creación de una

definición de estructura de datos (DSD - Data Structure Definition) a partir de tablas

estadísticas de representaciones de datos transversales (Cross-Sectional) y de serie temporal

(Time Series), así como introducir los mensajes de estructuras de datos SDMX-ML. Esto

incluye la creación de artefactos unidos al DSD y obtener así un conocimiento completo de la

estructura.

Los pasos a seguir son los siguientes:

3 La COG (Content Oriented Guidelines) se trató en el primer libro - Introducción a SDMX.

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

8/45

1. Mostrar la diferencia entre datos de serie temporal (TS - Time Series) y datos

transversales (CS - Cross-Sectional).

2. Construir la definición de estructura de datos (Data Structure Definition):

Definir todos los conceptos relacionados con los datos;

Identificar qué conceptos son dimensiones (Dimensions) y cuáles son atributos

(Attributes);

Declarar las medidas (Measures) y los valores que se observan;

Adjuntar o construir listas de códigos (Code Lists).

Los principales pasos para construir un DSD se establecen de la siguiente forma:

Dibujo 1 – Esquema de los pasos de una definición de estructura de datos (Data

Structure Definition)

Ejemplo: El ejemplo estadístico para explicar la representación de datos transversales (Cross-

Sectional) y de serie temporal (Time Series) se ha tomado del dominio de turismo. Se refiere

al número de establecimientos turísticos de distintos países (AT, ES, IT, FR) y continúa el

ejemplo mostrado en el libro del estudiante n. 1 “Introducción a SDMX”.

El Dibujo 2 presenta una ilustración gráfica de la diferencia entre los dos formatos, datos de

serie temporal (Time Series) y transversal (Cross-Sectional):

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

9/45

Dibujo 2 – Cubo estadístico que ilustra cortes de datos TS (Time Series) y CS

(Cross-Sectional)

Para el ejemplo dado, la construcción del DSD se ha basado en datos previos ya almacenados

en tablas estadísticas (u otros medios como bases de datos o ficheros de datos). Así pues, la

estructura de los datos ya se predefine en el intercambio de datos, donde los conceptos

estadísticos ya se han definido suficientemente en el pasado. Las propiedades de cada

concepto y las características de sus valores pueden obtenerse mediante el estudio del

conjunto disponible de datos recogidos.

En cualquier caso, se debería considerar el rediseño hacia SDMX como una oportunidad de

validar y actualizar el diseño previo de la estructura de datos. La reducción de una tabla

estadística a un modelo común de datos para el intercambio de datos podría contribuir a

obtener una visión más clara de cualquier clase de nueva estructura. En este libro, tal proceso

de rediseño no se trata, pero se trata de la transferencia de datos individuales que se presentan

en las tablas estadísticas con sus estructuras subyacentes (conceptos (Concepts), listas de

códigos (Code Lists), dimensiones (Dimensions), atributos (Attributes) y medidas

(Measures)) con respecto a la correspondiente definición de estructura de datos SDMX

(SDMX Data Structure Definition).

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

10/45

3.2 Datos en formato de serie temporal (Time Series)

La tabla estadística incluye la información de cabecera, como el título, número de tabla, los

datos relativos a turismo y la fecha de extracción. Además, se presentan conceptos

estadísticos, que normalmente no son visibles en filas y columnas de la propia tabla extraída.

Empezando por el ejemplo de serie temporal (Time Series), la tabla 4, que se encuentra más

abajo, muestra los datos estadísticos con respecto a periodos de observación anuales. Para esta

tabla solo nos hemos fijado en una única entidad (FR = Francia) geográfica (GEO) para el

desarrollo del número de tipos de establecimientos turísticos a lo largo de un período

específico.

Número de establecimientos turísticos – TS (serie temporal)

FREQ: A – Anual

GEO: FR – Francia

TOUR_INDICATOR: A001 – Establecimientos

UNIT: NUM – Número

Tema A100 Hoteles y similares

B010 Campings de turistas

B020 Residencias vacacionales Tiempo

2002A00 18768 8354 1934

2003A00 18617 8331 1968

2004A00 18598 8289 2251

2005A00 18689 8174 2329

2006A00 18361 8138 2325

2007A00 18135 8052 2406

2008A00 17970 7981 2537

2009A00 17723 7923 2964

Tabla 4 – Representación de serie temporal (Time Series)

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

11/45

3.3 Datos en formato transversal (Cross-Sectional)

Número de establecimientos turísticos – CS (transversal)

TIEMPO: 2007A00

TOUR_INDICATOR: A001 – Establecimientos

UNIT: NUM – Número

Indicador A100 Hoteles y similares

B010 Campings de turistas

B020 Residencias vacacionales País

AT 14204 540 3388

ES 17827 1220 4843

FR 18135 8052 2406

IT 34058 2587 61810

Tabla 5 – Ejemplo transversal (Cross-Sectional)

La organización de datos transversales (Cross-Sectional) se usa para el intercambio de datos

con más de un tipo de observación dentro de un conjunto de datos (Dataset). Esto significa

que está indicado para situaciones donde los datos estadísticos consisten en múltiples

observaciones en un momento concreto de tiempo, o para cada combinación de miembros de

dimensión (Dimension) en la tabla multidimensional. Un ejemplo de otro dominio estadístico

son las estadísticas de comercio exterior, donde para una combinación de país que informa,

país asociado, producto básico y periodo de tiempo pueden haber hasta tres observaciones:

valor, peso y/o cantidad.

Comercio Exterior (Ejemplo no real)

TIEMPO: 2007M12

PAIS QUE INFORMA DE - Alemania

PRODUCTO: Cubiertas para tejados

FLUJO: Importación

Indicador PESO

en 100KG

VALOR

en EUROS

CANTIDAD

en m3 Socio

CHEQUIA 44471 577197 14843

FRANCIA 23521 451799 8206

POLONIA 51391 895943 17810

Tabla 6 – Comercio exterior – CS (cross-sectional)

En el ejemplo transversal (Cross-Sectional) de la tabla 5, los datos se muestran con respecto a

un año concreto de observación: el año 2007. La tabla ilustra un número de entidades (países:

AT, ES, FR, IT) geográficas (GEO), donde para cada una de ellas se observan tres fenómenos

(tipos de establecimientos turísticos: hoteles y similares, campings de turistas y residencias

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

12/45

vacacionales). Estas observaciones se refieren solo al año 2007, subrayando así la diferencia

principal con los datos de serie temporal (Time Series) donde un fenómeno se mide a lo largo

de un período de tiempo (ej: observaciones anuales desde el 2002 al 2009).

En cualquier caso, el ejemplo transversal (Cross-Sectional) se refiere a los mismos

indicadores estadísticos y datos que el en el ejemplo basado en serie temporal (Time Series).

Por tanto, los conceptos para la estructura de serie temporal (Time Series) se mantienen, pero

la definición DSD ha de incluir especificaciones adicionales para el formato transversal

(Cross-Sectional).

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

13/45

3.4 Construcción de una definición de estructura de datos para datos

de serie temporal

Primeramente nos centramos en las definiciones de la organización de los datos de serie

temporal (Time Series), aunque pueda resultar obvio durante este proceso que estas

definiciones son válidas para ambos, la organización de datos TS (Time Series) y CS (Cross-

Sectional).

3.4.1 Conceptos

Al entrar en los detalles de los ejemplos mostrados en las tablas 4 y 5, el primer paso a

realizar es especificar los conceptos, los cuales comprenden los datos subyacentes de la tabla

estadística. Estos se usan para identificar y describir aún más los datos estadísticos y son, por

tanto, indispensables para la transformación de números puros en información estadística.

La lista de conceptos a definir es válida para representaciones, como la ‘Presentación de serie

temporal (Time Series) de la tabla 4’ y la ‘Presentación transversal (Cross-Sectional) en la

tabla 5’. Todos los conceptos que se usaron para construir las respectivas definiciones de

estructuras de datos (Data Structure Definitions) para los ejemplos se enumerarán finalmente

en la sección de concepto del fichero de estructura SDMX-ML en el dibujo 3 de abajo:

ID CONCEPTO NOMBRE ESQUEMA DE CONCEPTO

ID VERSIÓN AGENCIA

ACTIVITY_TO Actividad turística TOUR_CONCEPTS 1.0 ESTAT

AT Austria TOUR_CONCEPTS 1.0 ESTAT

COUNTRY País turístico TOUR_CONCEPTS 1.0 ESTAT

ES España TOUR_CONCEPTS 1.0 ESTAT

FR Francia TOUR_CONCEPTS 1.0 ESTAT

FREQ Frecuencia TOUR_CONCEPTS 1.0 ESTAT

INDIC_TO Indicador de turismo TOUR_CONCEPTS 1.0 ESTAT

IT Italia TOUR_CONCEPTS 1.0 ESTAT

OBS_STATUS Estado de la observación TOUR_CONCEPTS 1.0 ESTAT

OBS_VALUE Valor de la observación TOUR_CONCEPTS 1.0 ESTAT

TIME_FOMAT Formato de tiempo TOUR_CONCEPTS 1.0 ESTAT

TIME_PERIOD Período de tiempo TOUR_CONCEPTS 1.0 ESTAT

UNIT Unidad TOUR_CONCEPTS 1.0 ESTAT

Dibujo 3 – Sección de concepto de la guía de implementación de mensajes (MIG

- Message Implementation Guide)

En el dibujo 3 de arriba se puede observar que los conceptos del tema estadístico se reúnen en

un esquema de concepto (Concept Scheme) = TOUR_concepts’, el cual está identificado por

su ID ‘TOUR_concepts’, el ID de la agencia encargada ‘ESTAT’ y el número de versión.

Estos elementos y los conceptos contenidos han de codificarse, por ejemplo, en el “Data

Structure Wizard” (DSW), que es una herramienta para construir una DSD SDMX.

Los conceptos son identificados mediante su ID (por ejemplo "TOUR_INDICATOR") y

pueden contener información sobre listas de códigos (CL_TOUR_INDICAT) que

proporcionan los valores para el respectivo concepto y contienen una descripción dependiente

del lenguaje (comparar con el dibujo 3).

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

14/45

Los conceptos que han de definirse en el ejemplo son estos:

FREQUENCY; la frecuencia de los datos es “anual”. El valor “a = anual” para este

concepto se saca de la lista de códigos (Code List) de frecuencia (CL_FREQ);

COUNTRY con los valores (por ejemplo “FR” = Francia) proporcionados por una

lista de códigos (Code List) transversal de países ISO (CL_COUNTRY);

TOURISM INDICATOR: sus valores se toman de una lista de códigos (Code List) de

un dominio específico (CL_TOUR_INDICAT) - valor “A001” = Establecimientos;

TOURISM ACTIVITY: los valores se toman también de una lista de códigos (Code

List) de un dominio específico (CL_TOUR_ACTIVITY) - valor “A100” = Hoteles y

similares;

TIME PERIOD, que asigna un período de tiempo para la serie temporal (Time Series)

observada;

TIME FORMAT, que representa datos anuales unidos a una lista de códigos (Code

List) de un dominio específico (CL_TIME_FORMAT) para sus valores;

UNIT, con el valor “número” proveniente de la lista de códigos (Code List) de unidad

(CL_UNIT);

OBSERVATION VALUE, que representa los valores de los datos estadísticos

medidos;

OBSERVATION STATUS, que proporciona información sobre el estado de un valor

específico de observación (por ejemplo: “f” = forecasted data (datos previstos) o “p” =

provisional data (datos provisionales)).

La vinculación de los conceptos con la tabla estadística (en formato TS) se ilustra en el dibujo

4 a continuación:

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

15/45

Dibujo 4 – Conceptos vinculados a la tabla estadística TS (Time Series)

3.4.2 Listas de códigos (Code Lists)

Para poder intercambiar y comprender los datos, hace falta que se declaren los posibles

valores de cada concepto. Aparte de la posibilidad de definir formatos de texto para valores de

texto libre, que suelen usarse para atributos (Attributes), el enfoque más ampliamente usado es

el de adjuntar listas de valores. A esta lista de posibles valores se la conoce como “lista de

código” (Code List). Cada valor de la lista tiene una abreviatura independiente del lenguaje -

un “código” - y una descripción de lenguaje específica. Esto nos ayuda a librarnos de

problemas de traducción a la hora de describir los datos: el código puede traducirse en

descripciones en cualquier lenguaje sin tener que cambiar el código asociado a los propios

datos.

Siempre que sea posible, los valores de las listas de código (Code Lists) se toman de

estándares internacionales; como aquellas propuestas en las directrices orientadas al contenido

SDMX (SDMX Content Oriented Guidelines) u otras internacionalmente estandarizadas (por

ejemplo listas de códigos (Code Lists) ISO para países y divisas). Para este ejemplo, han de

definirse las listas de códigos específicas (Code Lists) o las listas de códigos (Code List)

apropiadas que ya existen para las dimensiones (Dimensions), al igual que para los atributos

(Attributes) no representados por valores de texto libre. Estas dimensiones (Dimensions) y

atributos (Attributes) asociados a listas de códigos (Code List) son denominadas

“codificadas”.

Véase la tabla 7 para obtener un resumen de las listas de códigos (Code Lists) asociadas a los

conceptos del ejemplo. Por favor, téngase en cuenta que para algunos de ellos solo se muestra

una selección de códigos.

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

16/45

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

17/45

Tabla 7 – Resumen de las listas de códigos (Code Lists)

3.4.3 Dimensiones, atributos, grupos y medidas

Los conceptos descriptores identificados se distinguen ahora entre dimensiones (Dimensions),

que describen los datos y forman el identificador (clave) de los datos asociados, y atributos

(Attributes), que proporcionan información descriptiva adicional para cualificar el dato y la

medida (fenómeno observado).

Las siguientes dimensiones (Dimensions) pueden ser detectadas (tal como se ilustran en el

Dibujo 4):

Frecuencia (FREQ);

Región geográfica referida (COUNTRY);

Indicadores de turismo (TOUR_INDICATOR);

Actividad de turismo (TOUR_ACTIVITY);

Tiempo (TIME_PERIOD)

La frecuencia y el tiempo son dimensiones (Dimensions) especiales obligatorias para

cualquier organización de datos TS, que normalmente aparecen juntos con el atributo de

formateo asociado TIME_FORMAT. FREQ y TIME_PERIOD han de señalarse de la

siguiente manera:

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

18/45

Una serie temporal (Time Series) siempre tiene una “frecuencia” (FREQ). Este es un

concepto descriptor que describe los intervalos de tiempo entre observaciones. La

opción “isFrequencyDimension” ha de ser seleccionada para identificarlo. Solamente

puede haber una dimensión (Dimension) de frecuencia por definición de estructura de

datos (Data Structure Definition);

La dimensión tiempo (Time Dimension) (TIME_PERIOD) es una dimensión

(Dimension) especial que debe ser incluida en cualquier definición de estructura de

datos (Data Structure Definition) que vaya a ser usada para mensajes de datos de serie

temporal (Time Series). Esta dimensión (Dimension) se señala como

“isTimeDimension” en la sección de DSD (familia clave - Key Family).

Los elementos de dimensión (Dimension) contienen referencias a un concepto descriptor y a

la lista de códigos (Code List) desde la cual el valor de dimensión (Dimension) se ha de

tomar. El orden en la declaración de las dimensiones (Dimensions) es importante ya que

describe el orden en el que las dimensiones (Dimensions) aparecerán en las claves (keys)

(excepto para la dimensión de tiempo (Time Dimension), que no es parte de la clave).

Normalmente FREQ y COUNTRY son los primeros conceptos en este orden.

Atributos (Attributes) del ejemplo:

Un elemento de tipo atributo del DSD contiene información, como por ejemplo, el concepto

usado para el atributo, el nivel de asociación para ambas representaciones (serie temporal

(Time Series) y transversal (Cross-Sectional)) y si el valor ha de ser proporcionado o no

("obligatorio" contra "condicional").

Entre ellos está, por ejemplo, la unidad de medida o información en OBS_STATUS. Los

atributos (Attributes) con valores codificados incluyen el nombre de la lista de códigos (Code

List) que proporcionan los valores. Los demás pueden tener un formato de datos especificado

mediante el uso del elemento “TextFormat”.

A continuación, el nivel de asociación: "Observación" (observation), "Grupo" (Group),

"Serie" (series) o "Conjunto de Datos" (Dataset) se definen para los atributos (Attributes) en

una representación de una serie temporal (Time Series). El concepto de formato de tiempo se

especifica con la opción “isTimeFormat” (con el valor fijado en “true” -verdadero) y es

habitualmente un atributo de nivel de serie obligatorio cuyo valor se toma de una lista de

códigos (Code List) que cumple con la norma ISO8601. Para los atributos (Attributes)

adjuntos al nivel de grupo (Group), primero ha de especificarse el grupo (Group) al cual los

atributos (Attributes) se adjuntan con un elemento tipo “AttachmentGroup”4.

En el dibujo 4 - Conceptos unidos a la tabla estadística TS, que se encuentra más arriba, se

muestra como el OBSERVATION STATUS (estado de observación) se relaciona

directamente con el valor de observación (“observation level”). TIME FORMAT (formato de

tiempo) se mantiene normalmente en el mismo nivel (“serie” en el ejemplo) que las

dimensiones FREQUENCY (frecuencia) y TIME PERIOD (periodo de tiempo). UNIT

(unidad) se adjunta así mismo al nivel de serie.

4 Se proporcionan más explicaciones en profundidad sobre niveles de asociación para

atributos en el libro del estudiante n. 2 "El modelo de información SDMX".

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

19/45

Nivel de asociación para los atributos (Attributes) en la representación de datos de serie

temporal (Time Series):

Estructuras de agrupamiento / empaquetado:

El elemento de grupo (Group) declara los agrupamientos deseados de datos, por ejemplo el

“sibling group”, que contienen un conjunto de series que son idénticas con respecto a sus

conceptos, excepto el hecho de que son medidas con distintas frecuencias (observaciones

mensuales, trimestrales y anuales). No se muestra ningún agrupamiento en el ejemplo5.

Medida primaria (Primary Measure):

Su misión es indicar qué concepto contendrá el valor medido. Se encuentra asociada

convencionalmente al concepto de valor de observación (Observation Value) (OBS_VALUE)

para el formato de datos de serie temporal (Time Series).

3.5 Definiciones adicionales para la representación de datos

transversales

Las representaciones transversales (Cross-Sectional) de los datos pueden obtenerse de la

misma definición de estructura de datos (Data Structure Definition) de la que se estructuran

las representaciones de serie temporal (Time Series), siempre que se proporcionen los

metadatos de estructura adicionales que sean necesarios. Por lo tanto, una funcionalidad

específica permite que se declaren múltiples medidas en la definición de estructura de datos

(Data Structure Definition), tomando así sus valores de representación de lo que podría

llamarse una “dimensión de medidas transversales” (Cross-Sectional Measure Dimension).

Cuando los datos se estructuran para representar un conjunto de múltiples observaciones en

un único momento en el tiempo, la “sección” (una o más observaciones para cada medida

declarada) reemplaza a la serie en la estructura de datos para el formato transversal (Cross-

Sectional).

Las estructuras de datos transversales (Cross-Sectional) usan los mismos conceptos al

describir los datos. La relación de los conceptos cambia (ej.: de serie a sección) para la

presentación transversal (Cross-Sectional) de los datos.

La definición de la clave de los datos también cambia, puesto que cada medida transversal

(Cross-Sectional Measure) representa al menos una dimensión (Dimension) de la clave al

nivel de sección. Estas dimensiones (Dimensions) se encuentran recogidas en la denominada

“dimensión de medida” (Measure Dimension).

5 Se proporcionan más explicaciones en profundidad sobre las estructuras de

agrupamiento / empaquetado en el libro del estudiante n. 2 – El modelo de información

SDMX.

Atributo Nivel de asociación

OBSERVATION STATUS Observación

TIME FORMAT Serie

UNIT Serie

Tabla 8 - Atributos (Attributes) con su nivel de asociación

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

20/45

Los otros elementos de la clave pueden encontrarse a nivel sección en el ejemplo, de la misma

forma que su declaración a nivel de serie para las estructuras de datos en serie temporal

(Times Series).

Como consecuencia, el ejemplo transversal (Cross-Sectional) muestra las mismas clases de

datos que las hechas antes a partir de una serie temporal (Time Series) en una organización

diferente.

Además de los elementos de la DSD para los datos de serie temporal (Time Series), se han de

añadir especificaciones adicionales al formato transversal (Cross-Sectional) con el fin de que

se pueda usar la DSD para mensajes de datos SDMX-ML de ambas organizaciones de datos.

Las múltiples medidas de la representación de datos transversales (Cross-Sectional) han de

definirse en la dimensión de medida (Measure Dimension). Los valores de la dimensión de

medida (Measure Dimension) también se tratarán como conceptos:

“COUNTRY” se declara como “dimensión de medida” (“Measure Dimension”), y

los elementos de esta dimensión (Dimension) se toman de una lista de código

“CL_COUNTRY” (por favor comparar con la tabla 7 - Vista general de las listas de

códigos (Code Lists));

Además, ha de definirse el nivel de asociación para las dimensiones (Dimensions) y

los atributos (Attributes) con respecto al formato transversal (Cross-Sectional):

Dimensión Nivel de Asociación

FRECUENCY Sección

TOUR_INDICATOR Sección

TOUR_ACTIVITY Sección

TIME PERIOD Sección

Atributo Nivel de Asociación

OBSERVATION STATUS Observación

TIME FORMAT Sección

UNIT Sección

Tabla 9 – Asociación transversal (Cross-Sectional)

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

21/45

Dibujo 5 – Conceptos unidos a la tabla estadística CS

3.6 Construcción de la estructura de datos SDMX-ML

Tras tener una visión general adecuada de la estructura de los datos, la estructura que se

presenta en la tabla 10 puede definirse formalmente en SDMX-ML, preferentemente con la

ayuda de una herramienta dedicada SDMX, como por ejemplo, el Data Structure Wizard

(DSW) o la función de construcción de DSD del registro SDMX (“SDMX Registry”) de

Eurostat.

ESTRUCTURA PARA LA DSD – Serie Temporal (TS) y Transversal (CS)

Clave

(TS)

Clave

(CS)

Nivel de Asociación y estado

de uso

ID Concepto Nombre de

Concepto

ID Formato de Lista

de Códigos

Nombre de

Lista de

Códigos

Dimensiones

1 1 Sección de

Asociación

CS

FREQ Frecuencia CL_FREQ(1.0) Lista de

códigos de

frecuencia

2 COUNTRY País

Turístico CL_COUNTRY(1.0) Lista de

códigos de

País

3 2 Sección de

Asociación

CS

INDIC_TO Indicador

de Turismo

CL_TOUR_INDICAT

(1.0)

Lista de

códigos de

Indicador de Turismo

4 3 Sección de

Asociación

CS

ACTIVITY_TO Actividad

Turística

CL_TOUR_ACTIVITY

(1.0)

Lista de

códigos de

Actividad de

Turismo

Medidas CS

AT Austria CL_COUNTRY(1.0) Lista de

códigos de

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

22/45

4

País

ES España CL_COUNTRY(1.0) Lista de

códigos de

País

FR Francia CL_COUNTRY(1.0) Lista de

códigos de

País

IT Italia CL_COUNTRY(1.0) Lista de

códigos de

País

Referencia de Tiempo y observaciones

Sección de

Asociación CS

TIME_PERIOD Período de

tiempo

OBS_VALUE Valor de

observación

Atributos de observación asociados

Nivel

de

asociaci

ón / TS

Nivel de

asociación /

CS

Condicional

Obligatorio

Observa

ción Observación Condicional OBS_STATUS CL_OBS_STATUS

(1.0)

Lista de

códigos del estado de

observación

Otros atributos

Serie Sección Obligatorio UNIT CL_UNIT(1.0) Lista de

códigos de unidad

Serie Sección Obligatorio TIME_FORMAT CL_TIME_FORMAT

(1.0)

Formato de

tiempo

Tabla 10 – Vista general de la estructura para la creación de la DSD

Al aplicar una de esas herramientas (por ejemplo el DSW) para definir un DSD con sus

artefactos asociados, las definiciones de estructura de datos (Data Structure Definitions)

definidas se almacenarán en un formato de mensaje de estructura SDMX-ML (SDMX-ML

Structure Message) dedicado. El denominado formato de mensaje de estructura SDMX-ML

(SDMX Structure Message) contiene la descripción de los metadatos estructurales, tales como

la familia clave (Key Family), el esquema de concepto, conceptos y listas de códigos (Code

Lists). Como los mensajes de estructura SDMX-ML (SDMX-ML Structure Messages) no son

fáciles de leer, el dibujo 6 - La parte de Familia Clave (Key Family) de la MIG (Message

Implementation Guide) - muestra la estructura de datos en el formato sencillo de guía de

implementación de mensaje (MIG: Message Implementation Guide).

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

23/45

Dibujo 6 – La parte de Familia Clave (Key Family) de la MIG (Message

Implementation Guide)

3.7 Formato transversal especial (censo)

Con respecto al establecimiento del nuevo Censo 2011, se opta por una organización de datos

transversales (Cross-Sectional) especiales para el intercambio de datos. Primero, se debe

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

24/45

describir un hipercubo como una DSD. Por consecuente, se debe crear una DSD para cada

uno de los hipercubos de censo.

El formato de estructura de datos detallado más abajo (organización de datos CS sin medidas

CS) para la aplicación piloto del “Census Hub” fue elegido por su flexibilidad en cuanto al

manejo de datos tabulados transversalmente y su estructura específicamente fácil de

implementar.

Se espera que este tipo de DSD se use frecuentemente en el futuro para transmisiones de datos

similares.

El ejemplo se centra en el primer hipercubo de censo incluido en el proyecto piloto de

“Census Hub” con las dimensiones (Dimensions): AGE, CAS (current activity status, “estado

de actividad actual” en inglés), GEO (geographical area) y SEX. Un segundo hipercubo

reemplaza a la dimensión (Dimension) CAS (current activity status) por: Marital status

(“estado civil”).

La especificación de la estructura transversal (Cross-Sectional) del censo del primer hipercubo

puede resumirse de la siguiente forma:

No se miden fenómenos múltiples, por tanto no se definen medidas transversales

(Cross-Sectional Measures);

La medida primaria (Primary Measure) (OBS_VALUE se incluye para cumplir con el

estándar SDMX y para medir el fenómeno asociado;

Las dimensiones (Dimensions) declaradas: AGE, CAS (current activity status), GEO

(geographical area) y SEX, las cuales representan la “clave” para los datos del censo

(census), se relacionan con la medida OBS_VALUE al nivel CS de “Observation”.

Las siguientes dimensiones (Dimensions) son especiales: TIME_PERIOD y FREQ.

Las dimensiones (Dimensions) TIME-PERIOD y FREQ y el atributo

TIME_FORMAT se relacionan con el nivel de grupo (Group) CS;

Un atributo (Attribute) más completa la definición de las DSD: estado de observación

(OBS_STATUS), que se relaciona con el nivel “Observational”.

La construcción del DSD sigue los mismos pasos descritos anteriormente, pero teniendo en

cuenta que las dimensiones (Dimensions) descritas arriba reducen la complejidad en cuanto a

los pasos y al número, ya que ninguna dimensión (Dimension) de medida transversal (Cross-

Sectional Measure) ha de ser definida con sus conceptos asociados.

La definición de estructura de datos (Data Structure Definition) construida tiene la misión de

manejar los mensajes de datos SDMX-ML en el formato transversal (Cross-Sectional),

aunque una organización de datos TS también sería posible, ya que las dimensiones

(Dimensions) tiempo, frecuencia y formato de tiempo están definidas.

La tabla 11 - Visión general de la estructura para la creación de la CENSUS DSD, presenta

una vista general de las definiciones necesarias de la CENSUS-DSD.

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

25/45

Tabla 11 – Visión general de la estructura para la creación de la CENSUS-DSD

ESTRUCTURA PARA LA DSD – “Census HUB” – Transversal (CS)

Clave

(cs)

Nivel de asociación y estado de

uso Id concepto

Nombre de

concepto Id lista de códigos

Dimensión

1 Observación de

Asociación CS AGE Clases de edad CL_AGE_M

2 Observación de

Asociación CS CAS

Estado Actual de

Actividad CL_CAS_M

3 Observación de

Asociación CS GEO Área geográfica CL_GEO_M

4 Observación de

Asociación CS SEX Sexo CL_SEX_M

Grupo de

Asociación CS TIME_PERIOD

Período de

tiempo

Grupo de

Asociación CS FREQ Frecuencia CL_FREQ_M

Medida Primaria

Observación de

Asociación CS Condicional OBS_VALUE

Valor de

observación

Atributos

Grupo de

Asociación CS Obligatorio TIME_FORMAT

Formato de

tiempo CL_TIME_FORMAT

Observación de

Asociación CS Condicional OBS_STATUS

Estado de la

Observación CL_OBS_STATUS

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

26/45

4 Creación paso a paso de la DSD para el ejemplo de turismo

4.1 Data Structure Wizard (DSW)

La aplicación “Data Structure Wizard” (DSW) proporciona una solución mejorada para la

gestión de definiciones de estructuras de datos (DSD - Data Structure Definitions) dentro

del estándar SDMX v2.0. Puede actuar como una herramienta híbrida que puede usarse tanto

offline como online (unida a un “SDMX Registry”), dependiendo de lo que elija el usuario y

de sus derechos de acceso.

El modo offline tiene como fin el mantenimiento de artefactos SDMX v2.0. Un

repositorio local se utilizará para almacenar archivos de estructura SDMX-ML de los

artefactos;

En el modo online, la herramienta se comunica con cualquier “SDMX Registry” que

cumpla con el estándar (ej: “SDMX Registry” de Eurostat) ofreciendo al mismo

tiempo todas las funcionalidades proporcionadas en el modo offline. Además, tras

editar y almacenar los artefactos DSD localmente (offline), el artefacto editado (o uno

nuevo) puede enviarse al “SDMX Registry” mientras que el usuario tenga privilegio

de “mantenimiento”.

Otras habilidades de la aplicación incluyen la creación de ficheros de muestra de datos

SDMX-ML desde plantillas DSD o la construcción de la guía de implementación de mensajes

(MIG - Message Implementation Guide) para una DSD dada. El DSW (“Data Structure

Wizard”) también proporciona varios mecanismos de importación/exportación desde/a

ficheros SDMX-ML v2.0. El sistema HELP de la aplicación ofrece explicaciones paso a paso

con la ayuda de imágenes para la creación de cada artefacto SDMX con el DSW (“Data

Structure Wizard”).

A modo de resumen, el DSW (“Data Structure Wizard”) cubre las siguientes funcionalidades

para el manejo de artefactos de metadatos estructurales:

Interacción con cualquier “SDMX Registry” que cumpla con el estándar, tal y como se

describe más arriba.

Mantenimiento de los siguientes artefactos SDMX v2.0:

o Listas de códigos (Code Lists);

o Esquemas de concepto (Concept Schemes);

o Definiciones de estructuras de datos (Data Structure Definitions);

o Flujos de datos (Data Flows);

o Esquemas de categoría (Category Schemes);

o Listas de códigos jerarquizadas (Hierarchical Code Lists);

o Esquemas de organización (Organisation Schemes);

Creación de plantillas de mensaje de datos para una DSD específica en formato

SDMX v2.0;

Importación y exportación de artefactos desde/a formato SDMX-ML v2.0;

Importación y exportación desde/a otros formatos;

Construcción y exportación de una MIG (Message Implementation Guide) para una

DSD dada;

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

27/45

Impresión de informes resumen para listas de códigos (Code Lists), conceptos sacados

de esquemas de concepto (Concept Schemes), DSD, flujos de datos (Data Flows) e

impresión de informes para los componentes DSD y para los códigos de las listas de

códigos (Code Lists);

Habilidades de búsqueda (buscar un flujo de datos (Data Flow) para una DSD

especificada, buscar una DSD para un flujo de datos (Data Flow) especificado, buscar

todas las DSD usando una lista de códigos (Code List) y buscar todas las DSD usando

un concepto dado.

4.2 Creación de una DSD de turismo con el DSW6

4.2.1 Definición de listas de códigos

Para crear una nueva lista de códigos (Code List) en la aplicación: al seleccionar 'Add' desde

el menú contextual del nodo 'Code lists', se muestra una nueva página de lista de códigos

(Code List) en la parte derecha de la pantalla y, en la ventana izquierda, un nodo hijo aparece

de las listas de códigos (Code Lists) marcados con '++' (tal como indica la flecha roja '2' en el

dibujo abajo).

Para crear una lista de códigos (Code List), los requisitos mínimos son rellenar los campos

obligatorios de las secciones 'Code List Attributes Panel' y 'CodeList Properties Panel', y

presionar el botón 'Save Code List'. Los campos obligatorios están destacados en amarillo y

6 La siguiente creación de la DSD paso a paso solo trata los objetos principales y los

elementos que son necesarios para construir la DSD para el ejemplo de turismo. Para

una introducción más específica sobre el DSW, se proporciona una guía junto con la

herramienta además de un sistema de ayuda interno que ofrece una orientación

detallada sobre la creación de artefactos. Para este capítulo se usó la versión 0.8.6 del

DSW.

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

28/45

señalados con el signo (*).

Información de Listas de Códigos

En la página mostrada en el dibujo de arriba, seleccionar la etiqueta 'CodeList Information'

cómo indica la flecha roja '3'.

En el Code List Attributes Panel (4) el usuario ha de realizar las siguientes acciones:

Rellenar el 'ID' obligatorio;

Seleccionar la 'Agency ID' que se encuentra previamente rellenada con el primer

'AgencyID' de la lista de agencias proporcionada por la aplicación (requiriéndose así a

un esquema de organización (Organisation Scheme) y al menos la definición de una

agencia (ej: ESTAT) en la sección de artefactos del esquema de organización

(Organisation Scheme));

Los otros campos se pueden rellenar opcionalmente. El campo 'Version' lo puede

proporcionar el usuario, pero si se omite, la versión se considerará como 1.0 o

incrementada consecutivamente para una nueva lista de códigos (Code List).

Si la casilla 'Is Final' se encuentra seleccionada, el artefacto se protegerá (ninguna

modificación más será posible) y podrán ser añadidas referencias por otros artefactos

(ej: por un DSD).

En el CodeList Properties Panel (5) el usuario puede realizar las siguientes acciones:

Rellenar el campo obligatorio 'Names'. Se ha de definir al menos un valor localizado

(lenguaje).

Para guardar toda la información introducida, presionar 'Save CodeList' (6).

Elementos de Listas de Códigos

En la etiqueta 'CodeList Elements' hay una sección con elementos existentes enumerados que

provienen de la lista de códigos (Code List) seleccionada (con su valor y código padre), como

indica la flecha roja '1' en el dibujo de abajo.

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

29/45

Para añadir un valor, presionar el botón 'New Code' como indica la flecha roja '2', y entonces:

Rellenar el campo obligatorio 'Value' con el código (3);

Rellenar el campo 'Descriptions' (4), que también es obligatorio, con la descripción del

código;

Presionar el botón 'Save Code' (5) y la información se añadirá en la sección superior

de la etiqueta 'Codelist Elements';

Los pasos (2-5) se repiten para introducir cada código ;

El botón 'Remove Code' borra un código después de seleccionarlo;

Para ver los códigos creados como un árbol de código, el usuario debe presionar el

botón de 'Tree view' de la sección señalada por la flecha '2' y una ventana aparecerá

mostrando el árbol de código.

Después de haber rellenado todos los campos obligatorios, la nueva lista de códigos se

guardará al presionar 'Save Code list' (6). Como resultado, el árbol de la ventana izquierda de

la pantalla se refrescará para mostrar la nueva lista de s (Code List) creada. El nombre de la

nueva lista de códigos (Code List) es una combinación del 'ID', 'Agency ID' y 'Version', que lo

identifica singularmente.

4.2.2 Definición de esquema de concepto (Concept Scheme)

Los esquemas de concepto (Concept Schemes) representan una colección de conceptos. Para

iniciar la creación de un esquema de concepto (Concept Scheme) en la aplicación DSW:

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

30/45

Seleccionar el nodo de artefacto 'ConceptSchemes' del árbol de artefactos SDMX, hacer

clic con el botón derecho y seleccionar ‘Add’ (1).

Un nodo hijo de 'ConceptSchemes' aparecerá marcado con '++' (2). En el dibujo de arriba hay

dos etiquetas ('ConceptScheme Information' y 'ConceptScheme Elements') donde el usuario

tiene que completar por lo menos la información obligatoria para crear un nuevo artefacto

ConceptScheme.

Información de Esquema de Concepto (3)

En el ConceptScheme Attributes Panel (4) se pueden realizar las siguientes acciones:

Rellenar el 'ID', seleccionar 'Agency ID' y proporcionar 'Version'; si no se rellenase

este campo, la versión por defecto será la 1.0;

Rellenar los otros campos opcionalmente. Al seleccionar la casilla 'Is Final' se protege

el artefacto guardado y se permite añadir referencias.

En el ConceptScheme Properties Panel (5) se pueden realizar las siguientes acciones:

Rellenar el campo obligatorio 'Names'. Rellenar opcionalmente el campo 'Description'

en el lenguaje respectivo para cada nombre introducido que dependa de un lenguaje.

Guardar toda la información introducida al presionar el botón 'Save ConceptScheme' (6).

Elementos de esquema de concepto (Concept Scheme)

En la etiqueta superior 'ConceptScheme' (1 - en el dibujo más abajo) se encuentra una sección

con tablas que enumeran los conceptos definidos para el esquema de concepto (Concept

Scheme) actual con su ID y su concepto padre (esto por ejemplo es aplicable a los conceptos

de medida CS (CS Measure Concept): AT, ES, FR e IT, donde el concepto COUNTRY se

tiene que introducir).

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

31/45

En la sección Concept *NAME* Properties el usuario puede añadir un concepto para el

esquema actual que se está completando, al presionar el botón 'New Concept' (2).

Después de presionar 'New Concept', la tabla de la cabecera de la etiqueta se habilita (si es

que estaba vacía) y se añade una nueva línea de cuadrícula (rectángulo rojo). Los siguientes

pasos han de realizarse:

Rellenar el campo 'ID' y 'Names' (3 y 4), ambos obligatorios y por ellos señalados en

amarillo y con un *;

Rellenar el panel 'Text Format' con las propiedades que se muestran.

Presionar el botón (5) 'Save Concept' y la información se añadirá a la línea de cuadrícula de la

tabla.

Los pasos que van del 2 al 5 se tendrán que repetir para cada concepto necesario en el

ejemplo. Para ver los conceptos creados o asociados con el esquema de concepto (Concept

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

32/45

Scheme) actual como una lista en forma de árbol, presionar el botón 'Tree view'.

Para guardar el esquema de concepto (Concept Scheme) entero, que ahora incluye los nuevos

conceptos creados para el ejemplo de turismo en la tabla, presionar el botón (6) 'Save

ConceptScheme'.

4.2.3 Definición de una DSD

Antes de empezar a crear una nueva DSD, debe de haber en la aplicación DSW al menos un

esquema de concepto (Concept Scheme) con los conceptos definidos.

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

33/45

Al seleccionar 'Add' dentro del menú contextual del nodo 'DSDs', un nueva página de DSD

muestra en la parte derecha de la pantalla, y concretamente en la ventana derecha, un nodo

hijo de DSD aparecerá señalado con '++' (2). Para empezar a completar el artefacto DSD,

seleccionar la etiqueta 'DSD Information' (3) como en el dibujo de arriba.

Información DSD

En el DSD Attributes Panel (4) el usuario deberá realizar las siguientes operaciones:

Rellenar los campos obligatorios 'ID' y 'AgencyID', que se encuentran ya rellenados

con el primer AgencyID de la lista 'OrganisationScheme' proporcionado por la

aplicación DSW;

Los otros campos ('Valid From', 'Valid To', 'URI', 'URN' e 'Is Final') son opcionales.

El campo URI apunta a un mensaje de estructura SDMX (SDMX Structure Message)

que contiene detalles completos sobre el flujo de datos (Data Flow). El atributo 'URN'

(universal resource name) puede albergar un vínculo válido con el registro SDMX

(“SDMX Registry”). Si se selecciona la casilla 'Is Final', el artefacto se protegerá

(ninguna modificación más será posible) y podrán ser añadidas referencias por otros

artefactos (ej: un flujo de datos (Data Flow) basado en esta DSD);

El campo 'Version' se puede rellenar. Si se omite, la versión será la 1.0. Los campos

'ValidFrom' y 'ValidTo' pueden albergar fechas que proporcionen información de

validación suplementaria sobre la versión actual del DSD.

En el DSD Properties Panel (5) se requieren las siguientes acciones:

Rellenar el campo 'Names', y opcionalmente, rellenar el campo 'Description'.

Para guardar toda la información introducida, presionar 'Save DSD'.

Elementos DSD – Medida Primaria

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

34/45

La pantalla 'DSD' contiene una segunda etiqueta que se llama 'DSD Elements' (2).

En primer lugar la etiqueta 'Primary Measure' (señalada en un cuadrado rojo) se tiene que

rellenar. Presionar el botón 'Choose' (2) para seleccionar el concepto OBS_VALUE

relacionado. Un ventana aparecerá mostrando donde el usuario puede buscar y seleccionar el

concepto del esquema de concepto (Concept Scheme) relacionado por ID o por nombre.

Después de rellenar todos los campos obligatorios, con el botón 'Save DSD' (3) se almacena el

artefacto actualizado.

Elementos DSD - Dimensiones

En el 'DSD Elements' (1) del dibujo de abajo, seleccionar la etiqueta 'Dimensions' (2).

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

35/45

En este panel el usuario deberá realizar las siguientes acciones:

Añadir una nueva dimensión (Dimension), al presionar el botón 'New Dimension' (3).

Una nueva línea de cuadrícula se añadirá a la tabla (rectángulo rojo) enumerando las

dimensiones (Dimensions) incluidas en la DSD actual;

Para seleccionar un 'Role' (4) el usuario ha de elegir una de estas opciones de la lista:

'Dimension', 'TimeDimension', 'FrequencyDimension' o 'MeasureDimension';

Como COUNTRY es la dimensión (Dimension) de medida de nuestro ejemplo, los

campos Role, Concept y Code List que proporcionan los valores para el concepto

COUNTRY han de ser elegidos adecuadamente (4-6);

Completar opcionalmente los elementos de la sección Text Format para definir un

formato de texto específico para la dimensión (Dimension).

Para guardar la dimensión (Dimension) y la estructura de datos actualizada, presionar primero

'Save Dimension' (7) y luego 'Save DSD' (8).

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

36/45

Una vez que las dimensiones (Dimensions) reflejadas arriba se hayan definido, el usuario

pasará a la siguiente etiqueta.

Elementos DSD – Claves de Grupo

El usuario podrá declarar aquí cualquier agrupamiento dentro de las dimensiones

(Dimensions) declaradas (no temporales). Estas forman claves parciales a las que se les puede

adjuntar atributos (Attributes). Un posible agrupamiento es el denominado ‘Sibling group’,

que no se definirá para el ejemplo de turismo. El dibujo inferior ilustra los pasos a seguir para

completar los campos:

Añadir un nuevo grupo (Group) al presionar 'New Group' (3);

Rellenar el recuadro 'Group Key ID' (4) con el nombre de la clave de grupo (Group

Key);

Seleccionar la dimensión (Dimension) que forma la clave de grupo (Group Key) de la

lista 'Available' y transferirla a 'Selected' (5).

Guardar el grupo (Group) al presionar el botón 'Save Group' (3 - detrás de 'New Group'), y

entonces presionar 'Save DSD' (6).

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

37/45

Elementos DSD – Medidas XS

En la etiqueta 'DSD Elements' (1) seleccionar las definiciones para las medidas transversales

(Cross-Sectional Measures) en la etiqueta 'XS Measures' (2) como en el dibujo de abajo.

Esta pantalla solo se habilitará si el usuario ha seleccionado en la etiqueta 'Dimensions' de

arriba, el valor 'Measure Dimension' de la lista 'Role' para la dimensión de COUNTRY.

Las siguientes acciones serán necesarias para crear mediciones transversales (Cross-Sectional

Measures) para la dimensión (Dimension) de medida COUNTRY del ejemplo de turismo:

Elegir el valor para completar el campo 'Concept' (3) para cada medida transversal

(XSMeasures - Cross-Sectional) definida para el artefacto DSD actual y enumerada en

la sección de tabla (señalada con un rectángulo rojo en el dibujo de arriba);

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

38/45

Elegir la lista de código (Code List) COUNTRY;

Nota: no es obligatorio rellenar la sección 'Text Format'.

Para guardar la medida transversal (Cross-Sectional Measure), presionar el botón 'Save

XSMeasure' (4). Para guardar la estructura de datos actual con sus actualizaciones, presionar

el botón 'Save DSD'.

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

39/45

Elementos DSD – Atributos

En la etiqueta 'DSD Elements' (1) del dibujo de abajo seleccionar la etiqueta 'Attributes' (2).

En esta pantalla han de realizarse las siguientes acciones:

Añadir un atributo nuevo al presionar el botón 'New Attribute' (3). Una nueva línea de

cuadrícula se añadirá a la sección de la tabla en la pantalla (señalada con el rectángulo

rojo);

Elegir un concepto presionando el botón 'Choose' del campo obligatorio 'Concept' (4)

y seguir los pasos indicados.

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

40/45

Seleccionar un 'Assignment Status' (5). Este estado indica si un valor ha de ser proporcionado

para el atributo de un fichero de datos. En ese caso, dos estados de asociación son posibles:

'Mandatory' y 'Conditional'.

El elemento 'Attachment Group' se habilita cuando este atributo se atribuye al nivel 'Group'.

Este indica con que grupo (Group) o grupos declarados se puede asociar el atributo. Ningún

grupo (Group) se declara y ningún tipo de relación está prevista en el ejemplo de turismo.

Seleccionar un 'Attachment Level' de la lista respectiva (6). Las opciones disponibles

son 'DataSet', 'Group', 'Series' y 'Observation';

Al seleccionar 'Observation' como nivel de asociación, la sección 'Attachment

Measure' (7) se habilita y el usuario debe elegir de las medidas disponibles, las que

vaya a usar para la asociación. Esto implica el tener que mover al menos un valor

desde la correspondiente lista 'Available' hasta la de 'Selected';

Cuando el usuario selecciona 'Group' como nivel de asociación, la sección 'Attached

Group ID' (8) se habilita y el usuario puede seleccionar normalmente de entre los

grupos (Groups) disponibles aquellos con los que el atributo tiene que asociarse (esto

no es así en el ejemplo de turismo);

El tipo de atributo deberá definirse para los atributos (Attributes) especiales con las

opciones de la lista 'Is...'; éstas son: 'TimeFormat', 'Entity Attribute',

'NonObservational Time Attribute', 'Count Attribute', 'Frequency Attribute' o 'Identity

Attribute'. Por tanto, para el ejemplo, el atributo TIME_FORMAT se señalará como

'Is... TimeFormat';

En la sección 'CrossSectional Attachment Level', el nivel de asociación de la

organización de datos transversales (Cross-Sectional) se tiene que definir, ya que la

DSD TOURISM admite tanto ficheros de datos TS como CS;

La sección 'Text Format' se puede rellenar opcionalmente.

Para guardar el atributo que se está editando, presionar el botón 'Save Attribute' (9). Para

guardar la estructura de datos actual, presionar el botón 'Save DSD' (10)

4.2.4 Exportar DSD

Para exportar el DSD a un fichero de estructura SDMX-ML, incluyendo los artefactos

referenciados (listas de códigos (Code Lists), esquema de concepto (Concept Scheme)), el

usuario ha de hacer clic con el botón derecho sobre el DSD respectivo en el árbol 'SDMX

Artefacts' y elegir 'Export' en el menú. También es posible exportar el DSD y los artefactos

asociados, como las listas de códigos (Code List) y el esquema de concepto (Concept

Scheme), por separado. Los ficheros SDMX-ML exportados se alojan en un archivo dentro de

un anexo a este libro del estudiante.

En el 'Export Panel' de la derecha, se selecciona la DSD para la exportación incluyendo sus

referencias (casilla). Al presionar el botón 'Export', el destino de exportación se puede

seleccionar. El DSW tiene una función similar que permite importar los DSD y otros

artefactos.

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

41/45

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

42/45

5 Guía de implementación de mensajes

La guía de implementación de mensajes (Message Implementation Guide) es un documento

(en formato de fichero rich-text) que enumera todas las especificaciones de una DSD. La MIG

(Message Implementation Guide) ayuda al usuario a producir o incluso a leer/comprender un

conjunto de datos SDMX (SDMX Dataset) y/o su estructura. Está diseñada para gente sin

experiencia previa con SDMX o XML.

Para ello, la MIG (Message Implementation Guide) contiene descripciones detalladas de la

estructura de un conjunto de datos (Dataset) particular en relación a los siguientes elementos:

Dimensiones (Dimensions) (concepto, representación y nivel de asociación);

Medidas (Measures) (concepto, representación y nivel de asociación);

Atributos (Attributes) (concepto, representación y nivel de asociación);

Conceptos (Concepts);

Listas de códigos (Code Lists).

La herramienta DSW contiene una función para crear una MIG para una DSD definida. Para

construir y guardar la MIG (como fichero rtf), el usuario debe presionar el botón 'Download

MIG' (señalado con el rectángulo rojo) en el dibujo de abajo. Se puede seleccionar el destino

de la carpeta de descarga y confirmar la operación.

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

43/45

En el archivo de anexo se presenta un ejemplo de la MIG para la DSD de turismo.

Guía de auto-aprendizaje en SDMX Libro del estudiante n. 4 - Definición de estructura de datos

44/45

6 Glosario

La tabla 12 presenta la lista de conceptos y acrónimos con sus definiciones.

Concepto Definición

COG Directrices Orientadas al Contenido (Content Oriented

Guidelines)

CS Transversal (Cross-Sectional)

DSD Definición de Estructura de Datos (Data Structure

Definition)

DSW Data Structure Wizard

ISO Organización Internacional para la Estandarización

(International Organisation for Standardisation)

MIG Guía de Implementación de Mensajes (Message

Implementation Guide)

MSD Definición de Estructura de Metadatos (Metadata Structure

Definition)

SDMX Intercambio de Datos y Metadatos Estadísticos (Statistical

Data and Metadata eXchange)

SDMX-IM Modelo de Información SDMX (SDMX Information

Model)

SDMX-ML Lenguaje de Marcas SDMX (SDMX Mark-up Language) -

Formato XML para el intercambio de datos y metadatos

estructurados en SDMX

TS Serie Temporal (Time Series)

URI Identificador de Recursos Unificados (Unified Resource

Identifier)

URN Nombre de Recursos Unificados (Unified Resource Name)

XML Lenguaje de Marcas Extensible (EXtensible Mark-up

Language)

Tabla 12 - Glosario