19
Requisitos técnicos de los proyectos de digitalización de patrimonio bibliográfico y de prensa histórica de la SGCB Madrid, 11 de marzo de 2016 Subdirección General de Coordinación Bibliotecaria

Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,

Requisitos técnicos de los proyectos de digitalización de patrimonio bibliográfico

y de prensa histórica de la SGCB

Madrid, 11 de marzo de 2016

Subdirección General de Coordinación Bibliotecaria

Page 2: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,

[MCD – S.G. Coordinación Bibliotecaria]

Requisitos técnicos de los proyectos de digitalización

2

Página

2/19

CONTROL DE CAMBIOS

Versión Fecha Resumen cambios

1.0

10-03-2015

Versión inicial

1.0.1 02-10-2015 Corrección menor en

p. 9

1.1 10-02-2016 Cambios en los

perfiles de metadatos

METS y en la entrega

de soportes

1.1.1 11-03-2016 Ampliación del cambio

anterior

1.1.2 11-05-2016 Correcciones menores

y añadir comentarios

en ejemplos del Anexo

1.1.3 21-06-2018 Correcciones menores

© Ministerio de Cultura y Deporte, 2016

El presente informe pertenece a la Subdirección General de Coordinación Bibliotecaria del Ministerio de Cultura y Deporte y está bajo una licencia de Creative Commons

Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional

(http://creativecommons.org/licenses/by-nc-sa/4.0/deed.es_ES) y por ello está permitido copiar, distribuir y comunicar públicamente esta obra bajo las condiciones siguientes: Reconocimiento — Debe reconocer los créditos de la obra de la manera especificada haciendo referencia expresa a la Subdirección General de Coordinación Bibliotecaria del

Ministerio de Cultura y Deporte y al identificador http://hdl.handle.net/10421/8981 en http://travesia.mcu.es. Dicho reconocimiento no podrá en ningún caso sugerir que el Ministerio de Cultura y Deporte presta apoyo a dicho tercero o apoya el uso que hace de su obra. No comercial — No puede utilizar esta obra para fines comerciales.

Compartir bajo la misma licencia — Si altera o transforma esta obra, o genera una obra derivada, sólo puede distribuir la obra generada bajo una licencia idéntica a ésta.

Page 3: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,

[MCD – S.G. Coordinación Bibliotecaria]

Requisitos técnicos de los proyectos de digitalización

3

Página

3/19

Contenido

Introducción .......................................................................................... 5

1. Digitalización de colecciones de patrimonio bibliográfico ........................ 7 1.1 Requisitos del proceso de digitalización ....................................... 7 1.2 Control de calidad y supervisión de los servicios ............................ 8 1.3 Metadatos ................................................................................ 8 1.4 Propiedad intelectual ............................................................... 10 1.5 Requisitos técnicos y de entrega de los soportes ......................... 11

2. Digitalización de Publicaciones Seriadas – Prensa Histórica .................. 13 2.1 Requisitos técnicos del proceso de digitalización .......................... 13 2.2 Control de calidad y supervisión de los servicios .......................... 14 2.3 Metadatos .............................................................................. 14 2.4 Propiedad intelectual ............................................................... 16 2.5 Requisitos técnicos y de entrega de soportes .............................. 16 2.6 OCR ...................................................................................... 17

3. Bibliografía .................................................................................... 17

4. Anexo I. Ejemplos de archivos METS y OCR para la Biblioteca Virtual del

Patrimonio Bibliográfico (monografías) y la Biblioteca Virtual de Prensa

Histórica ........................................................................................ 19

Page 4: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,
Page 5: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,

[MCD – S.G. Coordinación Bibliotecaria]

Requisitos técnicos de los proyectos de digitalización

5

Página

5/19

Introducción

La Dirección General del Bellas Artes y Bienes Culturales y de Archivos y

Bibliotecas del Ministerio de Cultura y Deporte ha llevado a cabo una estrategia de

digitalización y de promover la accesibilidad en línea del material cultural y la

preservación digital alineada con la Recomendación de la Comisión Europea,

publicada en el Diario Oficial de la Unión Europea de 24 de agosto de 2006, cuyo

objetivo es contribuir a la acción coordinada de los estados miembro en estos

ámbitos y en la que se insta a dichos estados a que refuercen las estrategias y los

objetivos nacionales para la digitalización y la conservación digital, contribuyan a

Europeana —punto común multilingüe de acceso al patrimonio cultural europeo—

, mejoren las condiciones marco para la digitalización y la accesibilidad en línea,

refuercen la coordinación dentro de los estados miembros y contribuyan a una

visión global efectiva de los progresos a nivel europeo.

Dentro de esta estrategia la Dirección General ha puesto en marcha, con cargo a

sus presupuestos, distintos proyectos de digitalización de carácter cooperativo en

los que participan tanto las distintas administraciones públicas como instituciones

y fundaciones privadas. Entre estos proyectos se encuentran:

La Biblioteca Virtual de Prensa Histórica http://prensahistorica.mcu.es

La Biblioteca Virtual del Patrimonio Bibliográfico http://bvpb.mcu.es

Hispana, Directorio y recolector de proyectos de digitalización y agregador

de contenidos de Europeana.

Por otro lado ha promovido la creación de bibliotecas digitales de instituciones

públicas y privadas conforme a la normativa de Europeana mediante las

convocatorias anuales de ayudas a proyectos de digitalización. Uno de los

requisitos de obligado cumplimiento de estas ayudas es que todo lo que se

digitalice con cargo a las ayudas de la Dirección General tiene que ser accesible a

través de Europeana.

El presente documento detalla los perfiles técnicos de los proyectos de

digitalización que la SGCB promueve o desarrolla. Estos perfiles concretan, dentro

de los márgenes de las normas técnicas, aquellos aspectos que requieren ser

definidos con más concreción.

Page 6: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,
Page 7: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,

[MCD – S.G. Coordinación Bibliotecaria]

Requisitos técnicos de los proyectos de digitalización

7

Página

7/19

1. Digitalización de colecciones de patrimonio bibliográfico

1.1 Requisitos del proceso de digitalización

La empresa o servicio de digitalización se encargará de poner los medios técnicos

e informáticos y el material necesario para la realización de dichos servicios

(escáneres, ordenadores, programas de digitalización, posible instalación de una

red local, discos duros USB, etc.), así como de su transporte e instalación en los

diferentes centros donde se desarrolle el servicio.

El centro directivo responsable del proyecto de digitalización establecerá los

controles necesarios para que los espacios destinados a la digitalización cumplan

las condiciones de seguridad y estén dotados de los medios que garanticen que el

material bibliográfico no sufra ningún desperfecto durante el proceso de

digitalización.

Las empresas o servicios de digitalización, como norma general y cuando sea

posible, deberán utilizar escáneres aéreos, evitando una excesiva manipulación o

el empleo de prensalibros en la medida de lo posible.

En ningún caso los ejemplares podrán ser desencuadernados o guillotinados y se

deberá asegurar la correcta manipulación de los mismos.

Se realice la captura a doble página o a página simple, se entregarán imágenes de

páginas simples, no imágenes con dobles páginas.

En caso de que se incorporen marcas de agua, serán de pequeño tamaño y no se

superpondrán al contenido del documento.

Las páginas que se digitalicen junto a cartas de color, habrán de digitalizarse dos

veces, utilizándose para la carga en las bibliotecas digitales y la visualización la

imagen sin carta de color.

Se evitarán o recortarán los bordes negros de las imágenes. Las imágenes deben

incluir todo el documento y entregarse sin bordes negros o con bordes negros de

tres milímetros como máximo.

La digitalización de los documentos impresos y manuscritos, así como la del resto

de materiales monográficos (fotografías, postales, carteles, planos, grabados,

mapas, música impresa, etc.) se realizará en color o escala de grises según las

Page 8: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,

[MCD – S.G. Coordinación Bibliotecaria]

Requisitos técnicos de los proyectos de digitalización

8

Página

8/19

características del documento original, ya sea en su totalidad o en algunas de sus

partes. En todo caso, los originales en color serán digitalizados en color.

Como mínimo se generará una copia de las obras digitalizadas en formato TIFF y

otra en formato JPEG como formatos de máxima calidad y formato comprimido y

optimizado para su lectura en internet, respectivamente.

Las copias de preservación (TIFF) serán digitalizadas con una resolución mínima de

400 ppi y en una escala de 256 gamas de grises (8 bits) o de 16,7 millones de

colores (24 bits).

La copia de difusión (JPEG) tendrá una resolución mínima de 200 a 300 ppi y la

misma profundidad de color que la copia de preservación.

1.2 Control de calidad y supervisión de los servicios

El centro directivo responsable del proyecto se reservará el derecho de inspección

y revisión del desarrollo y ejecución de los servicios objeto del contrato.

Durante la ejecución de los trabajos de digitalización, la empresa o servicio de

digitalización se comprometerá, en todo momento, a facilitar a las personas

designadas por el centro directivo que gestione el proyecto, la información y

documentación que éstas soliciten para disponer de un pleno conocimiento de las

circunstancias en que se desarrollan los trabajos, así como de los eventuales

problemas que puedan plantearse y de las tecnologías, métodos y herramientas

utilizados para resolverlos. En particular deberán comunicarse las incidencias que

puedan producirse a lo largo del proceso de digitalización, tales como falta de texto,

páginas deterioradas, ilegibilidad del original, errores de numeración, etc., de

manera que el centro directivo responsable del proyecto de digitalización pueda

indicar a la empresa o servicio de digitalización los procedimientos que se deben

llevar a cabo para gestionar estas incidencias.

Tanto por parte de la empresa digitalizadora, como por parte del centro directivo

responsable del proyecto, ha de realizarse un seguimiento del trabajo durante la

ejecución del mismo. La empresa o servicio de digitalización habrá de subsanar lo

más rápidamente posible los errores detectados con este control de calidad.

La empresa o servicio de digitalización deberá garantizar el correcto funcionamiento

de los trabajos realizados durante el plazo de un año a contar desde la fecha de

finalización del servicio, obligándose a realizar gratuitamente durante dicho tiempo

las correcciones y modificaciones necesarias para subsanar los errores que

eventualmente pudieran descubrirse.

1.3 Metadatos

Se emplearán metadatos MARC21 para describir las obras y archivos METS para

describir y/o cargar los objetos digitales.

En cuanto a los archivos MARC21, se utilizará la información bibliográfica y de

fondos del Catálogo Colectivo del Patrimonio Bibliográfico

(http://ccpb_opac.mcu.es/cgi-brs/CCPB/abnetopac ) si ésta existiera.

En principio, y salvo que se acordara previamente otra cosa, el centro directivo

Page 9: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,

[MCD – S.G. Coordinación Bibliotecaria]

Requisitos técnicos de los proyectos de digitalización

9

Página

9/19

responsable del proyecto de digitalización es el encargado de proporcionar a la

empresa o servicio de digitalización los registros MAR21 bibliográficos y la

información de fondos de las obras que se van a digitalizar. La empresa o servicio

de digitalización utilizará estos registros para embeberlos en los registros METS,

teniendo buen cuidado en hacer coincidir los números de control, códigos de

biblioteca y signaturas de los registros MARC21 y de los METS.

Las Bibliotecas Virtuales de la S.G.C.B. trabajan con MARC21 bibliográfico, de

fondos y de autoridades. También se enriquecen los registros bibliográficos

incluyendo los campos MARC21/RDA 264, 336, 337 y 338.

Para los proyectos subvencionados por la S.G.C.B. es obligatoria la utilización del

formato MARC21 bibliográfico para describir las obras. Además es recomendable la

utilización de registros de fondos y de autoridad en MARC21 y su enriquecimiento

según lo indicado en el párrafo anterior. En todo caso, si no se utilizan registros de

fondos, es necesario incluir la información de fondos en campos 85X del formato

MARC21 bibliográfico. En concreto habría que utilizar el campo 852 con el código

de institución (en el subcampo $a) y la signatura (en el subcampo $j).

En cuanto a los registros METS, salvo que se acuerde previamente otra cosa, será

la empresa o servicio de digitalización la encargada de generar y entregar para

cada monografía (obra impresa, manuscrito, material fotográfico, partituras,

mapas, etc.) un archivo METS de carga y otro para preservación. Estos METS

deberán ceñirse al Perfil METS de la Biblioteca Virtual del Patrimonio bibliográfico,

al que se puede acceder en la siguiente dirección:

http://www.loc.gov/standards/mets/mets-registered-profiles.html

Este perfil está orientado a la creación de METS que sirvan para representar,

preservar e ingestar los objetos digitales que se archivan y ofrecen al público en la

Biblioteca Virtual de Patrimonio Bibliográfico del Ministerio de Cultura y Deporte.

También puede ser utilizado para ingestar objetos digitales y/o metadatos en otras

bibliotecas digitales y bases de datos y, en general, para registrar, trasmitir y

almacenar metadatos y objetos digitales.

En particular los METS para carga de monografías deben respetar las siguientes

especificaciones:

• Los METS deben incluir direcciones correctas a los namespaces y a los

schemas utilizados, y deben estar bien formados y ser válidos.

• Deben incluir una sección de metadatos descriptivos (dmdSec) que embeba

el registro bibliográfico en formato MARC21XML y, a continuación, el registro

de fondos en formato MARC21XML de fondos. En los proyectos subvencionados

se podrá sustituir el registro MARC21XML de fondos por información de fondos

en el campo 852 del registro bibliográfico.

• Deben incluir una sección de metadatos descriptivos (dmdSec) en la que se

relacione la imagen que va servir como icono representativo de la obra

(normalmente una portada o ilustración).

• En el caso de los contratos de digitalización de la S.G.C.B, los METS deben

incluir una sección de archivo (fileSec), que en un único fileGrp agrupe

elementos file para cada imagen JPG de las que conforman la obra. Además,

en etiquetas FLocat para cada elemento file se incluirán la direcciones a las

imágenes correspondientes. Las direcciones de los METS apuntarán a las

imágenes de difusión que se encuentran en los mismos discos duros que estos

Page 10: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,

[MCD – S.G. Coordinación Bibliotecaria]

Requisitos técnicos de los proyectos de digitalización

10

Página

10/19

METS (véase apartado 1.5). En el caso de las subvenciones para digitalización

otorgadas por la S.G.C.B. la sección de archivo podrá incluir direcciones bien a

versiones en JPG o PDF de las obras digitalizadas.

• Se incluirá una sección de mapa estructural (strucMap) con atributo

TYPE=”PHYSICAL”. Si la sección de archivo correspondiente (fileSec) hace

referencia a una versión en formato JPG de la obra, este mapa estructural

(strucMap) debe incluir la información de paginación.

En cuanto a los archivos METS para preservación de monografías deberán ceñirse

a las siguientes especificaciones:

• Incluirán los metadatos que se precisan para la preservación de la copia

digital. Estos metadatos se obtendrán del Diccionario de Datos de PREMIS, en

su versión vigente a la firma del contrato.

• Asimismo, se incluirá en el METS información sobre derechos de propiedad

intelectual según el esquema METSRigths en el que se detallarán las

características de derecho de uso de las publicaciones según determine el

Ministerio de Cultura y Deporte a través de la Subdirección General de

Coordinación Bibliotecaria.

• Se incluirá una sección de archivo (fileSec) con enlaces a las imágenes de

preservación.

Los METS de carga y preservación para monografías podrán fusionarse en una única

versión.

Una vez terminado el servicio de digitalización la empresa o servicio de

digitalización deberá entregar los archivos MARC21 y los METS de las obras

digitalizadas a la institución responsable del proyecto.

1.4 Propiedad intelectual

Como norma general, en el marco de los proyectos de digitalización gestionados o

subvencionados por la Subdirección General de Coordinación Bibliotecaria, sólo se

digitalizarán obras que estén en el dominio público o cuyos derechos pertenezcan

a la institución responsable del proyecto de digitalización. Como excepción a esta

norma, podrán digitalizarse obras sujetas a derechos de la propiedad intelectual

cuando se hayan cedido previamente los derechos de reproducción y comunicación

pública, por medio de un convenio o acuerdo, a la institución responsable del

proyecto de digitalización.

El titular de los derechos de propiedad intelectual de las imágenes resultantes del

servicio de digitalización será la institución encargada del proyecto de digitalización,

no pudiéndose reproducir las mismas sin el permiso previo de dicha institución.

Como excepción a lo indicado en el párrafo anterior, en el caso de los proyectos de

digitalización subvencionados por la Subdirección General de Coordinación

Bibliotecaria, dicha Subdirección será la única propietaria de la copia que la entidad

subvencionada ha de entregarle (véase apartado 1.5), entendiéndose cedidos los

Page 11: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,

[MCD – S.G. Coordinación Bibliotecaria]

Requisitos técnicos de los proyectos de digitalización

11

Página

11/19

derechos de reproducción y comunicación pública para esta copia, para su carga en

la Biblioteca Virtual del Patrimonio Bibliográfico o en la Biblioteca Virtual de Prensa

Histórica, según corresponda. Las instituciones responsables de estos proyectos

deberán tener en cuenta este requisito en caso de que lleguen a acuerdos o firmen

convenios de cesión de derechos de terceros.

De acuerdo con las recomendaciones de la Comisión Europea, los materiales que

se encuentren en el dominio público se mantendrán en el dominio público después

de su digitalización.

Los metadatos resultantes de la digitalización se licenciarán bajo CC0 1.0, y serán

reutilizables sin restricción, incluidos los fines comerciales tal como se especifica en

el Acuerdo de intercambio de datos con Europeana publicado el 1 de julio de 2012.

La empresa o servicio de digitalización se comprometerá a garantizar la

confidencialidad de los datos recibidos en el marco del servicio de digitalización y a

no hacer ningún uso de los mismos fuera de lo establecido en acuerdo o contrato

previo, siendo responsable de las consecuencias que se deriven del incumplimiento

de este apartado. Así mismo no podrá hacer ningún uso de los registros e imágenes

generados mediante el servicio de digitalización ni de los registros o imágenes que

le puedan ser entregados para la realización de dicho servicio por la institución

conservadora de los fondos a digitalizar o el centro directivo que gestione el

proyecto.

1.5 Requisitos técnicos y de entrega de los soportes

Como mínimo la empresa o servicio de digitalización generará y entregará a la

entidad responsable del proyecto una copia de las obras digitalizadas en formato

TIFF 6.0/ISO 12639:2004 y otra en formato JPEG/ISO/IEC 10918:1994, como

formatos de máxima calidad y formato comprimido y optimizado para su lectura en

internet, respectivamente. Se recomienda entregar al menos dos copias de las

imágenes de preservación (TIFF).

En los contratos de digitalización de la Subdirección General de Coordinación

Bibliotecaria se exigirá la entrega de tres copias de los contenidos digitalizados:

● Copia 1.

Se entregará en discos duros USB 3.0 nuevos que contengan:

-Imágenes de preservación en formato TIFF sin marca de agua.

-Las correspondientes imágenes de difusión en formato JPEG con marca de

agua. La marca de agua consistirá en las siglas del Ministerio de cultura y

Deporte seguidas del año de digitalización, por ejemplo: “M.C.D. 2018”.

-Los correspondientes archivos de reconocimiento óptico de caracteres XML-

ALTO.

-Los correspondientes registros MARC21 bibliográficos y de fondos.

-METS de carga para las imágenes de difusión.

-METS de preservación para las imágenes de preservación.

● Copia 2.

Copia con los mismos contenidos que la anterior.

Page 12: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,

[MCD – S.G. Coordinación Bibliotecaria]

Requisitos técnicos de los proyectos de digitalización

12

Página

12/19

● Copia 3: copia para las instituciones.

Se entregará a la S.G. C.B. una copia, en discos duros nuevos USB 3.0, de los

contenidos del contrato separados por institución. Cada uno de los discos que

conforma esta copia contendrá exclusivamente los objetos digitales y

metadatos de una institución. Dichos contenidos incluirán:

-Imágenes de preservación en formato TIFF, sin marca de agua.

-Las correspondientes imágenes de difusión en formato JPEG, sin marca de

agua.

-Los correspondientes archivos de reconocimiento óptico de caracteres XML-

ALTO.

-Los correspondientes registros MARC21 bibliográficos y de fondos.

-METS de carga para las imágenes de difusión.

-METS de preservación para las imágenes de preservación.

Los ficheros con las obras digitalizadas se estructurarán en un directorio formado

por un primer nivel correspondiente a la institución cuyos fondos se hayan

digitalizado y un segundo nivel con el título, la signatura o el número de control del

registro bibliográfico de cada obra digitalizada. En el caso de que el mismo disco

contuviera varios formatos, el segundo nivel sería el formato y el tercero el

correspondiente al título.

Los metadatos se incluirán en carpetas independientes, una para cada formato

(METS, MARC21 bibliográfico, MARC21 de fondos, MARC21 de autoridades...).

Dentro de cada disco, todos los archivos METS correspondientes a los fondos de

una biblioteca se incluirán en una misma carpeta. Igualmente, dentro de cada disco,

los archivos MARC21 correspondientes a los fondos de una misma biblioteca se

incluirán en una misma carpeta.

Page 13: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,

[MCD – S.G. Coordinación Bibliotecaria]

Requisitos técnicos de los proyectos de digitalización

13

Página

13/19

2. Digitalización de Publicaciones Seriadas – Prensa Histórica

2.1 Requisitos técnicos del proceso de digitalización

La empresa o servicio de digitalización se encargará de poner los medios técnicos

e informáticos y el material necesario para la realización de dichos servicios

(escáneres, ordenadores, programas de digitalización, posible instalación de una

red local, discos duros USB, etc.), así como de su transporte e instalación en los

diferentes centros donde se desarrolle el servicio.

El centro directivo responsable del proyecto de digitalización establecerá los

controles necesarios para que los espacios destinados a la digitalización cumplan

las condiciones de seguridad y estén dotados de los medios que garanticen que el

material bibliográfico no sufra ningún desperfecto durante el proceso de

digitalización.

Las empresas o servicios de digitalización, como norma general y cuando sea

posible, deberán utilizar escáneres aéreos, evitando una excesiva manipulación o

el empleo de prensalibros en la medida de lo posible.

En ningún caso los ejemplares podrán ser desencuadernados o guillotinados y se

deberá asegurar la correcta manipulación de los mismos.

Se realice la captura a doble página o a página simple, se entregarán imágenes de

páginas simples, no imágenes con dobles páginas.

En caso de que se incorporen marcas de agua, serán de pequeño tamaño y no se

superpondrán al contenido del documento.

Las páginas que se digitalicen junto a cartas de color, habrán de digitalizarse dos

veces, utilizándose para la carga en las bibliotecas digitales y la visualización la

imagen sin carta de color.

Se evitarán o recortarán los bordes negros de las imágenes. Las imágenes deben

incluir todo el documento y entregarse sin bordes negros o con bordes negros de

tres milímetros como máximo.

La digitalización de las publicaciones seriadas se realizará en escala de grises si la

publicación original es monocromática como suele ser el caso de la prensa. En todo

caso, los originales en color serán digitalizados en color. Si la publicación contiene

páginas en color y otras en blanco y negro, se digitalizarán en color las páginas en

color y en escala de grises las páginas en blanco y negro.

Como mínimo se generará una copia de las obras digitalizadas en formato TIFF y

otra en formato JPEG, como formatos de máxima calidad y formato comprimido y

optimizado para su lectura en internet, respectivamente.

Las copias de preservación (TIFF) serán digitalizadas con una resolución mínima de

400 ppi y en una escala de 256 gamas de grises (8 bits) o de 16,7 millones de

colores (24 bits).

La copia de difusión (JPGE) tendrá una resolución mínima de 200 a 300 ppi y la

Page 14: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,

[MCD – S.G. Coordinación Bibliotecaria]

Requisitos técnicos de los proyectos de digitalización

14

Página

14/19

misma profundidad de color que la copia de preservación.

2.2 Control de calidad y supervisión de los servicios

Véase el apartado 1.2.

2.3 Metadatos

En el marco de los proyectos y ayudas de digitalización de la Subdirección General

de Coordinación Bibliotecaria se emplearán metadatos MARC21 para describir las

seriadas y archivos METS con metadatos descriptivos MODS para describir y/o

cargar los objetos digitales correspondientes a dichas publicaciones seriadas.

En cuanto a los archivos MARC21, se utilizará la información bibliográfica y de

fondos del Catálogo Colectivo del Patrimonio Bibliográfico si ésta existiera.

En principio, y salvo que se acordara previamente otra cosa, el centro directivo

responsable del proyecto de digitalización es el encargado de proporcionar a la

empresa o servicio de digitalización los registros MAR21 bibliográficos y la

información de fondos de las obras que se van a digitalizar. La empresa o servicio

de digitalización deberá generar registros METS, siguiendo las especificaciones

indicadas más adelante, teniendo buen cuidado de hacer coincidir los números de

control, códigos de biblioteca y signaturas de los registros MARC21 y de los METS.

Las Bibliotecas Virtuales de la S.G.C.B. trabajan con MARC21 bibliográfico, de

fondos y de autoridades. En los pliegos de los contratos de digitalización de esta

Subdirección se exigirá la utilización de estos tres formatos para describir y

clasificar las obras a digitalizar. También se enriquecen los registros bibliográficos

incluyendo los campos MARC21/RDA 264, 336, 337 y 338, y los registros de fondos

incluyendo los campos MARC21/RDA 337 y 338 y los campos 853 y 866 (según ISO

10324:1997/Z39.71:2006) con la información de periodicidad, numeración y

fondos existentes. Se utilizan además registros de materias vinculados con los

correspondientes términos de la Lista de Encabezamientos de Materia para

Bibliotecas Públicas convertida a SKOS (Simple Knowledge Organization System)

que se encuentra en https://id.sgcb.mcu.es poniendo el identificador (URI) del

registro en SKOS en el campo 024 del registro MARC21 de autoridades.

Para los proyectos subvencionados por esta Subdirección es obligatoria la utilización

del formato MARC21 bibliográfico para describir las obras. Además es recomendable

la utilización de registros de fondos y de autoridad en MARC21, y su enriquecimiento

según lo indicado en el párrafo anterior. En todo caso, si no se utilizan registros de

fondos, es necesario incluir la información de fondos en campos 85X del formato

MARC21 bibliográfico. En concreto habría que utilizar el campo 852 con el código

de institución (en el subcampo $a) y la signatura (en el subcampo $j).

En cuanto a los registros METS, salvo que se acuerde previamente otra cosa, será

la empresa o servicio de digitalización la encargada de generar y entregar para

cada número de publicación seriada un archivo METS de carga y otro para

Page 15: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,

[MCD – S.G. Coordinación Bibliotecaria]

Requisitos técnicos de los proyectos de digitalización

15

Página

15/19

preservación. Estos METS deberán ceñirse al Perfil METS Profile for historical

newspapers, al que se puede acceder en la siguiente dirección:

http://www.loc.gov/standards/mets/test/ndnp/00000010.html

El archivo METS para carga de publicaciones periódicas deberá ceñirse a las

siguientes especificaciones:

• Los METS deben incluir direcciones correctas a los namespaces y a los

schemas utilizados, y deben estar bien formados y ser válidos.

• Deben incluir una sección de metadatos descriptivos (dmdSec) que embeba

el registro bibliográfico en formato MODS, con información normalizada de

numeración y cronología según se indica en el ejemplo que se encuentra en el

apartado 3 del Anexo I de este documento.

• En el caso de los contratos de digitalización de la S.G.C.B, los METS deben

incluir una sección de archivo (fileSec), que en un único fileGrp agrupe

elementos file para cada imagen JPG de las que conforman la obra. Además,

en etiquetas FLocat para cada elemento file se incluirán la direcciones a las

imágenes correspondientes. Las direcciones de los METS apuntarán a las

imágenes de difusión que se encuentran en los mismos discos duros que estos

METS. En el caso de las subvenciones para digitalización otorgadas por la

S.G.C.B. la sección de archivo podrá incluir direcciones bien a versiones en JPG

o PDF de las obras digitalizadas.

• Se incluirá una sección de mapa estructural (strucMap) con atributo

TYPE=”LOGICAL”. Si la sección de archivo correspondiente (fileSec) hace

referencia a una versión en formato JPG de la obra, este mapa estructural

(strucMap) debe incluir la información de paginación.

En cuanto a los archivos METS para preservación de publicaciones seriadas deberán

ceñirse a las siguientes especificaciones:

• Incluirán los metadatos que se precisan para la preservación de la copia

digital. Estos metadatos se obtendrán del Diccionario de Datos de PREMIS, en

su versión vigente a la firma del contrato.

• Asimismo, se incluirá en el METS información sobre derechos de propiedad

intelectual según el esquema METSRigths en el que se detallarán las

características de derecho de uso de las publicaciones según determine el

Ministerio de Cultura y Deporte a través de la Subdirección General de

Coordinación Bibliotecaria.

• Se incluirá una sección de archivo (fileSec) con enlaces a las imágenes de

preservación.

Los METS de carga y preservación para publicaciones seriadas podrán fusionarse

en una única versión.

Una vez terminado el servicio de digitalización la empresa o servicio de

digitalización deberá entregar los archivos MARC21 y los METS de las obras

digitalizadas a la institución responsable del proyecto.

Page 16: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,

[MCD – S.G. Coordinación Bibliotecaria]

Requisitos técnicos de los proyectos de digitalización

16

Página

16/19

2.4 Propiedad intelectual

Véase el apartado 1.4.

2.5 Requisitos técnicos y de entrega de soportes

Como mínimo la empresa o servicio de digitalización generará y entregará a la

entidad responsable del proyecto una copia de las obras digitalizadas en formato

TIFF 6.0/ISO 12639:2004 y otra en formato JPEG/ISO/IEC 10918:1994, como

formatos de máxima calidad y formato comprimido y optimizado para su lectura en

internet, respectivamente. Se recomienda entregar al menos dos copias de las

imágenes de preservación (TIFF).

En los contratos de digitalización de la Subdirección General de Coordinación

Bibliotecaria se exigirá la entrega de tres copias de los contenidos digitalizados:

● Copia 1.

Se entregará en discos duros USB 3.0 nuevos que contengan:

-Imágenes de preservación en formato TIFF sin marca de agua.

-Las correspondientes imágenes de difusión en formato JPEG con marca de

agua. La marca de agua consistirá en las siglas del Ministerio de cultura y

Deporte seguidas del año de digitalización, por ejemplo: “M.C.D. 2018”.

-Los correspondientes archivos de reconocimiento óptico de caracteres XML-

ALTO.

-Los correspondientes registros MARC21 bibliográficos y de fondos.

-METS de carga para las imágenes de difusión.

-METS de preservación para las imágenes de preservación.

● Copia 2.

Copia con los mismos contenidos que la anterior.

● Copia 3: copia para las instituciones.

Se entregará a la S.G. C.B. una copia, en discos duros nuevos USB 3.0, de los

contenidos del contrato separados por institución. Cada uno de los discos que

conforma esta copia contendrá exclusivamente los objetos digitales y

metadatos de una institución. Dichos contenidos incluirán:

-Imágenes de preservación en formato TIFF, sin marca de agua.

-Las correspondientes imágenes de difusión en formato JPEG, sin marca de

agua.

-Los correspondientes archivos de reconocimiento óptico de caracteres XML-

ALTO.

-Los correspondientes registros MARC21 bibliográficos y de fondos.

-METS de carga para las imágenes de difusión.

-METS de preservación para las imágenes de preservación.

Los ficheros con las obras digitalizadas se estructurarán en un directorio formado

por un primer nivel correspondiente a la institución cuyos fondos se hayan

digitalizado y un segundo nivel con el título, la signatura o el número de control del

registro bibliográfico de cada obra digitalizada y un tercer nivel correspondiente al

año. Podrán incluirse niveles adicionales (meses, días) si se considera necesario.

En el caso de que el mismo disco contuviera varios formatos, el segundo nivel sería

el formato, el tercero el título y el cuarto el año.

Page 17: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,

[MCD – S.G. Coordinación Bibliotecaria]

Requisitos técnicos de los proyectos de digitalización

17

Página

17/19

Los metadatos se incluirán en carpetas independientes, una para cada formato

(METS, MARC21 bibliográfico, MARC21 de fondos, MARC21 de autoridades...).

Dentro de cada disco, todos los archivos METS correspondientes a los fondos de

una biblioteca se incluirán en un mismo directorio. Igualmente, dentro de cada

disco, los archivos MARC21 correspondientes a los fondos de una misma biblioteca

se incluirán en un mismo directorio.

2.6 OCR

En los contratos de digitalización de la Subdirección General de Coordinación

Bibliotecaria se exigirá procesado de OCR (Optical Character Recognition) para

todas las páginas digitalizadas con contenido textual, sean de manuscritos,

impresos o publicaciones seriadas; la empresa o servicio de digitalización deberá

entregar un archivo OCR en formato ALTO (Analized Layout and Text Object) por

cada página digitalizada. Estos archivos OCR hacen posible la búsqueda en el texto

de dichas páginas en las bibliotecas virtuales de la Subdirección General de

Coordinación bibliotecaria.

Para los proyectos subvencionados por esta Subdirección se recomienda la

utilización de procesado OCR y programas de gestión de repositorios o bibliotecas

digitales que permitan la búsqueda en el texto. Esta funcionalidad resulta muy útil

y suele ser muy bien valorada por los usuarios.

3. Bibliografía

Unión Europea. Commission’s Recommendation of 27 October 2011 on the digitisation and online accessibility of cultural material and digital preservation (2011/711/EU) [Documento en línea]. Journal of the European Union. L 283/39 (29/10/2011). http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=OJ:L:2011:283:0039:0045:EN:PDF [Consulta: 10-03-2015]. ISSN 1977-0677 IFLA / Guidelines for Plannnig the Digitalization of Rare book and Manuscript Collections [Documento en línea]. IFLA, 2014. http://www.ifla.org/publications/node/8968 [Consulta: 11-03-2015]. IFLA e ICA / Directrices para proyectos de digitalización de colecciones y fondos de dominio público, en particular para aquellos custodiados en bibliotecas y archivos. [Documento en línea]. Madrid : Ministerio de Cultura. Secretaría General Técnica, 2002. http://www.ifla.org/publications/guidelines-for-digitization-

Page 18: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,

[MCD – S.G. Coordinación Bibliotecaria]

Requisitos técnicos de los proyectos de digitalización

18

Página

18/19

projects-for-collections-and-holdings-in-the-public-domain [Consulta: 11-03-2015]. ISBN 84-8181-274-4 Library of Congress. MARC 21 Format for Bibliographic Data [Página web]. Library of Congress, October 2014. http://www.loc.gov/marc/bibliographic/ [Consulta: 11-03-2015] Library of Congress. MARC 21 Format for Holdings Data [Página web]. Library of Congress, October 2014. http://www.loc.gov/marc/holdings/ [Consulta: 11-03-2015] Library of Congress. MARC 21 Format for Authority Data [Página web]. Library of Congress, October 2014. http://www.loc.gov/marc/authority/ [Consulta: 11-03-2015] Library of Congress. Metadata Encoding & Transmission Standard (METS) [Página web]. http://www.loc.gov/standards/mets/ [Consulta: 11-03-2015] W3C. SKOS Simple Knowledge Organization System. [Página web]. http://www.w3.org/2004/02/skos/ [Consulta: 11-03-2015]

Library of Congress. Metadata Object Description Schema (MODS) [Página web].

http://www.loc.gov/standards/mods/ [Consulta: 11-03-2015]

METAe project group, Library of Congress. Analyzed Layout and Text Object (ALTO) [Página web]. http://www.loc.gov/standards/alto/ [Consulta: 11-03-2015]

Page 19: Requisitos técnicos de los proyectos de digitalizacióntravesia.mcu.es/portalnb/jspui/bitstream/10421/8981/12... · 2019. 2. 15. · de materiales monográficos (fotografías, postales,

[MCD – S.G. Coordinación Bibliotecaria]

Requisitos técnicos de los proyectos de digitalización

19

Página

19/19

4. Anexo I. Ejemplos de archivos METS y OCR para la Biblioteca Virtual del Patrimonio Bibliográfico (monografías) y la Biblioteca Virtual de Prensa Histórica

Anexo I disponible en:

http://travesia.mcu.es/portalnb/jspui/handle/10421/8981