CromoCat y GenoCat: dos bases de datos genéticas con estrategias diferentes

Preview:

Citation preview

CromoCat y GenoCat: dos bases de datos genéticas con estrategias diferentes

Joan Simon & Cèsar Blanché

Laboratorio de Botánica, Facultad de Farmacia, Universidad de Barcelona

Grupo de Biología de la Conservación BioC (GREB, IRBio)

C

CromoCat

Convención por la BiodiversidadConvención por la Biodiversidad

BIOC

La conservación de la biodiversidad exige que los países y sus gobiernos tomen decisiones que tienen importantes implicaciones sociales, políticas y económicas.

Se demanda acceso fácil y oportuno a información relevante en los tres niveles reconocidos:

● ecológica o de las comunidades biológicas, ● específica o diversidad sistemática ● genética o diversidad intraespecífica

(Sobre-)Abundancia de datos(Sobre-)Abundancia de datos

BIOC

La recopilación de la diversidad de los genes y de su distribución es

muy incipiente

Relativamente pocos y recientes sistemas almacenan datos a nivel genético

Procesamiento de datosProcesamiento de datos

BIOC

Informática de la biodiversidad(Biodiversity Informatics)centrado en los organismos individuales, poblaciones y taxones, y su interacción

Bioinformáticacentrado en la

biología molecular

Procesamiento de datos: resultadosProcesamiento de datos: resultados

BIOC

En general, a partir de datosdatos, se genera informacióninformación (datos interpretados),

conocimientoconocimiento (información sintetizada en forma de reglas y propiedades) y experienciaexperiencia

Antecedentes (inicio año 1999)Antecedentes (inicio año 1999)

• Atlas cromosómico PPCC

BIOC

• Recopilar variación cromosómica infraespecífica en los territorios de habla catalana

• Razas cromosómicas susceptibles de ser explotadas o que requieren ser conservadas

Características técnicasCaracterísticas técnicas

• Basado en les normas OPTIMA (Comission de OPTIMA Karyosystematics, 1993)

• Diseñado como un módulo independiente, vinculado y disponible a través BIOCAT (Base de Datos de Biodiversidad de Cataluña)

• Completa cobertura territorial (Cataluña, País Valenciano, Islas Baleares, Franja de Aragón, Andorra y Cataluña Norte)

BIOC

Características técnicasCaracterísticas técnicas

• Basado en Microsoft Access ® i implementado como una base de datos relacional

• Tesauro taxonómico según el criterio de Bolòs, Vigo, Masalles & Ninot, 2005 (Flora Manual dels Països Catalans. 3 ª ed., Pòrtic, Barcelona)

• Datos completos de estudios con material del territorio (CRO-IN) y resumidos de material exterior (CRO-OUT)

• Parcialmente financiado por el Gobierno Autónomo de Catalñya - Generalitat de Catalunya

BIOC

• Disponible a través de Internet en les referencias● http://biodiver.bio.ub.es/biocat/homepage.html● http://www.bib.ub.edu/cedocbiv/

BIOC

Consulta BDBCConsulta BDBC

Diversidad genética BDBCDiversidad genética BDBC

BIOC

CromoCat en la actualidadCromoCat en la actualidad

• 51.098 registros• 7.115 referencies bibliográficas • 4.235 taxones (el 86,8% de la flora vascular de los PPCC)

BIOC

Futura necesidad de investigación en citogenética de los PPCC: 747 taxones de los cuales no se dispone de ninguna información y que constituyen una prioridad para documentar los niveles de diversidad genética de la flora vascular, como base para su conservación

Mòdulo GenoCat (2006)Mòdulo GenoCat (2006)

• Agrupa los datos de diversidad genética molecular

• En la actualidad, GenoCat consta de 3.012 referencias, que cubren 1.325 taxones, el 26,3 % de la flora de los PPCC.

BIOC

GenoCat

Recuentos totalesRecuentos totales

BIOC

Tareas básicas base de datosTareas básicas base de datos

BIOC

captura captura de datos de datos

transferencia transferencia informacióninformación

análisis e análisis e interpretación interpretación

VA

LID

AC

IÓN

RES

PO

NS

AB

LE

S

Evaluación de los usuarios

Problemática actualProblemática actual

• Disminución números cromosómicos

• Aumento exponencial datos genéticos

• Exceso de información dispersa

• Poca capacidad colaborativa

• Poco enfocado a la gestión documental

• Arquitectura rígida y cerrada

• Falta de acceso seguro a las fuentes primarias

BIOC

Limitación recursos económicos!

Fuentes: IPCN / Fuentes: IPCN / TropicosTropicos

BIOC

Bases de datos / EuropaBases de datos / Europa

BIOC

Específicas: DNA C-values

BIOC

Bases de datos especializadasBases de datos especializadas

BIOC

PubMed / GenBankPubMed / GenBank

BIOC

Genetical Flora DatabaseGenetical Flora Database

BIOC

CromoCat/GenoCat: estrategiaCromoCat/GenoCat: estrategia

BIOC

CromoCat

Datos cromosómicos

BASE DE DATOS GESTOR DE DOCUMENTOS

Referencias bibliográficas(documentos a texto completo)

· CRO-IN· CRO-OUT

migración

Genocat: migraciónGenocat: migración

BIOC

GENOCAT v 1.0 (2006)Tablas de valores de C-DNA

GENOCAT v. 2.0 (2007)Tabla de Refworks

Ventajas: de la BD al GDVentajas: de la BD al GD

• Interoperabilidad en la gestión documental • Acceso fácil y seguro a las fuentes primarias • Integración herramientas colaborativas• Cloud Computing (bajo coste)

BIOC

(compartir colaborar y comunicar)

Gestor Documental: eficaciaGestor Documental: eficacia

• Modelo descentralizado• Multiplataforma • Automatización vía RSS • Colaborativo (RefShare)• Eficiencia via OpenURLOpenURL

BIOC

Proveedores BD bibliográficos

BIOC

SFX fue el primer protocolo en la resolución de enlaces OpenURLOpenURL

Arquitectura Arquitectura OpenURLOpenURL

• Arquitectura para crear aplicaciones que suministra unos datos u otros sobre una fuente de información determinada según desde qué entorno se le pidan.

• RefShare tiene la opción de incluir el Open URL de OCLC WorldCat ® en una carpeta compartida o una base de datos para tener acceso directo a artículos de texto completo y otros recursos en línea disponibles, si su organización participa en WorldCat

BIOC

Búsqueda informaciónBúsqueda información

BIOC

CROMOCAT (Género o especie + 21 palabras clave)

chromosomal chromosome cytogenetic cytogenetical cytogenetics cytological cytology cytotaxonomic cytotaxonomical cytotaxonomy cytotypes karyological karyomorphological karyosystematic karyotaxonomical karyotype karyotypes phylogenetic polyploidy aneuploid poliploid

GENOCAT (Género o especie + 29 palabras clave)

genetic molecular phylogenetic DNA rbcL 18s AFLP AFLPs RAPD PCR ITS ISSR SSR allozyme allozymes allozymic phylogenetic markers microsatellite isozyme gene population RFLP cpDNA sequence RNA DNA, phylogeography phylogeographic

Algunas reflexionesAlgunas reflexiones

BIOC

Biological Flora / MonografíasBiological Flora / Monografías

BIOC

Herramientas colaborativasHerramientas colaborativas

BIOC

(REPOSITORIO)

(WIKI)

Financiación con fondos públicosFinanciación con fondos públicos

BIOC

• Datos de libre acceso

• Restricciones de disponibilidad sólo contener información relacionada con especies en peligro de extinción, comprometer derechos de confidencialidad y privacidad, etc.

• El uso compartido y el acceso público a los datos favorece la optimización de los recursos invertidos

De la web social a la semánticaDe la web social a la semántica

BIOC

Web 2.0Web 2.0

Web 3.0Web 3.0

Futuro tecnológico CromoCatFuturo tecnológico CromoCat

BIOC

• Web 1.0 (estática)

• Web 2.0 (social)

• Web 3.0 (semántica)

CR

OM

OC

AT

/G

EN

OC

AT

Websemántica

MetadatosMetadatos

BIOC

Para compartir datos es imprescindible incorporar metadatos (información quedescribe el contenido, calidad, estructura y accesibilidad de una serie de datos concreta) y el correcto almacenamiento de los mismos junto a los datos

Barreras logísticas para compartir(herramientas y protocolos diferentes)

MetadatosMetadatos

BIOC

Conseguir la estandarización de los metadatos permite definir una terminología común y posibilita llevar a cabo la entrada, validación, acceso, integración y síntesis de los datos de manera automatizada

Estructura de serviciosEstructura de servicios

BIOC

Entrada de datos

(CENTRALIZACIÓN)

(DISPONIBILIDAD)

(CLOUD COMPUTING)

Biocat

Microsoft Access®

Agradecimientos: este trabajo es financiado por el DMAH de la Generalitat de Catalunya y es consultable en línea a través del Banco de Datos de Biodiversidad de Cataluña (http://biodiver.bio.ub.es/biocat/homepage.html)

CromoCat