View
392
Download
3
Category
Preview:
Citation preview
CromoCat y GenoCat: dos bases de datos genéticas con estrategias diferentes
Joan Simon & Cèsar Blanché
Laboratorio de Botánica, Facultad de Farmacia, Universidad de Barcelona
Grupo de Biología de la Conservación BioC (GREB, IRBio)
C
CromoCat
Convención por la BiodiversidadConvención por la Biodiversidad
BIOC
La conservación de la biodiversidad exige que los países y sus gobiernos tomen decisiones que tienen importantes implicaciones sociales, políticas y económicas.
Se demanda acceso fácil y oportuno a información relevante en los tres niveles reconocidos:
● ecológica o de las comunidades biológicas, ● específica o diversidad sistemática ● genética o diversidad intraespecífica
(Sobre-)Abundancia de datos(Sobre-)Abundancia de datos
BIOC
La recopilación de la diversidad de los genes y de su distribución es
muy incipiente
Relativamente pocos y recientes sistemas almacenan datos a nivel genético
Procesamiento de datosProcesamiento de datos
BIOC
Informática de la biodiversidad(Biodiversity Informatics)centrado en los organismos individuales, poblaciones y taxones, y su interacción
Bioinformáticacentrado en la
biología molecular
Procesamiento de datos: resultadosProcesamiento de datos: resultados
BIOC
En general, a partir de datosdatos, se genera informacióninformación (datos interpretados),
conocimientoconocimiento (información sintetizada en forma de reglas y propiedades) y experienciaexperiencia
Antecedentes (inicio año 1999)Antecedentes (inicio año 1999)
• Atlas cromosómico PPCC
BIOC
• Recopilar variación cromosómica infraespecífica en los territorios de habla catalana
• Razas cromosómicas susceptibles de ser explotadas o que requieren ser conservadas
Características técnicasCaracterísticas técnicas
• Basado en les normas OPTIMA (Comission de OPTIMA Karyosystematics, 1993)
• Diseñado como un módulo independiente, vinculado y disponible a través BIOCAT (Base de Datos de Biodiversidad de Cataluña)
• Completa cobertura territorial (Cataluña, País Valenciano, Islas Baleares, Franja de Aragón, Andorra y Cataluña Norte)
BIOC
Características técnicasCaracterísticas técnicas
• Basado en Microsoft Access ® i implementado como una base de datos relacional
• Tesauro taxonómico según el criterio de Bolòs, Vigo, Masalles & Ninot, 2005 (Flora Manual dels Països Catalans. 3 ª ed., Pòrtic, Barcelona)
• Datos completos de estudios con material del territorio (CRO-IN) y resumidos de material exterior (CRO-OUT)
• Parcialmente financiado por el Gobierno Autónomo de Catalñya - Generalitat de Catalunya
BIOC
• Disponible a través de Internet en les referencias● http://biodiver.bio.ub.es/biocat/homepage.html● http://www.bib.ub.edu/cedocbiv/
CromoCat en la actualidadCromoCat en la actualidad
• 51.098 registros• 7.115 referencies bibliográficas • 4.235 taxones (el 86,8% de la flora vascular de los PPCC)
BIOC
Futura necesidad de investigación en citogenética de los PPCC: 747 taxones de los cuales no se dispone de ninguna información y que constituyen una prioridad para documentar los niveles de diversidad genética de la flora vascular, como base para su conservación
Mòdulo GenoCat (2006)Mòdulo GenoCat (2006)
• Agrupa los datos de diversidad genética molecular
• En la actualidad, GenoCat consta de 3.012 referencias, que cubren 1.325 taxones, el 26,3 % de la flora de los PPCC.
BIOC
GenoCat
Tareas básicas base de datosTareas básicas base de datos
BIOC
captura captura de datos de datos
transferencia transferencia informacióninformación
análisis e análisis e interpretación interpretación
VA
LID
AC
IÓN
RES
PO
NS
AB
LE
S
Evaluación de los usuarios
Problemática actualProblemática actual
• Disminución números cromosómicos
• Aumento exponencial datos genéticos
• Exceso de información dispersa
• Poca capacidad colaborativa
• Poco enfocado a la gestión documental
• Arquitectura rígida y cerrada
• Falta de acceso seguro a las fuentes primarias
BIOC
Limitación recursos económicos!
CromoCat/GenoCat: estrategiaCromoCat/GenoCat: estrategia
BIOC
CromoCat
Datos cromosómicos
BASE DE DATOS GESTOR DE DOCUMENTOS
Referencias bibliográficas(documentos a texto completo)
· CRO-IN· CRO-OUT
migración
Genocat: migraciónGenocat: migración
BIOC
GENOCAT v 1.0 (2006)Tablas de valores de C-DNA
GENOCAT v. 2.0 (2007)Tabla de Refworks
Ventajas: de la BD al GDVentajas: de la BD al GD
• Interoperabilidad en la gestión documental • Acceso fácil y seguro a las fuentes primarias • Integración herramientas colaborativas• Cloud Computing (bajo coste)
BIOC
(compartir colaborar y comunicar)
Gestor Documental: eficaciaGestor Documental: eficacia
• Modelo descentralizado• Multiplataforma • Automatización vía RSS • Colaborativo (RefShare)• Eficiencia via OpenURLOpenURL
BIOC
Proveedores BD bibliográficos
BIOC
SFX fue el primer protocolo en la resolución de enlaces OpenURLOpenURL
Arquitectura Arquitectura OpenURLOpenURL
• Arquitectura para crear aplicaciones que suministra unos datos u otros sobre una fuente de información determinada según desde qué entorno se le pidan.
• RefShare tiene la opción de incluir el Open URL de OCLC WorldCat ® en una carpeta compartida o una base de datos para tener acceso directo a artículos de texto completo y otros recursos en línea disponibles, si su organización participa en WorldCat
BIOC
Búsqueda informaciónBúsqueda información
BIOC
CROMOCAT (Género o especie + 21 palabras clave)
chromosomal chromosome cytogenetic cytogenetical cytogenetics cytological cytology cytotaxonomic cytotaxonomical cytotaxonomy cytotypes karyological karyomorphological karyosystematic karyotaxonomical karyotype karyotypes phylogenetic polyploidy aneuploid poliploid
GENOCAT (Género o especie + 29 palabras clave)
genetic molecular phylogenetic DNA rbcL 18s AFLP AFLPs RAPD PCR ITS ISSR SSR allozyme allozymes allozymic phylogenetic markers microsatellite isozyme gene population RFLP cpDNA sequence RNA DNA, phylogeography phylogeographic
Financiación con fondos públicosFinanciación con fondos públicos
BIOC
• Datos de libre acceso
• Restricciones de disponibilidad sólo contener información relacionada con especies en peligro de extinción, comprometer derechos de confidencialidad y privacidad, etc.
• El uso compartido y el acceso público a los datos favorece la optimización de los recursos invertidos
De la web social a la semánticaDe la web social a la semántica
BIOC
Web 2.0Web 2.0
Web 3.0Web 3.0
Futuro tecnológico CromoCatFuturo tecnológico CromoCat
BIOC
• Web 1.0 (estática)
• Web 2.0 (social)
• Web 3.0 (semántica)
CR
OM
OC
AT
/G
EN
OC
AT
Websemántica
MetadatosMetadatos
BIOC
Para compartir datos es imprescindible incorporar metadatos (información quedescribe el contenido, calidad, estructura y accesibilidad de una serie de datos concreta) y el correcto almacenamiento de los mismos junto a los datos
Barreras logísticas para compartir(herramientas y protocolos diferentes)
MetadatosMetadatos
BIOC
Conseguir la estandarización de los metadatos permite definir una terminología común y posibilita llevar a cabo la entrada, validación, acceso, integración y síntesis de los datos de manera automatizada
Estructura de serviciosEstructura de servicios
BIOC
Entrada de datos
(CENTRALIZACIÓN)
(DISPONIBILIDAD)
(CLOUD COMPUTING)
Biocat
Microsoft Access®
Agradecimientos: este trabajo es financiado por el DMAH de la Generalitat de Catalunya y es consultable en línea a través del Banco de Datos de Biodiversidad de Cataluña (http://biodiver.bio.ub.es/biocat/homepage.html)
CromoCat
Recommended