Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
Marzo 2020AmeliCA / Redalyc
Autores: Arianna Becerril-García, Eduardo Aguado-López. Desarrolladores de Software: Alma Rosa Segundo Escobar, Paulo César Ylloldi Costilla, Luis Angel Ángeles Pineda. Diseño: Priscila Dávila Morales. Ingeniería de Datos: Liliana González Morales, Alma Rosa Segundo Escobar. Ingeniería Ontológica: Arianna Becerril García. Investigación: Cuerpo Académico Consolidado “Comunicación y Difusión de la Ciencia SEP UAEM/77, Facultad de Ciencias Políticas y Sociales, Universidad Autónoma del Estado de México
BASE DE CONOCIMIENTOEN EPIDEMIAS/PANDEMIAS DE REVISTASEN AMELICA/REDALYChttp://amelica.org/epidemics
CONTEXTOAnte una contingencia mundial de salud, se refrenda la vital función del Acceso Abierto:
llevar el conocimiento a todos los rincones del mundo, permitir que la ciencia sea
accesible rápida y oportunamente para que su contribución se refleje en la mejora de
la calidad de vida humana, en salvar vidas y en el desarrollo de una mejor sociedad
para todos. Iniciativas de Acceso Abierto como Redalyc UAEM desde hace 18 años
trabajancon ese objetivo. Hoy, la alianza con AmeliCA/Redalyc refrenda su compromiso
con el Acceso Abierto y sigue desarrollando tecnología la cual aplica ahora a la diseminación semántica de los artículos publicados
en temáticas de interés en epidemiología, pandemias y temas relacionados. Ello permitirá difundir y poner a disposición más de 6
mil artículos en formato de Linked Open Data (LOD) para que sean procesados e interconectados en la nube del conocimiento LOD y
ofrecer al usuario lector servicios de navegación y descubrimiento temático para la consulta de los textos completos de este conjunto
de datos.
DESCRIPCIÓNEsta masa de información que constituye la Web, en ocasiones se siente como “de una milla de ancho pero con una pulgada de profundidad”
¿Cómo poder construir una experiencia Web más integrada, consistente y profunda? (Allemang & Hendler, 2011).Es en este escenario donde
la semántica es capaz de mostrar su poder para comunicar la información con suficiente significado. Así es posible construir aplicaciones
inteligentes que aporten un mayor conocimiento identificando en mayor profundidad los contenidos y fomenten el descubrimiento de
conocimiento.
Frawley, Piatetsky-Shapiro y Matheus (1992) definen descubrimiento de conocimiento como la extracción no trivial de información implícita,
previamente desconocida y potencialmente útil, a partir de datos. El reto de extraer conocimiento a partir de datos demanda investigación
en estadística, bases de datos, reconocimiento de patrones, aprendizaje de máquinas, visualización de datos, optimización y cómputo de
alto rendimiento, para entregar inteligencia de negocio avanzada y soluciones de descubrimiento web (IBM, 2018).
AmeliCA/Redalyc1 ejecutó un algoritmo basado en ontologías, previamente desarrollado llamado OntoOAI OntoOAI (Becerril-García &
Aguado-Lopez, 2018), en sus bases de datos para extraer contenido relacionado con epidemias. Los resultados incluyen: una representación
ontológica del conocimiento publicado en 6,557 artículos científicos que incluyen conceptos y relaciones, así como sus atributos; un grafo
dirigido utilizado como navegador temático de contenido para acceder a los textos completos de los artículos; así como también, un
conjunto de datos disponibles en un punto de acceso SPARQL para consultar los resultados encontrados como parte de Linked Open Data.
1 AmeliCA/Redalyc es una infraestructura de Ciencia Abierta que busca fortalecer la comunicación y publicación científica sin fines de lucro
propiedad de la academia. A través del respeto a las lenguas y culturas locales, AmeliCA/Redalyc tiene como objetivo incluir e insertar en la conversación
científica mundial a diferentes regiones del mundo para lograr que la difusión del conocimiento sea más participativa, incluyente y sustentable.
Actualmente, esta infraestructura brinda servicios a más de 1.400 revistas de Acceso Abierto, evaluadas por pares y de calidad certificada, publicadas
por 670 instituciones de 31 países de todo el mundo. A través de Redalyc se proporciona acceso a más de 700.000 artículos de texto completo en
diferentes idiomas (principalmente español, inglés, portugués y francés) de 1.8 millones de autores de 150 países, con aproximadamente 10 millones
de descargas de artículos por mes alrededor del mundo.
Marzo 2020AmeliCA / Redalyc
METODOLOGÍASe ejecutó un algoritmo para extraer contenido basado en un tesauro de conceptos relacionados con pandemias / epidemias. En un inicio
se basó en una lista predefinida de sinónimos obtenidos de powerthesaurus.org. Según los conceptos resultantes y las relaciones entre
ellos se estableció un conjunto de iteraciones para obtener y refinar una ontología resultante que muestra el conocimiento publicado en
ese conjunto de revistas de AA. Finalmente, la ontología se utilizó para desarrollar la representación visual y el navegador de contenido para
obtener acceso a artículos de texto completo. El conjunto de datos resultante también se publicó como un SPARQL endpoint.
ONTOLOGÍA RESULTANTE
6.557Artículos científicos
1990-2020Periodo de publicación
34Campos de conocimiento
24Países
414Instituciones editoras
643Revistas
CONJUNTO DE DATOSPunto de acceso SPARQL con los datos disponibles para acceder a los resultados para mayores análisis: http://sparql.amelica.org/
Marzo 2020AmeliCA / Redalyc
REFERENCIAS1. Keßler, C.; d’Aquin, M.; Dietze, S. Linked Data for Science and Education. Semantic Web Journal 2013, 4 (1), pp. 1-2.
2. Allemang, D.; Hendler, J. Semantic Web for the Working Ontologist, 3rd ed. Morgan Kaufmamm: Waltham, Ma, Estados Unidos,
2011; ISBN 978-0123859655.
3. Chan, L.; Cuplinskas, D.; Eisen, M.; Friend, F.; Genova, Y.; Guédon, J.-C.; et al. Budapest Open Access Initiative, 2002. Available
online: http://www.soros.org/openaccess/read.shtml
4. Max Planck Society. Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities, 2003. Available online:
http://openaccess.mpg.de/Berlin-Declaration
5. Brown, P.; Cabell, D.; Chakravarti, A.; Cohen, B.; Delamothe, T.; Eisen, M.; et al. Declaración de Bethesda sobre Publicación de
Acceso Abierto, 2003. Available online: http://ictlogy.net/articles/bethesda_es.html
6. Albert, P.; Holmes, K.; Börner, K.; Conlon, M. Research Discovery through Linked Open Data. IN 12th ACM/IEEE-CS Joint
Conference on Digital Libraries, Nueva York: ACM, USA, 2012, pp. 429-430.
7. Wiederhold, G. Foreword: on the barriers and future of knowledge discovery. In Advances in Knowledge Discovery and Data
Mining; Fayyad, U., Piatetsky-Shapiro, G., Smyth, P., Uthurusamy, R.; AAAI Press, 1996.
8. Frawley, W. J., Piatetsky-Shapiro, G., Matheus, C. J. Knowledge Discovery in Databases: An Overview. AI Magazine 1992 ,13 (3),
57-70.
9. IBM. Knowledge Discovery and Data Mining. Available online: http://researcher.watson.ibm.com/researcher/view_group.
php?id=144 (accessed on 2015)
10. Becerril-García, A., Aguado-Lopez E. A Semantic Model for Selective Knowledge Discovery over OAI-PMH Structured Resources.
Information 2018, 9 (6), 144. https://doi.org/10.3390/info9060144
11. Becerril García, A., Lozano Espinosa, R., Molina Espinosa, J. M. Semantic Approach to Context-Aware Resource Discovery over
Scholarly Content Structured with OAI-PMH. Computación y Sistemas 2016, 20 (1), 127-142.
12. Becerril Garcia, A.; Lozano Espinosa, R.; & Molina Espinosa, J. Modelo para consultas semánticas sensibles al contexto sobre
recursos educativos estructurados con OAI-PMH. Proceedings of the Encuentro Nacional de Ciencias de la Computación. ENC
2014. Nova Universitas: Oaxaca, México, 2014, pp. 1- 15.
13. Ministerio para la Ciencia e Innovación de España. Informe Modelos de Metadatos para Contenidos Multimedia. Available
online: http://omediadis.udl.cat/html/deliverables/215-Modelos_Metadatos_Contenidos_Multimedia/
14. Haslhofer, B., & Schandl, B. The OAI2LOD Server: Exposing OAI-PMH Metadata as Linked Data. International Workshop on
Linked Data on the Web (LDOW2008). Beijing, China, 2008.
15. Bizer, C., Cyganiak, R. D2R Server – Publishing Relational Databases on the Semantic Web 2006. Available online: http://wifo5-
03.informatik.uni-mannheim.de/bizer/pub/Bizer-Cyganiak-D2R-Server-ISWC2006.pdf
16. SIMILE. OAI2RDF 2006. Available online: http://simile.mit.edu/repository/RDFizers/oai2rdf/
17. Ameen, A., Rahman Khan, K., & Rani, B. Semi-Automatic Merging of Ontologies using Protégé. International Journal of Computer
Applications 2014, 85 (12), 35-42.
18. Panagiotopoulos, I., Kalou, A., Pierrakeas, C., & Kameas, A. An Ontology-Based Model for Student Representation in Intelligent
Tutoring Systems for Distance Learning. In I. M. Lazaros Iliadis (Ed.), Artificial Intelligence Applications and Innovations. Springer:
Halkidiki, Grecia, 2012.
19. Apache Software Foundation. Available online: http://jena.apache.org/about_jena/about.html
20. Dentler, K., Cornet, R., Teije, A., & de Keizer, N. Comparison of Reasoners for large Ontologies in the OWL 2 EL Profile. In
Semantic Web; I. Press, Ed, 2008; pp. 1-5.
21. Becerril-García, A., Aguado-López, E., Rogel-Salazar, R., Garduño-Oropeza, G., Zúñiga-Roca, M. De un modelo centrado en la
revista a un modelo centrado en entidades: la publicación y producción científica en la nueva plataforma Redalyc.org. (I. U. Oviedo,
Ed.) Aula Abierta 2012, 40 (2), 53-64.
22. Segaran, T., Evans, C., & Taylor, J. (2009). Programming the semantic web, 1st. ed.; O’reilly: Estados Unidos, 2009, pp. 302.