BASE DE CONOCIMIENTO Autores: Desarrolladores de DE ...€¦ · AmeliCA / Redalyc aro Autores:...

3
Marzo 2020 Autores: Arianna Becerril-García, Eduardo Aguado-López. Desarrolladores de Software: Alma Rosa Segundo Escobar, Paulo César Ylloldi Costilla, Luis Angel Ángeles Pineda. Diseño: Priscila Dávila Morales. Ingeniería de Datos: Liliana González Morales, Alma Rosa Segundo Escobar. Ingeniería Ontológica: Arianna Becerril García. Investigación: Cuerpo Académico Consolidado “Comunicación y Difusión de la Ciencia SEP UAEM/77, Facultad de Ciencias Políticas y Sociales, Universidad Autónoma del Estado de México BASE DE CONOCIMIENTO EN EPIDEMIAS/PANDEMIAS DE REVISTAS EN AMELICA/REDALYC http://amelica.org/epidemics CONTEXTO Ante una contingencia mundial de salud, se refrenda la vital función del Acceso Abierto: llevar el conocimiento a todos los rincones del mundo, permitir que la ciencia sea accesible rápida y oportunamente para que su contribución se refleje en la mejora de la calidad de vida humana, en salvar vidas y en el desarrollo de una mejor sociedad para todos. Iniciativas de Acceso Abierto como Redalyc UAEM desde hace 18 años trabajancon ese objetivo. Hoy, la alianza con AmeliCA/Redalyc refrenda su compromiso con el Acceso Abierto y sigue desarrollando tecnología la cual aplica ahora a la diseminación semántica de los artículos publicados en temáticas de interés en epidemiología, pandemias y temas relacionados. Ello permitirá difundir y poner a disposición más de 6 mil artículos en formato de Linked Open Data (LOD) para que sean procesados e interconectados en la nube del conocimiento LOD y ofrecer al usuario lector servicios de navegación y descubrimiento temático para la consulta de los textos completos de este conjunto de datos. DESCRIPCIÓN Esta masa de información que constituye la Web, en ocasiones se siente como “de una milla de ancho pero con una pulgada de profundidad” ¿Cómo poder construir una experiencia Web más integrada, consistente y profunda? (Allemang & Hendler, 2011).Es en este escenario donde la semántica es capaz de mostrar su poder para comunicar la información con suficiente significado. Así es posible construir aplicaciones inteligentes que aporten un mayor conocimiento identificando en mayor profundidad los contenidos y fomenten el descubrimiento de conocimiento. Frawley, Piatetsky-Shapiro y Matheus (1992) definen descubrimiento de conocimiento como la extracción no trivial de información implícita, previamente desconocida y potencialmente útil, a partir de datos. El reto de extraer conocimiento a partir de datos demanda investigación en estadística, bases de datos, reconocimiento de patrones, aprendizaje de máquinas, visualización de datos, optimización y cómputo de alto rendimiento, para entregar inteligencia de negocio avanzada y soluciones de descubrimiento web (IBM, 2018). AmeliCA/Redalyc 1 ejecutó un algoritmo basado en ontologías, previamente desarrollado llamado OntoOAI OntoOAI (Becerril-García & Aguado-Lopez, 2018), en sus bases de datos para extraer contenido relacionado con epidemias. Los resultados incluyen: una representación ontológica del conocimiento publicado en 6,557 artículos científicos que incluyen conceptos y relaciones, así como sus atributos; un grafo dirigido utilizado como navegador temático de contenido para acceder a los textos completos de los artículos; así como también, un conjunto de datos disponibles en un punto de acceso SPARQL para consultar los resultados encontrados como parte de Linked Open Data. 1 AmeliCA/Redalyc es una infraestructura de Ciencia Abierta que busca fortalecer la comunicación y publicación científica sin fines de lucro propiedad de la academia. A través del respeto a las lenguas y culturas locales, AmeliCA/Redalyc tiene como objetivo incluir e insertar en la conversación científica mundial a diferentes regiones del mundo para lograr que la difusión del conocimiento sea más participativa, incluyente y sustentable. Actualmente, esta infraestructura brinda servicios a más de 1.400 revistas de Acceso Abierto, evaluadas por pares y de calidad certificada, publicadas por 670 instituciones de 31 países de todo el mundo. A través de Redalyc se proporciona acceso a más de 700.000 artículos de texto completo en diferentes idiomas (principalmente español, inglés, portugués y francés) de 1.8 millones de autores de 150 países, con aproximadamente 10 millones de descargas de artículos por mes alrededor del mundo.

Transcript of BASE DE CONOCIMIENTO Autores: Desarrolladores de DE ...€¦ · AmeliCA / Redalyc aro Autores:...

Page 1: BASE DE CONOCIMIENTO Autores: Desarrolladores de DE ...€¦ · AmeliCA / Redalyc aro Autores: Arianna Becerril-García, Eduardo Aguado-López. Desarrolladores de Software: Alma Rosa

Marzo 2020AmeliCA / Redalyc

Autores: Arianna Becerril-García, Eduardo Aguado-López. Desarrolladores de Software: Alma Rosa Segundo Escobar, Paulo César Ylloldi Costilla, Luis Angel Ángeles Pineda. Diseño: Priscila Dávila Morales. Ingeniería de Datos: Liliana González Morales, Alma Rosa Segundo Escobar. Ingeniería Ontológica: Arianna Becerril García. Investigación: Cuerpo Académico Consolidado “Comunicación y Difusión de la Ciencia SEP UAEM/77, Facultad de Ciencias Políticas y Sociales, Universidad Autónoma del Estado de México

BASE DE CONOCIMIENTOEN EPIDEMIAS/PANDEMIAS DE REVISTASEN AMELICA/REDALYChttp://amelica.org/epidemics

CONTEXTOAnte una contingencia mundial de salud, se refrenda la vital función del Acceso Abierto:

llevar el conocimiento a todos los rincones del mundo, permitir que la ciencia sea

accesible rápida y oportunamente para que su contribución se refleje en la mejora de

la calidad de vida humana, en salvar vidas y en el desarrollo de una mejor sociedad

para todos. Iniciativas de Acceso Abierto como Redalyc UAEM desde hace 18 años

trabajancon ese objetivo. Hoy, la alianza con AmeliCA/Redalyc refrenda su compromiso

con el Acceso Abierto y sigue desarrollando tecnología la cual aplica ahora a la diseminación semántica de los artículos publicados

en temáticas de interés en epidemiología, pandemias y temas relacionados. Ello permitirá difundir y poner a disposición más de 6

mil artículos en formato de Linked Open Data (LOD) para que sean procesados e interconectados en la nube del conocimiento LOD y

ofrecer al usuario lector servicios de navegación y descubrimiento temático para la consulta de los textos completos de este conjunto

de datos.

DESCRIPCIÓNEsta masa de información que constituye la Web, en ocasiones se siente como “de una milla de ancho pero con una pulgada de profundidad”

¿Cómo poder construir una experiencia Web más integrada, consistente y profunda? (Allemang & Hendler, 2011).Es en este escenario donde

la semántica es capaz de mostrar su poder para comunicar la información con suficiente significado. Así es posible construir aplicaciones

inteligentes que aporten un mayor conocimiento identificando en mayor profundidad los contenidos y fomenten el descubrimiento de

conocimiento.

Frawley, Piatetsky-Shapiro y Matheus (1992) definen descubrimiento de conocimiento como la extracción no trivial de información implícita,

previamente desconocida y potencialmente útil, a partir de datos. El reto de extraer conocimiento a partir de datos demanda investigación

en estadística, bases de datos, reconocimiento de patrones, aprendizaje de máquinas, visualización de datos, optimización y cómputo de

alto rendimiento, para entregar inteligencia de negocio avanzada y soluciones de descubrimiento web (IBM, 2018).

AmeliCA/Redalyc1 ejecutó un algoritmo basado en ontologías, previamente desarrollado llamado OntoOAI OntoOAI (Becerril-García &

Aguado-Lopez, 2018), en sus bases de datos para extraer contenido relacionado con epidemias. Los resultados incluyen: una representación

ontológica del conocimiento publicado en 6,557 artículos científicos que incluyen conceptos y relaciones, así como sus atributos; un grafo

dirigido utilizado como navegador temático de contenido para acceder a los textos completos de los artículos; así como también, un

conjunto de datos disponibles en un punto de acceso SPARQL para consultar los resultados encontrados como parte de Linked Open Data.

1 AmeliCA/Redalyc es una infraestructura de Ciencia Abierta que busca fortalecer la comunicación y publicación científica sin fines de lucro

propiedad de la academia. A través del respeto a las lenguas y culturas locales, AmeliCA/Redalyc tiene como objetivo incluir e insertar en la conversación

científica mundial a diferentes regiones del mundo para lograr que la difusión del conocimiento sea más participativa, incluyente y sustentable.

Actualmente, esta infraestructura brinda servicios a más de 1.400 revistas de Acceso Abierto, evaluadas por pares y de calidad certificada, publicadas

por 670 instituciones de 31 países de todo el mundo. A través de Redalyc se proporciona acceso a más de 700.000 artículos de texto completo en

diferentes idiomas (principalmente español, inglés, portugués y francés) de 1.8 millones de autores de 150 países, con aproximadamente 10 millones

de descargas de artículos por mes alrededor del mundo.

Page 2: BASE DE CONOCIMIENTO Autores: Desarrolladores de DE ...€¦ · AmeliCA / Redalyc aro Autores: Arianna Becerril-García, Eduardo Aguado-López. Desarrolladores de Software: Alma Rosa

Marzo 2020AmeliCA / Redalyc

METODOLOGÍASe ejecutó un algoritmo para extraer contenido basado en un tesauro de conceptos relacionados con pandemias / epidemias. En un inicio

se basó en una lista predefinida de sinónimos obtenidos de powerthesaurus.org. Según los conceptos resultantes y las relaciones entre

ellos se estableció un conjunto de iteraciones para obtener y refinar una ontología resultante que muestra el conocimiento publicado en

ese conjunto de revistas de AA. Finalmente, la ontología se utilizó para desarrollar la representación visual y el navegador de contenido para

obtener acceso a artículos de texto completo. El conjunto de datos resultante también se publicó como un SPARQL endpoint.

ONTOLOGÍA RESULTANTE

6.557Artículos científicos

1990-2020Periodo de publicación

34Campos de conocimiento

24Países

414Instituciones editoras

643Revistas

CONJUNTO DE DATOSPunto de acceso SPARQL con los datos disponibles para acceder a los resultados para mayores análisis: http://sparql.amelica.org/

Page 3: BASE DE CONOCIMIENTO Autores: Desarrolladores de DE ...€¦ · AmeliCA / Redalyc aro Autores: Arianna Becerril-García, Eduardo Aguado-López. Desarrolladores de Software: Alma Rosa

Marzo 2020AmeliCA / Redalyc

REFERENCIAS1. Keßler, C.; d’Aquin, M.; Dietze, S. Linked Data for Science and Education. Semantic Web Journal 2013, 4 (1), pp. 1-2.

2. Allemang, D.; Hendler, J. Semantic Web for the Working Ontologist, 3rd ed. Morgan Kaufmamm: Waltham, Ma, Estados Unidos,

2011; ISBN 978-0123859655.

3. Chan, L.; Cuplinskas, D.; Eisen, M.; Friend, F.; Genova, Y.; Guédon, J.-C.; et al. Budapest Open Access Initiative, 2002. Available

online: http://www.soros.org/openaccess/read.shtml

4. Max Planck Society. Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities, 2003. Available online:

http://openaccess.mpg.de/Berlin-Declaration

5. Brown, P.; Cabell, D.; Chakravarti, A.; Cohen, B.; Delamothe, T.; Eisen, M.; et al. Declaración de Bethesda sobre Publicación de

Acceso Abierto, 2003. Available online: http://ictlogy.net/articles/bethesda_es.html

6. Albert, P.; Holmes, K.; Börner, K.; Conlon, M. Research Discovery through Linked Open Data. IN 12th ACM/IEEE-CS Joint

Conference on Digital Libraries, Nueva York: ACM, USA, 2012, pp. 429-430.

7. Wiederhold, G. Foreword: on the barriers and future of knowledge discovery. In Advances in Knowledge Discovery and Data

Mining; Fayyad, U., Piatetsky-Shapiro, G., Smyth, P., Uthurusamy, R.; AAAI Press, 1996.

8. Frawley, W. J., Piatetsky-Shapiro, G., Matheus, C. J. Knowledge Discovery in Databases: An Overview. AI Magazine 1992 ,13 (3),

57-70.

9. IBM. Knowledge Discovery and Data Mining. Available online: http://researcher.watson.ibm.com/researcher/view_group.

php?id=144 (accessed on 2015)

10. Becerril-García, A., Aguado-Lopez E. A Semantic Model for Selective Knowledge Discovery over OAI-PMH Structured Resources.

Information 2018, 9 (6), 144. https://doi.org/10.3390/info9060144

11. Becerril García, A., Lozano Espinosa, R., Molina Espinosa, J. M. Semantic Approach to Context-Aware Resource Discovery over

Scholarly Content Structured with OAI-PMH. Computación y Sistemas 2016, 20 (1), 127-142.

12. Becerril Garcia, A.; Lozano Espinosa, R.; & Molina Espinosa, J. Modelo para consultas semánticas sensibles al contexto sobre

recursos educativos estructurados con OAI-PMH. Proceedings of the Encuentro Nacional de Ciencias de la Computación. ENC

2014. Nova Universitas: Oaxaca, México, 2014, pp. 1- 15.

13. Ministerio para la Ciencia e Innovación de España. Informe Modelos de Metadatos para Contenidos Multimedia. Available

online: http://omediadis.udl.cat/html/deliverables/215-Modelos_Metadatos_Contenidos_Multimedia/

14. Haslhofer, B., & Schandl, B. The OAI2LOD Server: Exposing OAI-PMH Metadata as Linked Data. International Workshop on

Linked Data on the Web (LDOW2008). Beijing, China, 2008.

15. Bizer, C., Cyganiak, R. D2R Server – Publishing Relational Databases on the Semantic Web 2006. Available online: http://wifo5-

03.informatik.uni-mannheim.de/bizer/pub/Bizer-Cyganiak-D2R-Server-ISWC2006.pdf

16. SIMILE. OAI2RDF 2006. Available online: http://simile.mit.edu/repository/RDFizers/oai2rdf/

17. Ameen, A., Rahman Khan, K., & Rani, B. Semi-Automatic Merging of Ontologies using Protégé. International Journal of Computer

Applications 2014, 85 (12), 35-42.

18. Panagiotopoulos, I., Kalou, A., Pierrakeas, C., & Kameas, A. An Ontology-Based Model for Student Representation in Intelligent

Tutoring Systems for Distance Learning. In I. M. Lazaros Iliadis (Ed.), Artificial Intelligence Applications and Innovations. Springer:

Halkidiki, Grecia, 2012.

19. Apache Software Foundation. Available online: http://jena.apache.org/about_jena/about.html

20. Dentler, K., Cornet, R., Teije, A., & de Keizer, N. Comparison of Reasoners for large Ontologies in the OWL 2 EL Profile. In

Semantic Web; I. Press, Ed, 2008; pp. 1-5.

21. Becerril-García, A., Aguado-López, E., Rogel-Salazar, R., Garduño-Oropeza, G., Zúñiga-Roca, M. De un modelo centrado en la

revista a un modelo centrado en entidades: la publicación y producción científica en la nueva plataforma Redalyc.org. (I. U. Oviedo,

Ed.) Aula Abierta 2012, 40 (2), 53-64.

22. Segaran, T., Evans, C., & Taylor, J. (2009). Programming the semantic web, 1st. ed.; O’reilly: Estados Unidos, 2009, pp. 302.