Computational Reproducibility of Named Entity Recognition methods in the biomedical domain

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/114248
Información del item - Informació de l'item - Item information
Título: Computational Reproducibility of Named Entity Recognition methods in the biomedical domain
Título alternativo: Reproducción computacional de métodos de reconocimiento de entidades nombradas en un dominio biomédico
Autor/es: García-Serrano, Ana | Hennig, Sebastian | Nürnberger, Andreas
Palabras clave: Named Entity Recognition (NER) | Biomedical | Supervised and unsupervised models | Unified Medical Language System | Reconocimiento de Entidades Nombradas (NER) | Modelos biomédicos | Supervisados y no supervisados | Sistema de Lenguaje Médico Unificado
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: mar-2021
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2021, 66: 141-152. https://doi.org/10.26342/2021-66-12
Resumen: Unsupervised Named Entity Recognition (NER) approaches do not depend on labelled data to function properly but rather on a source of knowledge, in which promising candidates can be looked up to find the corresponding concept. In the biomedical domain knowledge source like this already exists; namely the Unified Medical Language System (UMLS). In this paper, three different unsupervised NER models using UMLS, namely MetaMap, cTakes and MetaMapLite are evaluated and compared from the results published by Demner-Fushman, Rogers and Aronson (2017) and Reategui and Ratte (2018). The Unsupervised Biomedical Named Entity Recognition framework (UB-NER) is developed, with which the results of the experiments of the three models, five datasets and two NER tasks are presented. | Los enfoques para reconocimiento de entidades nombradas no supervisados (NER, por sus siglas en inglés) no dependen de corpus con datos etiquetados, sino de una fuente de conocimiento donde buscar candidatos prometedores para encontrar el concepto correspondiente. En el ámbito biomédico existe la fuente denominada “Sistema Unificado de Lenguaje Médico” (UMLS, por sus siglas en inglés). En este artículo, se evalúan y comparan tres modelos diferentes de NER no supervisados que utilizan UMLS, a saber, MetaMap, cTakes y MetaMapLite, a partir de los resultados publicados por Demner-Fushman, Rogers y Aronson (2017) y Reategui y Ratte (2018). Para ello se desarrolla el entorno Unsupervised Biomedical Named Entity Recognition (UB-NER), con el que se presentan resultados de los experimentos en los modelos, cinco datasets y dos tareas NER.
URI: http://hdl.handle.net/10045/114248
ISSN: 1135-5948
DOI: 10.26342/2021-66-12
Idioma: eng
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica: si
Versión del editor: https://doi.org/10.26342/2021-66-12
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 66 (2021)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_66_12.pdf1,96 MBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.