A Supervised Central Unit Detector for Spanish
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/74612
Título: | A Supervised Central Unit Detector for Spanish |
---|---|
Título alternativo: | Un detector de la unidad central para textos en castellano |
Autor/es: | Bengoetxea Kortazar, Kepa | Iruskieta Quintian, Mikel |
Palabras clave: | Unidad central | RST | Clasificación | Minería de datos | Naive Bayes | SVM | Central unit | Classification | Data mining |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | mar-2018 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | Procesamiento del Lenguaje Natural. 2018, 60: 29-36. doi:10.26342/2018-60-3 |
Resumen: | En este artículo presentamos el primer detector de la Unidad Central (CU) de resúmenes científicos en castellano basado en técnicas de aprendizaje automático. Para ello, nos hemos basado en la anotación del Spanish RST Treebank anotado bajo la Teoría de la Estructura Retórica o Rhetorical Structure Theory (RST). El método empleado para detectar la unidad central es el modelo de bolsa de palabras utilizando clasificadores como Naive Bayes y SVM. Finalmente, evaluamos el rendimiento de los clasificadores y hemos creado el detector de CUs usando el mejor clasificador. | In this paper we present the first automatic detector of the Central Unit (CU) for Spanish scientific abstracts based on machine learning techniques. To do so, learning and evaluation data was extracted from the RST Spanish Treebank annotated under the Rhetorical Structure Theory (RST). We use a bag-of-words model based on Naive Bayes and SVM classifiers to detect the central units of a text. Finally, we evaluate the performance of the classifiers and choose the best to create an automatic CU detector. |
URI: | http://hdl.handle.net/10045/74612 |
ISSN: | 1135-5948 |
DOI: | 10.26342/2018-60-3 |
Idioma: | eng |
Tipo: | info:eu-repo/semantics/article |
Derechos: | © Sociedad Española para el Procesamiento del Lenguaje Natural |
Revisión científica: | si |
Versión del editor: | https://doi.org/10.26342/2018-60-3 |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 60 (2018) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_60_03.pdf | 862,4 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.