Relevant Content Selection through Positional Language Models: An Exploratory Analysis
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/109296
Título: | Relevant Content Selection through Positional Language Models: An Exploratory Analysis |
---|---|
Título alternativo: | Selección de Contenido Relevante mediante Modelos de Lenguaje Posicionales: Un Análisis Experimental |
Autor/es: | Vicente, Marta | Lloret, Elena |
Grupo/s de investigación o GITE: | Procesamiento del Lenguaje y Sistemas de Información (GPLSI) |
Centro, Departamento o Servicio: | Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos |
Palabras clave: | Summarisation | Positional Language Models | Discourse Semantics | Resúmenes automáticos | Modelos de Lenguaje Posicionales | Semántica del Discurso |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | sep-2020 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | Procesamiento del Lenguaje Natural. 2020, 65: 75-82. https://doi.org/10.26342/2020-65-9 |
Resumen: | Extractive Summarisation, like other areas in Natural Language Processing, has succumbed to the general trend marked by the success of neural approaches. However, the required resources-computational, temporal, data-are not always available. We present an experimental study of a method based on statistical techniques that, exploiting the semantic information from the source and its structure, provides competitive results against the state of the art. We propose a Discourse-Informed approach for Cost-effective Extractive Summarisation (DICES). DICES is an unsupervised, lightweight and adaptable framework that requires neither training data nor high-performance computing resources to achieve promising results. | Como muchas áreas en el ámbito del Procesamiento de Lenguaje Natural, la generación extractiva de resúmenes ha sucumbido a la tendencia general marcada por el éxito de los enfoques de aprendizaje profundo y redes neuronales. Sin embargo, los recursos que tales aproximaciones requieren - computacionales, temporales, datos - no siempre están disponibles. En este trabajo exploramos un método alternativo basado en técnicas estadísticas que, explotando la información semántica del documento original así como su estructura, proporciona resultados competitivos. Presentamos DICES, un método no supervisado, económico y adaptable que no necesita recursos potentes ni grandes cantidades de datos para lograr resultados prometedores respecto al estado de la cuestión. |
Patrocinador/es: | This research results from work partially funded by Generalitat Valenciana (SIIA PROMETEU/2018/089) and the Spanish Government-ModeLang (RTI2018-094653-B-C22) and INTEGER (RTI2018-094649-B-I00). It is also based upon work from COST Action Multi3Generation (CA18231). |
URI: | http://hdl.handle.net/10045/109296 |
ISSN: | 1135-5948 |
DOI: | 10.26342/2020-65-9 |
Idioma: | eng |
Tipo: | info:eu-repo/semantics/article |
Derechos: | © Sociedad Española para el Procesamiento del Lenguaje Natural |
Revisión científica: | si |
Versión del editor: | https://doi.org/10.14198/10.26342/2020-65-9 |
Aparece en las colecciones: | INV - GPLSI - Artículos de Revistas Procesamiento del Lenguaje Natural - Nº 65 (2020) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_65_09.pdf | 964,07 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.