Relevant Content Selection through Positional Language Models: An Exploratory Analysis

Vicente, Marta; Lloret, Elena

Relevant Content Selection through Positional Language Models: An Exploratory Analysis

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/109296

Información del item - Informació de l'item - Item information
Título:	Relevant Content Selection through Positional Language Models: An Exploratory Analysis
Título alternativo:	Selección de Contenido Relevante mediante Modelos de Lenguaje Posicionales: Un Análisis Experimental
Autor/es:	Vicente, Marta \| Lloret, Elena
Grupo/s de investigación o GITE:	Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
Centro, Departamento o Servicio:	Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Palabras clave:	Summarisation \| Positional Language Models \| Discourse Semantics \| Resúmenes automáticos \| Modelos de Lenguaje Posicionales \| Semántica del Discurso
Área/s de conocimiento:	Lenguajes y Sistemas Informáticos
Fecha de publicación:	sep-2020
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica:	Procesamiento del Lenguaje Natural. 2020, 65: 75-82. https://doi.org/10.26342/2020-65-9
Resumen:	Extractive Summarisation, like other areas in Natural Language Processing, has succumbed to the general trend marked by the success of neural approaches. However, the required resources-computational, temporal, data-are not always available. We present an experimental study of a method based on statistical techniques that, exploiting the semantic information from the source and its structure, provides competitive results against the state of the art. We propose a Discourse-Informed approach for Cost-effective Extractive Summarisation (DICES). DICES is an unsupervised, lightweight and adaptable framework that requires neither training data nor high-performance computing resources to achieve promising results. \| Como muchas áreas en el ámbito del Procesamiento de Lenguaje Natural, la generación extractiva de resúmenes ha sucumbido a la tendencia general marcada por el éxito de los enfoques de aprendizaje profundo y redes neuronales. Sin embargo, los recursos que tales aproximaciones requieren - computacionales, temporales, datos - no siempre están disponibles. En este trabajo exploramos un método alternativo basado en técnicas estadísticas que, explotando la información semántica del documento original así como su estructura, proporciona resultados competitivos. Presentamos DICES, un método no supervisado, económico y adaptable que no necesita recursos potentes ni grandes cantidades de datos para lograr resultados prometedores respecto al estado de la cuestión.
Patrocinador/es:	This research results from work partially funded by Generalitat Valenciana (SIIA PROMETEU/2018/089) and the Spanish Government-ModeLang (RTI2018-094653-B-C22) and INTEGER (RTI2018-094649-B-I00). It is also based upon work from COST Action Multi3Generation (CA18231).
URI:	http://hdl.handle.net/10045/109296
ISSN:	1135-5948
DOI:	10.26342/2020-65-9
Idioma:	eng
Tipo:	info:eu-repo/semantics/article
Derechos:	© Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica:	si
Versión del editor:	https://doi.org/10.14198/10.26342/2020-65-9
Aparece en las colecciones:	INV - GPLSI - Artículos de Revistas Procesamiento del Lenguaje Natural - Nº 65 (2020)

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_65_09.pdf		964,07 kB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro completo