Escansión automática de poesía española sin silabación

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/114227
Información del item - Informació de l'item - Item information
Título: Escansión automática de poesía española sin silabación
Título alternativo: Automatic Scansion of Spanish Poetry without Syllabification
Autor/es: Marco Remón, Guillermo | Gonzalo Arroyo, Julio
Palabras clave: Patrones métricos | Escansión automática | Metrical patterns | Automated scansion
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: mar-2021
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2021, 66: 77-87. https://doi.org/10.26342/2021-66-6
Resumen: En los últimos años, han surgido diversas herramientas de análisis métrico automático de poesía española. Estos sistemas se basan en complejos métodos de silabación y asignación de acentos, los cuales se apoyan en librerías de etiquetado gramatical, cuyo coste computacional es elevado. Este coste incrementa con el cálculo de ambigüedades métricas. El presente artículo parte de la hipótesis de que es posible llevar a cabo un análisis métrico informativo y preciso sin utilizar estos métodos. Se propone un algoritmo que realiza escansiones (número de sílabas, patrón métrico y tipo de verso) sin silabación. El algoritmo resuelve ambigüedades métricas y tiene en cuenta la compensación hemistiquial. Nuestros resultados indican que obtiene una mejora relativa sobre el estado del arte de un 2% en la clasificación de patrones métricos en poesía de medida fija y un 25% en poesía polimétrica. También se ejecuta 21 y 25 veces más rápido, respectivamente. Por último, se ofrece una aplicación de escritorio como herramienta para los investigadores de la poesía española. | In recent years, several systems of automated metric analysis of Spanish poetry have emerged. These systems rely on complex methods of syllabification and stress assignment, which use PoS-tagging libraries, whose computational cost is high. This cost increases with the calculation of metric ambiguities. However, it is possible to carry out an informative and accurate metric analysis without using these costly methods. We propose an algorithm that performs accurate scansion (number of syllables, stress pattern and type of verse) without syllabification. It addresses metric ambiguities and takes into account the hemistichs compensation. Our algorithm outperforms the current state of the art by 2% in fixed-metre poetry, and 25% in mixed-metre poetry. It also runs 21 and 25 times faster, respectively. Finally, a desktop application is offered as a tool for researchers of Spanish poetry.
Patrocinador/es: Esta investigación se ha desarrollado gracias al proyecto MISMIS-BIAS (PGC2018-096212-B-C32), financiado por el Gobierno de España, Ministerio de Ciencia, Innovación y Universidades.
URI: http://hdl.handle.net/10045/114227
ISSN: 1135-5948
DOI: 10.26342/2021-66-6
Idioma: spa
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica: si
Versión del editor: https://doi.org/10.26342/2021-66-6
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 66 (2021)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_66_06.pdf846,97 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.