Legibilidad del texto, métricas de complejidad y la importancia de las palabras

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/81353
Información del item - Informació de l'item - Item information
Título: Legibilidad del texto, métricas de complejidad y la importancia de las palabras
Título alternativo: Text readability, complexity metrics and the importance of words
Autor/es: López-Anguita, Rocío | Montejo Ráez, Arturo | Martínez Santiago, Fernando | Díaz Galiano, Manuel Carlos
Palabras clave: Legibilidad | Complejidad textual | Modelado del lenguaje | Readability | Text complexity | Language modelling
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2018
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2018, 61: 101-108. doi:10.26342/2018-61-11
Resumen: El presente trabajo expone un estudio sobre la determinación de la edad recomendada de lectura sobre un conjunto de textos infantiles. Se ha evaluado el mismo con 12 medidas de complejidad propuestas por distintos autores. Usando estas medidas como características, hemos modelado los textos y aplicado una validación cruzada con varios clasificadores automáticos. Los resultados se han comparado con otras formas de representación de los textos, como vectores de palabras y vectores TF.IDF. Nuestras conclusiones indican que el rasgo más determinante para la determinación de la edad de lectura recomendada no radica tanto en factores como la complejidad sintáctica o léxica, sino en el uso de determinado vocabulario. | This article describes our study on the identification of the recommended age for readers in texts written for children. They have been evaluated over 12 complexity metrics proposed by different authors. By using these metrics as features, we have trained several automatic classifiers and cross-validated their performances to detect recommended reader level. The results have been compared with the classification performance obtained from other document models, like word embeddings and TF.IDF vectors. Our conclusions are that the most relevant facet to identify the recommended reader age is not on lexical or syntactical complexities, but strongly related with the vocabulary involved.
Patrocinador/es: Este trabajo ha sido parcialmente financiado por el Gobierno de España a través del proyecto REDES (TIN2015-65136-C2-1-R).
URI: http://hdl.handle.net/10045/81353
ISSN: 1135-5948
DOI: 10.26342/2018-61-11
Idioma: spa
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica: si
Versión del editor: https://doi.org/10.26342/2018-61-11
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 61 (2018)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_61_11.pdf900,47 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.