Legibilidad del texto, métricas de complejidad y la importancia de las palabras
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/81353
Título: | Legibilidad del texto, métricas de complejidad y la importancia de las palabras |
---|---|
Título alternativo: | Text readability, complexity metrics and the importance of words |
Autor/es: | López-Anguita, Rocío | Montejo Ráez, Arturo | Martínez Santiago, Fernando | Díaz Galiano, Manuel Carlos |
Palabras clave: | Legibilidad | Complejidad textual | Modelado del lenguaje | Readability | Text complexity | Language modelling |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | sep-2018 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | Procesamiento del Lenguaje Natural. 2018, 61: 101-108. doi:10.26342/2018-61-11 |
Resumen: | El presente trabajo expone un estudio sobre la determinación de la edad recomendada de lectura sobre un conjunto de textos infantiles. Se ha evaluado el mismo con 12 medidas de complejidad propuestas por distintos autores. Usando estas medidas como características, hemos modelado los textos y aplicado una validación cruzada con varios clasificadores automáticos. Los resultados se han comparado con otras formas de representación de los textos, como vectores de palabras y vectores TF.IDF. Nuestras conclusiones indican que el rasgo más determinante para la determinación de la edad de lectura recomendada no radica tanto en factores como la complejidad sintáctica o léxica, sino en el uso de determinado vocabulario. | This article describes our study on the identification of the recommended age for readers in texts written for children. They have been evaluated over 12 complexity metrics proposed by different authors. By using these metrics as features, we have trained several automatic classifiers and cross-validated their performances to detect recommended reader level. The results have been compared with the classification performance obtained from other document models, like word embeddings and TF.IDF vectors. Our conclusions are that the most relevant facet to identify the recommended reader age is not on lexical or syntactical complexities, but strongly related with the vocabulary involved. |
Patrocinador/es: | Este trabajo ha sido parcialmente financiado por el Gobierno de España a través del proyecto REDES (TIN2015-65136-C2-1-R). |
URI: | http://hdl.handle.net/10045/81353 |
ISSN: | 1135-5948 |
DOI: | 10.26342/2018-61-11 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Derechos: | © Sociedad Española para el Procesamiento del Lenguaje Natural |
Revisión científica: | si |
Versión del editor: | https://doi.org/10.26342/2018-61-11 |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 61 (2018) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_61_11.pdf | 900,47 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.