Ir al contenido

Documat


Resumen de Algoritmo de stemming para el gallego

Marisa Moreda Leirado, Ángeles Saavedra Places Árbol académico, Eloy Vázquez Fontenla, Miguel Rodríguez Penabad Árbol académico

  • español

    La cantidad y calidad de los recursos y herramientas para el procesamiento del lenguaje natural que existan para un idioma dado depende de dicho idioma. En la Península Ibérica, el gallego es una de las lenguas para la que no existen, hasta el momento, suficientes herramientas y recursos apropiados. Para contribuir al desarrollo de estas herramientas, este artículo presenta un algoritmo de stemming para el gallego. Aunque fue presentado por primera vez en 2002, en años sucesivos ha sido optimizado, completado y probado con corpora de distinta naturaleza con el objetivo de ser usado principalmente en servicios de búsqueda por contenido en bibliotecas digitales

  • English

    The quantity and quality of the resources and tools for natural language processing for a given language depend on such a language. In the Iberian Peninsula, Galician is one of the languages that lack this type of tools and resources. To contribute to their development, this paper shows a stemmer specifically designed for the Galician language. It was first introduced in 2002, but since then it has been optimized, completed and tested with several different corpora, with the final aim of embedding this stemmer in a content search service for digital libraries


Fundación Dialnet

Mi Documat