Ir al contenido

Documat


Etiquetación robusta del lenguaje natural: preprocesamiento y segmentación

  • Autores: Jorge Graña Gil Árbol académico, Francisco Mario Barcala Rodríguez, Jesús Vilares Árbol académico
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 27, 2001 (Ejemplar dedicado a: XVII Congreso de la SEPLN: Sociedad Española para el Procesamiento del Lenguaje Natural: Universidad de Jaén, 12-14 septiembre 2001), págs. 173-180
  • Idioma: español
  • Enlaces
  • Resumen
    • Una de las tareas previas más importantes para la etiquetación robusta del lenguaje natural es la correcta segmentación o preprocesamiento de los textos. Esta fase, que puede involucrar a procesos mucho más complejos que la simple identificación de las diferentes frases del texto y de cada uno de sus componentes individuales, es a menudo obviada en muchos de los desarrollos actuales. A pesar de esto, se trata de una tarea de una enorme importancia práctica y abordarla con pleno rigor científico, sin caer repetidamente en el análisis de la casuística particular de cada fenómeno detectado, es una labor que resulta especialmente compleja. En este trabajo hemos desarrollado un esquema de preprocesamiento orientado a la desambigüación y etiquetación robusta del gallego. No obstante, se trata de una propuesta de arquitectura general que puede ser aplicada a otros idiomas, como por ejemplo el español, con modificaciones muy ligeras.


Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno