El trabajo de investigación realilzado se enmarca en el área de procesamiento automático de corpus en español.
Las aportaciones atañen tanto a la mejora de recursos existentes como el desarrollo de nuevas estructuras de datos y la definición de parámetros para el desarrollo de nuevos recursos: redefinición del etisquetario previo del analizador morfológico y la introducción de conocimiento lingüístico en un sistema de desambiguación automática, la creación del corpus CLIC-TALP, definiendo los criterios para la desambiguación morfológica manual: desarrollo de una gramática de amplia cobertura para el análisis parcial de textos en español; y, por último el establecimiento de los criterios para la anotación sintáctica manual del corpus cast3LB.
Con este trabajo se cierra el procesamiento automático de textos inestrictos en español desde el análisis morfológico hasta la sintaxis superficial.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados