Evaluación de un etiquetador morfosintáctico basado en bigramas especializados para el castellano

Autores: Antonio Molina Marco, Ferrán Pla , Natividad Prieto Sáez
Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 27, 2001 (Ejemplar dedicado a: XVII Congreso de la SEPLN: Sociedad Española para el Procesamiento del Lenguaje Natural: Universidad de Jaén, 12-14 septiembre 2001), págs. 215-222
Idioma: español
Enlaces
- Texto completo
Resumen
- En este artículo se describe un sistema de etiquetado morfosintáctico basado en bigramas especializados que incorporan información de ciertas palabras del vocabulario en determinados contextos. La técnica propuesta para la construcción de estos modelos se basa en el aprendizaje a partir de datos, por lo que se puede aplicar de forma directa a cualquier lenguaje y a diferentes tareas de desambiguación. El sistema de etiquetado morfosintáctico se ha evaluado sobre el corpus en castellano LexEsp, obteniéndose un 97.4% de precisión global, y un 93.5% de precisión sobre el conjunto de las palabras ambiguas. Este resultado y su comparación con los obtenidos utilizando otros sistemas de etiquetado propuestos en la literatura, confirman la viabilidad de la