En este artículo se describe un sistema de etiquetado morfosintáctico basado en bigramas especializados que incorporan información de ciertas palabras del vocabulario en determinados contextos. La técnica propuesta para la construcción de estos modelos se basa en el aprendizaje a partir de datos, por lo que se puede aplicar de forma directa a cualquier lenguaje y a diferentes tareas de desambiguación. El sistema de etiquetado morfosintáctico se ha evaluado sobre el corpus en castellano LexEsp, obteniéndose un 97.4% de precisión global, y un 93.5% de precisión sobre el conjunto de las palabras ambiguas. Este resultado y su comparación con los obtenidos utilizando otros sistemas de etiquetado propuestos en la literatura, confirman la viabilidad de la
© 2008-2024 Fundación Dialnet · Todos los derechos reservados