Ir al contenido

Documat


Creación, etiquetación y desambiguación de un corpus de referencia del español

  • Autores: María Antonia Martí Antonín Árbol académico, Irene Castellón Masalles Árbol académico, Montserrat Civit Torruella
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 27, 2001 (Ejemplar dedicado a: XVII Congreso de la SEPLN: Sociedad Española para el Procesamiento del Lenguaje Natural: Universidad de Jaén, 12-14 septiembre 2001), págs. 21-28
  • Idioma: español
  • Enlaces
  • Resumen
    • En este artículo presentamos los criterios para la anotación y desambiguación morfosintáctica de un corpus de referencia del español que será de libre disposición, proponiendo respuestas concretas a casos problemáticos de ambas tareas. El objetivo final es disponer de una colección escrita de 1 millón de palabras desambiguadas manualmente a nivel tanto morfológico como sintáctico, que pueda utilizarse para el aprendizaje automático así como para la consulta lingüística. Discutimos detalladamente la categorización de las palabras del español así como los criterios lingüísticos de desambigüación.


Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno