Ir al contenido

Documat


Reconocimiento temporal para el italiano combinando técnicas de aprendizaje automático y adquisición automática de conocimiento

  • Autores: Estela Saquete Boró Árbol académico, Óscar Ferrández Escámez, Patricio Martínez Barco Árbol académico, Rafael Muñoz Guillena Árbol académico
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 37, 2006, págs. 161-168
  • Idioma: español
  • Enlaces
  • Resumen
    • español

      Este artículo presenta la extensión automática del sistema TERSEO a otras lenguas combinada con el uso de técnicas basadas en Aprendizaje Automático (AA). En concreto, en este artículo se trabaja en el reconocimiento de expresiones temporales para el italiano y se han probado dos técnicas diferentes de AA: un modelo de Máxima Entropía y modelos ocultos de Markov. Cada sistema ha sido evaluado tanto de manera independiente como de manera combinada con la finalidad de analizar si el sistema combinado mejora los resultados de los sistemas independientes sin incrementar el número de expresiones erróneas en el mismo porcentaje. El sistema TERSEO fue combinado previamente con técnicas de AA para el inglés, obteniendo en ese caso buenos resultados. En este artículo, la combinación del reconocimiento de TERSEO con el reconocimiento del sistema de AA ha sido evaluada para el italiano. La combinación de TERSEO con diferentes técnicas de AA ha sido evaluada obteniendo resultados satisfactorios, sobre todo, teniendo en cuenta que la extensión automática de TERSEO al italiano no ha sido supervisada manualmente y el proceso se ha realizado de manera completamente automática.

    • English

      This paper presents the automatic extension of TERSEO system to other languages combined with the use of Machine Learning (ML) techniques. In particular, in this paper, Italian temporal expression recognition is treated and two different ML techniques have been proven: Maximum Entropy Model and Hidden Markov Model. Every system has been evaluated independently and combined afterwards in order to analyze if the system is improving the results in the combination without increasing the number of erroneous expressions in the same percentage. TERSEO system was previously combined with ML techniques for English obtaining good results. In this paper, TERSEO plus ML has been evaluated for Italian. When TERSEO system is combined with different ML techniques, the results are quite successful, taking into account that the automatic extension of TERSEO system for Italian has not been manually supervised and the whole process has been automatically performed.

  • Referencias bibliográficas
    • Carmona, J., S. Cervell, L. Márquez, M.A. Martí, L. Padró, R. Placer, H. Rodríguez, M. Taulé, y J. Turmó. 1998. Morphosyntactic analysis and...
    • Ferro, L., L. Gerber, I. Mani, B. Sundheim, y G. Wilson. 2005. Tides.2005 standard for the annotation of temporal expressions. Informe técnico,...
    • Ratnaparkhi, Adwait. 1998. Maximum Entropy Models For Natural Language Ambiguity Resolution. Ph.D. tesis, Computer and Information Science...
    • Saquete, E. 2005. Temporal information Resolution and its application to Temporal Question Answering. Phd, Departamento de Lenguages y Sistemas...
    • Saquete, E., P. Martínez-Barco, y R. Muñoz. 2004. Evaluation of the automatic multilinguality for time expression resolution. En DEXA Workshops,...
    • Saquete, E., P. Martínez-Barco, y R. Muñoz. 2002. A grammar-based system to solve temporal expressions in spanish texts. En Springer-Verlag,...
    • Saquete, E., R. Muñoz, y P. Martínez-Barco. 2005. Event ordering using terseo system. Data and Knowledge Engineering Journal, página (To be...
    • Schröder, Ingo. 2002. A case study in partof-speech tagging using the icopost toolkit. Informe Técnico FBI-HH-M-314/02, Department of Computer...

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno