Esta tesis se centra en el procesamiento de la información temporal, que es una tarea enmarcada en el campo del procesamiento del lenguaje natural. El objetivo de esta tarea es obtener la representación y ordenación temporal de los eventos expresados en el texto o discurso, lo cual requiere la interpretación automática de las expresiones temporales, los eventos, y sus relaciones temporales.
La mayoría de las aproximaciones actuales están basadas en información morfosintáctica.
Sin embargo, las entidades temporales son, a menudo, ambiguas a ese nivel de análisis lingüístico.
Nuestra hipótesis es que la expresión lingüística del tiempo es un fenómeno semántico y por lo tanto, para obtener un mejor rendimiento, la información temporal debe ser procesada usando también información semántica.
Para probar esta hipótesis, presentamos una aproximación semántica al procesamiento de la información temporal: TIPSem. Se trata de un sistema automático que incluye características basadas en semántica léxica, roles semánticos, y semántica temporal, además de en morfosintaxis.
TIPSem ha sido evaluado a través de la participación en el ejercicio internacional de evaluación TempEval-2.
Los resultados obtenidos avalan la hipótesis presentada y el análisis de los mismos demuestra que las características semánticas favorecen las capacidades de generalización del modelo y ayudan a manejar la ambigüedad morfosintáctica. Estas colusiones se han alcanzado para diferentes lenguas (i.e., inglés, castellano, italiano, y chino), lo que avala la hipótesis a nivel multilingüe. Finalmente, en comparación con el estado de la cuestión, TIPSem ofrece un rendimiento muy competitivo e introduce una mejora notable en el procesamiento de eventos.
Además, TIPSem ha sido aplicado al problema de la representación gráfica de la información temporal.
Se ha desarrollado una interfaz dinámica que ofrece a los usuarios un acceso a la información basado en el tiempo: Time-Surfer. Los resultados obtenidos mediante una evaluación orientada al usuario de esta interfaz demuestran que el rendimiento de TIPSem es también satisfactorio desde un punto de vista extrínseco.
This thesis is focused on temporal information processing, which is a task framed in the field of natural language processing. The aim of this task is to obtain the temporal location and ordering of the events expressed in text or discourse, which requires the automatic interpretation of temporal expressions, events, and the temporal relations between them. The majority of current approaches are based on morphosyntactic knowledge. However, temporal entities are often ambiguous at that language analysis level. Our hypothesis is that the linguistic expression of time is a semantic phenomenon and therefore, to achieve a better extraction performance, temporal information must be processed using semantics. To prove this hypothesis, we present a semantic approach to temporal information processing: TIPSem. This is an automated system that includes features based on lexical semantics, semantic roles, and temporal semantics, in addition to morphosyntactic features. TIPSem has been empirically evaluated through the participation in the TempEval-2 international evaluation exercise and subsequent experiments based on this test. The results obtained firmly support the presented hypothesis and their analysis demonstrates that semantic features aid in handling morphosyntactic ambiguity and favour generalization capabilities. These conclusions have been reached for different languages (i.e., English, Spanish, Italian, and Chinese), which supports the defended hypothesis at a multilingual level. Finally, as compared with the state of the art, TIPSem obtains a very competitive performance level and introduces a remarkable improvement in event processing. TIPSem has been applied to the problem of graphical representation of temporal information. We have developed a dynamic interface which brings users time-based access to information: Time-Surfer. The results obtained through a user-oriented evaluation of this interface demonstrate that TIPSem’s performance is also satisfactory from an extrinsic standpoint.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados