Ir al contenido

Documat


Resumen de Propositional Knowledge: Acquisition and Application to Syntactic and Semantic Parsing

Bernardo Cabaleiro Barciela

  • español

    La interpretación de lenguaje natural es uno de los retos centrales en el desarrollo de la inteligencia artificial. En general, la interpretación requiere construir un contexto de información implícita e implicada (a partir del conocimiento antecedente del emisor y el oyente) que permite recuperar la intención comunicativa del emisor. Las tareas de procesamiento de lenguaje natural son realizaciones concretas de nuestra habilidad humana para comprender y usar lenguaje, y por lo tanto a largo plazo tendremos que proveer capacidades completas de interpretación a las máquinas, empezando con el desarrollo de métodos para adquirir y usar conocimiento antecedente. En concreto, exploramos el uso de proposiciones como conocimiento antecedente y su utilidad para la interpretación del lenguaje. Las proposiciones codifican conocimiento en forma de aserciones utilizando lenguaje natural, y proporcionan una manera directa de expresar conocimiento sin restricciones de dominio. El conocimiento proposicional puede ser derivado directamente desde representaciones semánticas del texto, que a su vez pueden ser obtenidas automáticamente a partir de texto. De esta manera, se abre la posibilidad de conectar de manera directa la representación de un texto con el conocimiento necesario para su interpretación. En esta tesis, proponemos la adquisición automática de conocimiento proposicional desde grandes corpus cuyos documentos son representados como grafos. Las frecuencias de ocurrencia permiten expresar un sentido de plausibilidad. El almacén de proposiciones resultante supone un término medio entre representaciones semánticas y bases de conocimiento estructuradas. Esto abre nuevas líneas de investigación que abordamos en este trabajo. Por una parte, la conexión entre la representación semántica y los almacenes de proposiciones de manera que estos jueguen el papel del conocimiento antecedente que habilita una inferencia. Por otra parte, la correspondencia (mapping) entre los almacenes de proposiciones y las bases de conocimiento estructurado. Exploramos estas líneas de investigación con sendas tareas específicas relacionadas con la comprensión del lenguaje: el análisis sintáctico y el análisis semántico. Específicamente para análisis sintáctico, abordamos el problema de la corrección de aposiciones. Las aposiciones son estructuras gramaticales que se usan frecuentemente para expresar que una instancia pertenece a una clase semántica. Usamos conocimiento proposicional para medir la compatibilidad semántica entre entidades y tipos de entidad con clases semánticas. Posteriormente empleamos esta información para desambiguar casos donde hay varios candidatos gramaticalmente válidos para gobernar una aposición. Respecto al análisis semántico, construimos un diccionario que permite enlazar expresiones en lenguaje natural en forma de proposiciones con relaciones de una base de datos estructurada, y mostramos cómo utilizar este recurso en un sistema de búsqueda de respuestas (Question Answering). Adicionalmente, proponemos un método para evaluar el proceso de enlazado (grounding) y el efecto en la tarea que tiene el diccionario obtenido, independientemente del proceso de entrenamiento y cableado de consultas. El uso de conocimiento proposicional en inferencias textuales representa un nuevo paradigma para la interpretación del lenguaje. El objetivo es validar este paradigma y explorar desde él las principales áreas involucradas: representación semántica de los textos, adquisición de conocimiento antecedente y habilitación de inferencias textuales. Los resultados obtenidos muestran que los almacenes de proposiciones son un recurso general que permite abordar tareas muy dispares relacionadas con la interpretación del lenguaje, abriendo así nuevas y prometedoras líneas de investigación.

  • English

    Interpretation of natural language is one of the central challenges for the development of an artificial intelligence. In general, interpretation requires to build a context of entailed implicit information (from hearer and speaker background knowledge) that permits to recover the original communicative intention. Natural language processing tasks are concrete realizations of our human ability to comprehend and use language, thus in the long term we will need to provide full interpretation capabilities to machines, starting with the development of methods to acquire and use background knowledge. We explore the use of propositions as background knowledge and its utility for language interpretation. Propositions encode knowledge in the form of assertions using natural language, and provide a straightforward way of expressing knowledge without domain restrictions. Propositional knowledge can be derived directly from meaning representations that, in turn, can be obtained directly from text, and therefore, knowledge and representations can be easily connected to perform the textual inferences required for language interpretation. In this thesis, we propose the automatic acquisition of propositional knowledge from large corpora whose documents are represented as graphs. The frequencies of occurrence permit to express a sense of plausibility. The resulting proposition store supposes a middle ground between meaning representations and structured knowledge bases. This opens new research lines that we address in this work. One the one hand, the connection of the meaning representation with the proposition stores so that they can play the role of the background knowledge that enables an inference. On the other hand, the mapping between proposition stores and structured knowledge bases. We explore these research lines with two specific tasks related to natural language understanding: syntactic and semantic parsing. Specifically for syntactic parsing, we address the problem of appositive correction. Appositives are grammatical dependencies that are often used to express that an instance belongs to a semantic class. We use propositional knowledge to measure the semantic compatibility between entities and entity types with semantic classes. Then we use this information to disambiguate cases where there are several grammatical valid candidates to govern an apposition. Regarding semantic parsing, we build a lexicon that permits to map natural language utterances in the form of propositions with linked data relations, and show how to use this resource in a question answering system. In addition, we propose a method to evaluate grounding and the effect that the lexicon has in the task, independently from the processes of training or querying. Using propositional knowledge for textual inference represents a new paradigm for language interpretation. The goal is to validate this paradigm and to explore from it the main areas involved: meaning representation, knowledge acquisition and textual inferences. Results show that proposition stores are a general purpose resource that permit to address different tasks related to language interpretation, opening new and promising research avenues.


Fundación Dialnet

Mi Documat