Ir al contenido

Documat


Parsing schemata for practical text analysis

  • Autores: Carlos Gómez Rodríguez Árbol académico
  • Directores de la Tesis: Manuel Vilares Ferro (dir. tes.) Árbol académico, Miguel Á. Alonso (dir. tes.) Árbol académico
  • Lectura: En la Universidade da Coruña ( España ) en 2009
  • Idioma: inglés
  • Tribunal Calificador de la Tesis: John A, Carroll (presid.) Árbol académico, Jesús Vilares (secret.) Árbol académico, Leo Wanner (voc.) Árbol académico, Víctor Jesús Díaz Madrigal (voc.) Árbol académico, Giorgio Satta (voc.) Árbol académico
  • Texto completo no disponible (Saber más ...)
  • Resumen
    • Esta tesis presenta varias herramientas teóricas y prácticas, con el objetivo común de acercar la teoría de esquemas de análisis sintáctico de Sikkel a las necesidades prácticas que surgen en el desarrollo de analizadores sintácticos para textos en lenguaje natural, Para ello, desde un punto de vista práctico, se presenta un compilador que permite generar automáticamente implementaciones eficientes de analizadores sintácticos a partir de sus descripciones formales en forma de esquemas de análisis. A continuación, se muestra el uso de este sistema para obtener implementaciones de diversos analizadores conocidos para gramáticas independientes del contexto y gramáticas de adjunción de árboles; y se lleva a cabo un estudio del rendimiento empírico de los analizadores aplicando estas implementaciones a gramáticas de lenguaje natural.

      Por otra parte, desde un punto de vista teórico, se presentan dos extensiones de la teoría de esquemas de análisis sintáctico, que permiten a este formalismo describir dos nuevos tipos de analizadores que, a pesar de ser de gran utilidad práctica, no eran cubiertos hasta el momento por esta teoría. La primera extensión es para analizadores sintácticos con corrección de errores, que son algoritmos capaces de analizar frases agramaticales de forma robusta. Además de la propia extensión, se define también una transformación que permite añadir automáticamente la capacidad de corrección de errores a analizadores que no la poseen.

      La segunda extensión define una variante de los esquemas de análisis sintáctico para analizadores de dependencias, que son algoritmos que representan la estructura de las frases como un conjunto de enlaces entre sus palabras. Este formalismo se utiliza para comparar y relacionar entre sí varios de los analizadores de dependencias más conocidos, tanto proyectivos como no proyectivos; además de para resolver el problema abierto de analizar eficientemente estructuras de dependencias suavemente no proyectivas, definiendo analizadores nuevos para varios de estos conjuntos de estructuras.

      En conjunto, los resultados descritos en esta tesis proporcionan al desarrollador de analizadores sintácticos unos fundamentos formales comunes que pueden ser utilizados para diseñar, analizar y comparar diferentes clases de analizadores, incluyendo aquéllos con corrección de errores y los basados en dependencias; además de herramientas prácticas para obtener implementaciones eficientes de estos analizadores de forma automática, partiendo de su representación formal.


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno