Ir al contenido

Documat


Resumen de Construcción de un corpus etiquetado sintácticamente para el euskera

Itziar Aduriz Árbol académico, Izaskun Aldezabal Roteta Árbol académico, María Jesús Aranzabe Urruzola, Bertol Arrieta Kortajarena, José María Arriola Egurrola, Aitziber Atutxa Salazar, Arantza Díaz de Ilarraza Sánchez Árbol académico, Koldobika Gojenola Galletebeitia Árbol académico, Maite Oronoz Anchordoqui Árbol académico, Kepa Mirena Sarasola Gabiola Árbol académico

  • español

    El objetivo de este trabajo es la construcción de un corpus anotado sintácticamente para el euskera. En esta comunicación presentaremos, en primer lugar, las bases sobre las que se asienta nuestro etiquetado. Tras examinar diversas opciones se optó por el esquema presentado por (Carrol et al., 1998). Este esquema sigue los estándares EAGLES y se basa en la idea de añadir a cada frase del corpus una serie de relaciones gramaticales que especifican la dependencia existente entre el núcleo y sus modificadores. Una vez presentado el formalismo de etiquetado, se expondrán los problemas que hemos encontrado en nuestra tarea y las decisiones tomadas. Seguidamente se describirá un ejemplo concreto en el que se muestra la aplicación de dicho esquema sobre un corpus inicial. Finalmente, presentaremos las conclusiones sobre la idoneidad del esquema al euskera y trabajo futuro.

  • English

    The aim of this work is the construction of a syntactically annotated treebank for Basque. In this paper we present first, the basis of the annotation. After examining several options we chose the scheme presented in (Carrol et al., 1998). It follows the EAGLES standards and it is based on the idea of adding to each sentence in the corpus a series of grammatical relations specifying the dependencies between modifiers and their nucleus. After the formalism has been presented, we will describe the problems we have found and the decisions we have taken to solve them. Next we present an example showing the application of the scheme to an initial corpus. Finally, we present the main conclusions about the applicability to Basque and future work.


Fundación Dialnet

Mi Documat