Ir al contenido

Documat


Resumen de Building the Gold Standard for the Surface Syntax of Basque

Arantza Díaz de Ilarraza Sánchez Árbol académico, Rubén Urízar Enbeitia, Itziar González Dios, Itziar Aduriz Árbol académico, María Jesús Aranzabe Urruzola, José María Arriola Egurrola

  • español

    In this paper, we present the process in the construction of SF-EPEC, a 300,000-word corpus syntactically annotated that aims to be a Gold Standard for the surface syntactic processing of Basque. First, the tagset designed for this purpose is described; being Basque an agglutinative language, sometimes complex syntactic tags were needed. We also account for the different phases in the construction of SF-EPEC.

  • English

    En este artículo presentamos el proceso de construcción de SF-EPEC, un corpus de 300.000 palabras, sintácticamente anotado, que pretende ser un Gold Standard para el procesamiento sintáctico superficial del euskera. En primer lugar, describimos el conjunto de etiquetas diseñado para este propósito; siendo el euskera una lengua aglutinante, en ocasiones hemos tenido que crear etiquetas sintácticas compuestas. Asimismo, se detallan las distintas fases en la construcción de SF-EPEC.


Fundación Dialnet

Mi Documat