Spelling Normalisation of Basque Historical Texts

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/96613
Información del item - Informació de l'item - Item information
Título: Spelling Normalisation of Basque Historical Texts
Título alternativo: Normalización de Textos Históricos Vascos
Autor/es: Estarrona Ibarloza, Ainara | Etxeberria Uztarroz, Izaskun | Soraluze, Ander | Padilla, Manuel
Palabras clave: Text normalisation | Digital Humanities | Finite-state technology | Historical Corpus | Diachronic Syntax | Normalización de textos | Humanidades Digitales | Tecnología de estado finito | Corpus Histórico | Sintaxis diacrónica
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2019
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2019, 63: 59-66. doi:10.26342/2019-63-6
Resumen: This paper presents a computational method and its evaluation in a real scenario with the aim of normalising Basque historical texts in order to be analysed using standard Natural Language Processing tools (NLP). This normalisation work is part of a more general ongoing project called Basque in the Making (BIM): A Historical Look at a European Language Isolate, whose main objective is the systematic and diachronic study of a number of grammatical features of the Basque language. | En este artículo se presenta y evalúa en un entorno real un método computacional con el objetivo de normalizar textos históricos vascos para que, una vez normalizados, puedan ser analizados con herramientas estándar de Procesamiento del Lenguaje Natural (PLN). Este trabajo de normalización forma parte de un proyecto en curso más general llamado Basque in the Making (BIM): A Historical Look at a European Language Isolate, cuyo objetivo principal es el estudio sistemático y diacrónico de ciertas características gramaticales de la lengua vasca.
Patrocinador/es: The research leading to these results was carried out as part of the BIM project (Agence Nationale de la Recherche, France) and the BERBAOLA project (Basque Government funding, Elka-rtek KK-2017/00043).
URI: http://hdl.handle.net/10045/96613
ISSN: 1135-5948
DOI: 10.26342/2019-63-6
Idioma: eng
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica: si
Versión del editor: https://doi.org/10.26342/2019-63-6
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 63 (2019)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_63_06.pdf1,08 MBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.