Ir al contenido

Documat


Learning to map variation-standard forms in Basque using a limited parallel corpus and the standard morphology

  • Autores: Izaskun Etxeberria Uztarroz, Iñaki Alegría Loinaz Árbol académico, Mans Hulden Árbol académico, Larraitz Uria Garin
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 52, 2014, págs. 13-20
  • Idioma: inglés
  • Títulos paralelos:
    • Aprendizaje de correspondencias variante-est´andar usando un corpus paralelo limitado y la morfolog´ıa del est´andar
  • Enlaces
  • Resumen
    • español

      Este artículo explora tres diferentes métodos de aprendizaje de las variantes de un idioma (formas dialectales o diacrónicas) a partir de un pequeño corpus paralelo suponiendo que la morfología estándar está disponible

    • English

      This paper explores three different methods of learning to map variant word form (dialectal or diachronic) to standard ones from a limited parallel corpus of standard and variant texts, given that a computational description of the standard morphology is available

  • Referencias bibliográficas
    • Alegria, I., Aranzabe, M., Ezeiza, N., Ezeiza, A., and Urizar, R. (2002). Using finite state technology in natural language processing of...
    • Almeida, J. J., Santos, A., and Simoes, A. (2010). Bigorna-a toolkit for orthography migration challenges. In Seventh International Conference...
    • Beesley, K. R. and Karttunen, L. (2002). Finite-state morphology: Xerox tools and techniques. Studies in Natural Language Processing. Cambridge...
    • Hulden, M. (2009). Foma: a finite-state compiler and library. In Proc. of the 12th Conference of the EACL, pages 29-32, Athens, Greece. ACL.
    • Hulden, M., Alegria, I., Etxeberria, I., and Maritxalar, M. (2011). Learning word-level dialectal variation as phonological replacement rules...
    • Kestemont, M., Daelemans, W., and Pauw, G. D. (2010). Weigh your words| memory-based lemmatization for Middle Dutch. Literary and Linguistic...
    • Koskenniemi, K. (1991). A discovery procedure for two-level phonology. Computational Lexicology and Lexicography: A Special Issue Dedicated...
    • Mann, G. S. and Yarowsky, D. (2001). Multipath translation lexicon induction via bridge languages. In Proc. of the second meeting of the NAACL,...
    • Muggleton, S. and De Raedt, L. (1994). Inductive logic programming: Theory and methods. The Journal of Logic Program- ming, 19:629-679.
    • Novak, J. R., Minematsu, N., and Hirose, K. (2012). WFST-based grapheme-tophoneme conversion: Open source tools for alignment, model-building...
    • Scherrer, Y. (2007). Adaptive string distance measures for bilingual dialect lexicon induction. In Proceedings of the 45th Annual Meeting...

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno