Ir al contenido

Documat


A morphological analyser for K’iche’

  • Autores: Ivy Richardson, Francis M. Tyers
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 66, 2021, págs. 99-109
  • Idioma: inglés
  • Títulos paralelos:
    • Un analizador morfológico para el idioma k’iche’
  • Enlaces
  • Resumen
    • español

      Este artículo describe el desarrollo de un modelo computacional de la morfología quiché. La lengua quiché es una lengua maya que se habla en Guatemala. Es un idioma del tipo aglutinante con morfología de prefijos y sufijos. Tanto la morfología verbal como la morfología nominal son complejos a un nivel moderado. El quiché es una lengua de pocos recursos computacionales y esta publicación es la primera que describe una herramienta computacional para el idioma, y alguna de las primeras para cualquier lengua del grupo maya. La herramienta está desarrollada con HFST, una caja instrumentos para implantar transductores de estados finitos. Una evaluación indica que la cobertura de vocabulario está adecuada, entre 86% y 96% calculado sobre diversos corpus libres. Una evaluación manual indica una sensibilidad por 90% sobre un conjunto de pruebas anotadas a mano. Tanto el analizador como el conjunto de pruebas están disponibles bajo una licencia de software libre.

    • English

      This paper describes the development of a free/open-source computational morphological description for K’iche’, a Mayan language spoken in Guatemala. The language is of the agglutinative morphological type, with both prefixing and suffixing morphology. Both the nominal and verbal morphology are moderately complex. K’iche’ is under-resourced and this is the first publication describing a computational tool for the language, and one of the first publications describing a computational tool for any language of the Mayan group. We use the Helsinki Finite-State Toolkit (HFST) for implementing the finite-state transducer. An automatic evaluation of the coverage of our implementation shows that the coverage is adequate, between 86% and 96% on range of freely available corpora. A manual evaluation gives a recall of over 90% over a hand-annotated test set. Both the analyser and the hand-annotated test set are available under a free/open-source licence.

  • Referencias bibliográficas
    • Academia de Lenguas Mayas de Guatemala. 2004. K’iche’ Choltzij. ALMG. 2nd Edition.
    • Can Pixabaj, T. A. 2017. K’iche’. In J. Aissen, N. C. England, and R. Zavala Maldonado, editors, The Mayan Languages. Routledge, Oxford.
    • Christenson, A. 2006. K’iche’–English dictionary. http://www.famsi.org/ mayawriting/dictionary/christenson/ index.html.
    • Conferencia Episcopal de Guatemala. 2011. Diccionario K’iche’–Español.
    • Forcada, M. L., M. Ginestí-Rosell, J. Nordfalk, J. O’Regan, S. Ortiz-Rojas, J. A. Pérez-Ortiz, F. Sánchez-Martínez, G. Ramírez-Sánchez, and...
    • Gasser, M. 2009. Semitic morphological analysis and generation using finite state transducers with feature structures. In Proceedings of the...
    • Greece, March. Association for Computational Linguistics. Gasser, M. 2011. Computational morphology and the teaching of indigenous languages....
    • Gobierno de Guatemala. 2008. Q’atojtzij rajilib’al 57-2008: Q’atb’altzij re ukujik che uya’ik ub’ixik uwach tinamit. [Decreto Número 57-2008:...
    • INE. 2018. XII Censo Nacional de Población y VII de Vivienda. http://redatam.censopoblacion. gt/bingtm/RpWebEngine.exe/Portal? BASE=CPVGT2018.
    • Ixchajchal Batz, E. A., L. M. Cumez, and C. D. López Ixcoy. 1996. Gramática del idioma k’iche’. Proyecto Lingüístico Francisco Marroquín,...
    • Koskenniemi, K. 1983. Two-level Morphology: A General Computational Model for Word-Form Recognition and Production. Ph.D. thesis, Helsingin...
    • Kuhn, J. and B. Mateo-Toledo. 2004. Applying computational linguistic techniques in a documentary project for Q’anjob’al (Mayan, Guatemala)....
    • Lindén, K., E. Axelson, S. Hardwick, T. Pirinen, and M. Silfverberg. 2011. HFST— framework for compiling and applying morphologies. Communications...
    • Morales Mancilla, J. A., H. Guerra Crespo, G. B. Nango Solís, I. Valles López, and A. G. Cossio Martínez. 2011. Traductor del lenguaje español...
    • Moseley, C. 2010. Atlas of the world’s languages in danger. http://www.unesco.org/culture/en/endangeredlanguages/atlas.
    • Nivre, J., M.-C. de Marneffe, F. Ginter, J. Hajič, C. D. Manning, S. Pyysalo, S. Schuster, F. Tyers, and D. Zeman. 2020. Universal dependencies...
    • Romero, S., I. Carvajal, M. Sattler, J. M. Tahay Tzaj, C. Blyth, S. Sweeney, P. Kyle, N. Steinfeld Childre, D. G. Tambriz, L. E. Tambriz,...
    • Silfverberg, M. and F. M. Tyers. 2019. Datadriven morphological analysis of nominal morphology for Uralic languages. In Proceedings of the...
    • Tol Ciprián, C., D. D. Oxlaj Tistoj, E. Velásquez Vicente, H. Calel Vicente, J. G. Calva Loarca, J. A. Vásquez Ajpop, J. J. Menchú Ordóñez,...
    • Wycliffe Bible Translators. 2011. Ru Loq’ Pixab’ Ri Dios. Wycliffe Bible Translators. https://ebible.org/Scriptures/ details.php?id=qucNNT

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno