Ir al contenido

Documat


Pre-procesamiento de datos educativos desde un enfoque de dominio específico

  • Emilcy Juliana Hernández-Leal [1] ; Juary Costa-Rocha [2] ; Néstor Darío Duque-Méndez [3] Árbol académico
    1. [1] Universidad de Medellín

      Universidad de Medellín

      Colombia

    2. [2] Universidade Federal de Santa Catarina

      Universidade Federal de Santa Catarina

      Brasil

    3. [3] Universidad Nacional de Colombia

      Universidad Nacional de Colombia

      Colombia

  • Localización: Respuestas, ISSN 0122-820X, ISSN-e 2422-5053, Vol. 27, Nº. 1, 2022 (Ejemplar dedicado a: ENERO - ABRIL 2022), págs. 22-37
  • Idioma: español
  • DOI: 10.22463/0122820X.3113
  • Títulos paralelos:
    • Educational data pre-processing from a domain-specific approach
  • Enlaces
  • Resumen
    • español

      Los procesos de análisis de datos requieren preprocesamiento antes de la aplicación de técnicas o algoritmos, con el fin de incrementar la calidad de estos y adecuarlos a los formatos necesarios para su procesamiento, principalmente cuando los datos provienen de diferentes fuentes. El presente artículo expone la experiencia en el diseño y construcción de una estrategia con enfoque de dominio específico para el proceso de preparación de datos educativos. La metodología del estudio incluyó tres etapas: (1) diseño y construcción de la estrategia para preparación de los datos educativos, (2) reconocimiento y selección de datos y (3) aplicación de la estrategia y revisión de resultados. El caso de estudio estuvo conformado por datos provenientes del sistema de educación básica y media del departamento Norte de Santander (Colombia). Se contó con datos referentes al proceso de matrícula, los cuales incluyen variables de tipo socioeconómico y familiar y con datos de valoraciones de desempeño académico de estudiantes provenientes de tres instituciones educativas de carácter público. Para las dos fuentes se procesaron datos de los años 2014 a 2018, con un total de más de ochocientos mil registros. Este trabajo aporta valor en tres aspectos principalmente: el alcance respecto al nivel educativo de dónde provienen los datos del caso de estudio, la inclusión del enfoque de dominio específico en la solución y la centralización de los datos de las múltiples fuentes, resultando datos disponibles para posteriores procesos de análisis. En conclusión, este trabajo contribuyó tanto en el ámbito investigativo como en la aplicación del conocimiento en un caso existente y abrió la posibilidad de realizar pruebas posteriores con otro tipo de datos del contexto educativo

    • English

      The data analysis processes to discover knowledge require pre-processing before applying techniques or algorithms to increase the quality of the data and adapt them to the formats that are best suited for processing, especially when the data comes from different sources. This article presents the experience in designing and constructing a strategy with a specific domain approach for the educational data preparation process. The study methodology included three stages: (1) design and construction of the strategy, (2) recognition and data selection, and (3) application of the strategy and review of results. The study was made up of data from the primary and secondary education system in the Norte de Santander department (Colombia). In addition, there was data referring to the enrollment process, which includes socioeconomic and family variables and data from evaluations of students' academic performance from three public educational institutions. For the two sources, data were processed from 2014 to 2018, with more than eight hundred thousand records. This work adds value in three main aspects: the scope concerning the educational level where the case study data comes from, the inclusion of the domain-specific approach in the solution, and the centralization of the data from multiple sources, resulting in data available in subsequent analysis processes. In conclusion, this work contributed both in the research field and applying knowledge in an existing case. Furthermore, it opened the possibility of carrying out subsequent tests with other data types from the educational context

  • Referencias bibliográficas
    • [1] A. L’Heureux, K. Grolinger, H. F. Elyamany, and M. A. M. Capretz, “Machine Learning with Big Data: Challenges and Approaches,”...
    • [2] K. Kasemsap, “Knowledge discovery and data visualization: theories and perspectives,” Int. J. Organ. Collect. Intell., vol. 7, no. 3,...
    • [3] M. Couceiro and A. Napoli, “Elements about exploratory, knowledge-based, hybrid, and explainable knowledge discovery,” in ormal Concept...
    • [4] B. Oliveira and O. Belo, “On the specification of extract, transform, and load patterns behavior: A domain-specific language approach,”...
    • [5] T. Costello and L. Blackshear, “What Is ETL?,” in Prepare Your Data for Tableau, Apress, 2020, pp. 1–3.
    • [6] R. Wang et al., “Review on mining data from multiple data sources,” Pattern Recognit. Lett., vol. 109, pp. 120–128, Jul. 2018, doi:...
    • [7] Y. Roh, G. Heo, and S. E. Whang, “A Survey on Data Collection for Machine Learning: A Big Data-AI Integration Perspective,” IEEE Trans....
    • [8] V. Debroy, L. Brimble, and M. Yost, “NewTL: Engineering an extract, transform, load (ETL) software system for business on a very large...
    • [9] F. Bellifemine, G. Fortino, R. Giannantonio, R. Gravina, A. Guerrieri, and M. Sgroi, “SPINE: a doma-specific framework for rapid prototyping...
    • [10] G. Desolda, C. Ardito, and M. Matera, “Empowering end users to customize their smart environments: Model, composition paradigms, and...
    • [11] A. Iung et al., “Systematic mapping study on domain-specific language development tools,” Empir. Softw. Eng., vol. 25, no. 5, pp. 4205–4249,...
    • [12] M. Beg, R. A. Pepper, and H. Fangohr, “User interfaces for computational science: A domain specific language for OOMMF embedded...
    • [13] P. Selvaraj, V. K. Burugari, D. Sumathi, R. K. Nayak, and R. Tripathy, “Ontology based Recommendation System for Domain...
    • [14] J. Samuelsen, W. Chen, and B. Wasson, “Integrating multiple data sources for learning analytics—review of literature,” Res. Pract....
    • [15] M. S. Mussa, S. C. Souza, E. F. S. Freire, R. G. Cordeiro, and H. R. M. Hora, “Business intelligence in education: an application of...
    • [16] G. G. W. Mhon and N. S. M. Kham, “ETL Preprocessing with Multiple Data Sources for Academic Data Analysis,” Feb. 2020, doi: 10.1109/ICCA49400.2020.9022824.
    • [17] J. vom Brocke, A. Hevner, and A. Maedche, “Introduction to Design Science Research,” pp. 1–13, 2020, doi: 10.1007/978-3-030-46781-4_1.
    • [18] Ministerio de Educación Nacional, “Sistema educativo colombiano ,” 2020. https://www.mineducacion.gov.co/portal/Preescolar-basica-y-media/Sistema-de-educacion-basica-y-media/233839:Sistema-educativo-colombiano...
    • [19] M. A. Fernández Sáenz, “Desarrollo de un modelo de calidad de datos aplicado a una solución de inteligencia de negocios en una institución...
    • [20] N. D. Duque-Méndez, E. J. Hernández-Leal, A. Pérez Zapata, A. Arroyave Tabares, and D. Espinosa Gómez, “Modelo para el proceso de...
    • [21] G. Jayashree and C. Priya, “Comprehensive Guide to Implementation of Data Warehouse in Education,” in Intelligent Computing...
    • [22] Instituto Colombiano para la Evaluación de la Educación (Icfes), “Portal Icfes,” 2019. https://www.icfes.gov.co/web/guest/funciones-icfes...

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno