Ir al contenido

Documat


Rendimiento de bases de datos columnares

  • Morales-Morales, Mario Raul [1] ; Durán-Cazar, Jhonatan W. [2] ; Tandazo-Gaona, Eduardo J. [2] ; Morales Cardoso, Santiago [2]
    1. [1] Universidad Central

      Universidad Central

      Hospital, Costa Rica

    2. [2] Universidad Central del Ecuador

      Universidad Central del Ecuador

      Quito, Ecuador

  • Localización: Ingenius: Revista de Ciencia y Tecnología, ISSN 1390-650X, ISSN-e 1390-860X, Nº. 22, 2019 (Ejemplar dedicado a: julio-diciembre), págs. 47-58
  • Idioma: español
  • DOI: 10.17163/ings.n22.2019.05
  • Títulos paralelos:
    • Performance of columnar database
  • Enlaces
  • Resumen
    • español

      En la actualidad para el éxito de las empresas es decisiva la capacidad de procesar de manera eficiente una considerable cantidad de datos de una amplia gama de fuentes en cualquier lugar y momento. El análisis de datos se convierte en una estrategia clave para la mayoría de las grandes organizaciones para lograr una ventaja competitiva. Por tanto, surgen nuevas cuestiones a ser tomadas en cuenta a la hora de almacenar y consultar cantidades masivas de datos que, en general, las bases de datos relacionales tradicionales no pueden abarcar. Estas cuestiones incluyen desde la capacidad de distribuir y escalar el procesamiento o el almacenamiento físico, hasta la posibilidad de utilizar esquemas o tipos de datos no usuales. El objetivo principal de la investigación es evaluar el rendimiento de las bases de datos columnares en analítica de datos. Efectuar una comparación con bases de datos de tipo relacional, para determinar su eficiencia, realizando mediciones en distintos escenarios de pruebas. El presente estudio pretende proporcionar (evidencia científica) un instrumento que facilite a los profesionales interesados en la analítica de datos una base para sus conocimientos, al incluir cuadros y tablas comparativos con datos cuantitativos con los que se pueda sustentar las conclusiones de esta investigación. Se usa una metodología aplicada y de diseño descriptivo cuantitativo-comparativo al ser el que mejor se ajusta al estudio de características de eficiencia de bases de datos. En la medición se usa el método de promedios para n número de tomas y se soporta en la herramienta Aqua Data Studio que garantiza una alta confiabilidad al ser un programa especializado para la administración de bases de datos. Finalmente, se ha logrado determinar que las bases columnares tienen un mejor rendimiento en ambientes de análisis de datos.

    • English

      Companies’ capacity to efficiently process a great amount of data from a great variety of sources anywhere and anytime is essential for them to succeed. Data analysis becomes a key strategy for most large organizations to get a competitive advantage. Hence, new issues should be considered when massive amounts of date are to be stored, because traditional relational database are not capable to lodge them. Such questions include aspects that range from the capacity to distribute and escalate the physical storage, to the possibility of using schemes or non-usual types of data. The main objective of this research is to evaluate the performance of the columnar databases in data analysis, comparing them with relational databases, to determine their efficiency using measurements in different test scenarios. The present study seeks to provide (scientific evidence) professionals interested in data analysis with a basic instrument for their knowledge, to include comparative tables with quantitative data that can support the conclusions of this research. A methodology of applied type and quantitative-comparative descriptive design is used, as it is the one of the most appropriate to study database efficiency characteristics. In the measurement, the method of averages is used for a number n of records, and it is supported in the Aqua Data Studio tool that guarantees a high reliability, as a specialized software for the administration of databases. Finally, it has been determined that the columnar databases have a better performance in data analysis environments.

  • Referencias bibliográficas
    • [1] A. B. M. Moniruzzaman and S. A. Hossain, “NoSQL database: New era of databases for big data analytics - classification, characteristics...
    • [2] M. F. Pollo Cattaneo, M. López Nocera, and G. Daián Rottoli, “Rendimiento de tecnologías NoSQL sobre cantidades masivas de datos,” Cuaderno...
    • [3] I. Mihaela-Laura, “Characteristics of in-memory business intelligence,” Informatica Economica, vol. 18, no. 3, pp. 17–25, 2014. [Online]....
    • [4] D. Robles, M. Sánchez, R. Serrano, B. Adárraga, and D. Heredia, “¿Qué características tienen los esquemas NoSQL?” Investigación y desarrollo...
    • [5]M. Marqués, Bases de datos. Universitat Jaume, 2011. [Online]. Available: http://bit.ly/2RcPtS9
    • [6] E. Ramez and B. N. Shamkant, Fundamentals of Database Systems. Pearson Education., 2015. [Online]. Available: http://bit.ly/2IG3pAk
    • [7] G. Hahn and J. Packowski, “A perspective on applications of in-memory analytics in supply chain management,” Decision Support Systems,...
    • [8] H. Plattner and B. Leukert, The In-Memory Revolution. Springer, 2015. [Online]. Available: http://bit.ly/2F3ezhO
    • [9] M. R. Morales Morales and S. L. Morales Cardoso, “Inteligencia de negocios basada en bases de datos in-memory,” Revista Publicando, vol....
    • [10] R. Babeanu and M. Ciobanu, “In-memory databases and innovations in Business Intelligence,” Database Systems Journal, vol. 6, no. 1, pp....
    • [11] V. D. Shetty and S. J. Chidimar, “Comparative study of SQL and NoSQL databases to evaluate their suitability for big data application,”...
    • [12] A. T. Kabakus and R. Kara, “A performance evaluation of in-memory databases,” Journal of King Saud University - Computer and Information...
    • [13] M. T. González-Aparicio, M. Younas, J. Tuya, and R. Casado, “Testing of transactional services in NoSQL key-value databases,” Future...
    • [14] A. Nayak, A. Poriya, and D. Poojary, “Type of NoSQL databases and its comparison with relational databases,” International Journal of...
    • [15] S. Simon, “Report to brewer’s original presentation of his CAP theorem at the symposium on principles of distributed computing (PODC)...
    • [16] E. Brewer, “Cap twelve years later: How the ‘rules’ have changed,” Computer, vol. 45, no. 2, pp. 23–29, Feb 2012. [Online]. Available:...
    • [17] M. Indrawan-Santiago, “Database research: Are we at a crossroad? Reflection on NoSQL,” in 2012 15th International Conference on Network-Based...
    • [18] GENBETA, NoSQL: clasificación de las bases de datos según el teorema CAP. GENBETA, 2019. [Online]. Available: http://bit.ly/2WHVvR4
    • [19] R. D. L. Engle, B. T. Langhals, M. R. Grimaila, and D. D. Hodson, “Evaluation criteria for selecting NoSQL databases in a single-box...
    • [20] Crowd, Best Relational Databases Software. Crowd. Inc, 2019. [Online]. Available: http://bit.ly/2RbQPge
    • [21] DB-Engines. (2019) Db-engines ranking of wide column stores. [Online]. Available: http://bit.ly/2KOBYHs
    • [22] Kaggle, Corporación Favorita Grocery Sales Forecasting, 2019. [Online]. Available: http://bit.ly/2F7QYMS
    • [23] J. W. Durán Cazar, E. J. Tandazo Gaona, and M. R. Morales Morales, Estudio del rendimiento de una base de datos columnar en el análisis...

Fundación Dialnet

Mi Documat

Opciones de artículo

Opciones de compartir

Opciones de entorno