Ir al contenido

Documat


Resumen de Rendimiento de bases de datos columnares

Mario Raúl Morales Morales, Jhonatan W. Durán Cazar, Eduardo J. Tandazo Gaona, Santiago Morales Cardoso

  • español

    En la actualidad para el éxito de las empresas es decisiva la capacidad de procesar de manera eficiente una considerable cantidad de datos de una amplia gama de fuentes en cualquier lugar y momento. El análisis de datos se convierte en una estrategia clave para la mayoría de las grandes organizaciones para lograr una ventaja competitiva. Por tanto, surgen nuevas cuestiones a ser tomadas en cuenta a la hora de almacenar y consultar cantidades masivas de datos que, en general, las bases de datos relacionales tradicionales no pueden abarcar. Estas cuestiones incluyen desde la capacidad de distribuir y escalar el procesamiento o el almacenamiento físico, hasta la posibilidad de utilizar esquemas o tipos de datos no usuales. El objetivo principal de la investigación es evaluar el rendimiento de las bases de datos columnares en analítica de datos. Efectuar una comparación con bases de datos de tipo relacional, para determinar su eficiencia, realizando mediciones en distintos escenarios de pruebas. El presente estudio pretende proporcionar (evidencia científica) un instrumento que facilite a los profesionales interesados en la analítica de datos una base para sus conocimientos, al incluir cuadros y tablas comparativos con datos cuantitativos con los que se pueda sustentar las conclusiones de esta investigación. Se usa una metodología aplicada y de diseño descriptivo cuantitativo-comparativo al ser el que mejor se ajusta al estudio de características de eficiencia de bases de datos. En la medición se usa el método de promedios para n número de tomas y se soporta en la herramienta Aqua Data Studio que garantiza una alta confiabilidad al ser un programa especializado para la administración de bases de datos. Finalmente, se ha logrado determinar que las bases columnares tienen un mejor rendimiento en ambientes de análisis de datos.

  • English

    Companies’ capacity to efficiently process a great amount of data from a great variety of sources anywhere and anytime is essential for them to succeed. Data analysis becomes a key strategy for most large organizations to get a competitive advantage. Hence, new issues should be considered when massive amounts of date are to be stored, because traditional relational database are not capable to lodge them. Such questions include aspects that range from the capacity to distribute and escalate the physical storage, to the possibility of using schemes or non-usual types of data. The main objective of this research is to evaluate the performance of the columnar databases in data analysis, comparing them with relational databases, to determine their efficiency using measurements in different test scenarios. The present study seeks to provide (scientific evidence) professionals interested in data analysis with a basic instrument for their knowledge, to include comparative tables with quantitative data that can support the conclusions of this research. A methodology of applied type and quantitative-comparative descriptive design is used, as it is the one of the most appropriate to study database efficiency characteristics. In the measurement, the method of averages is used for a number n of records, and it is supported in the Aqua Data Studio tool that guarantees a high reliability, as a specialized software for the administration of databases. Finally, it has been determined that the columnar databases have a better performance in data analysis environments.


Fundación Dialnet

Mi Documat