Ir al contenido

Documat


Resumen de Analíticas de aprendizaje y análisis estadístico implicativo: comparación de la complejidad temporal de técnicas clúster para bases de datos de tamaño 100000 con variables modales

Rubén Antonio Pazmiño Maji, Marina Leonor Bonilla Lucero, Lourdes Emperatriz Paredes Castelo, Shirley Estefanía Armas Analuisa

  • español

    Al analizar datos provenientes de múltiples procesos económicos, sociales, administrativos, científicos, se tiende a presentar problemas o en ciertos casos llegan a ser procesos irrealizables debido a que no se consideran técnicas óptimas y adecuadas desde el punto de vista de la complejidad temporal (tiempo de ejecución o procesamiento); es por ello por lo que es importante investigar cuáles técnicas clúster son las más rápidas en el procesamiento de información. Las técnicas clúster permiten formar grupos de datos homogéneos con grupos heterogéneos entre sí. El presente trabajo comparó desde el punto de vista de la complejidad temporal las técnicas clúster del Análisis Estadístico Implicativo (ASI) y las de LA (Analíticas de aprendizaje). Para determinar cuál (o cuáles) técnicas son las más rápidas se utilizó una investigación cualitativa pre-experimental del tipo RGXO1, donde RG representa el grupo experimental (aleatorio), X representa el tratamiento que en este caso son las 5 técnicas clúster (3 técnicas de LA y 2 técnicas de ASI) y O es el tiempo de ejecución. Las técnicas Tsim Chic y TcoheChic del ASI se demostraron que son las más rápidas para bases de datos de tamaño 100000 o 1000 observaciones y 100 variables con datos categóricos de hasta 10 categorías, que se sugiere utilizar si se trabaja en hardware no muy actual y se necesitan procesos clúster de rápida ejecución.

  • English

    By analyzing data from multiple economic, social, administrative, scientific processes, etc. there is a tendency to present problems or in certain cases they become unfeasible processes since optimal and adequate techniques are not considered from the point of view of temporal complexity (execution or processing time); That is why it is important to investigate which cluster techniques are the fastest in information processing. Cluster techniques allow to form homogeneous data groups with heterogeneous groups among themselves. The present work compared, from the point of view of temporal complexity, the cluster techniques of Implicative Statistical Analysis (ASI) and those of LA (Learning Analytics). To determine which (or which) techniques are the fastest, pre-experimental qualitative research of the RGXO1 type was used, where RG represents the experimental (random) group, X represents the treatment, which in this case are the 5 cluster techniques (3 techniques LA and 2 ASI techniques) and O is the execution time. The ASI TsimChic and TcoheChic techniques were shown to be the fastest for databases of size 100,000 or 1000 observations and 100 variables with categorical data of up to 10 categories, which is suggested to be used if you are working on not very current hardware and need fast-running cluster processes.

  • português

    Ao analisar dados de múltiplos processos econômicos, sociais, administrativos e científicos, tende a haver problemas ou em alguns casos tornam-se processos impraticáveis porque não são considerados técnicas óptimas e adequadas do ponto de vista da complexidade temporal (tempo de execução ou processamento); é por isso que é importante investigar quais as técnicas de agrupamento que são as mais rápidas no processamento da informação. As técnicas de agrupamento permitem a formação de grupos de dados homogéneos com grupos heterogéneos. O presente trabalho comparou, do ponto de vista da complexidade temporal, as técnicas de agrupamento da Análise Estatística Implicativa (SIA) e da LA (Análise de Aprendizagem). Para determinar que técnica (ou técnicas) é (são) a mais rápida, foi utilizada uma investigação qualitativa pré-experimental do tipo RGXO1, onde RG representa o grupo experimental (aleatório), X representa o tratamento, que neste caso são as 5 técnicas de cluster (3 técnicas LA e 2 técnicas ASI) e O é o tempo de execução. As técnicas ASI TsimChic e TcoheChic mostraram ser as mais rápidas para bases de dados de tamanho 100000 ou 1000 observações e 100 variáveis com dados categóricos até 10 categorias, que são sugeridas para serem utilizadas se estiver a trabalhar em hardware pouco actual e necessitar de processos de cluster de execução rápida.


Fundación Dialnet

Mi Documat