Ir al contenido

Documat


Resumen de Servicios de minería de datos en cloud computing

Manuel Jesús Parra Royón

  • Esta tesis aborda el problema de la definición y descripción de servicios de minería de datos en plataformas de Cloud Computing. Cada proveedor de servicios de minería de datos en Cloud Computing tiene su particular modelo de definición de servicios que es incompatible con los demás proveedores, de modo que obliga a rediseñar las aplicaciones o las herramientas que utilicen estos servicios, cuando por ejemplo queremos moverlas a otro proveedor. Para los servicios de minería de datos en Cloud Computing no existe una homogeneización consolidada para la definición entre proveedores que permita describir la experimentación de flujos de trabajo con datos de un modo eficaz y eficiente y que además considere todos los aspectos clave que un proveedor de Cloud necesita gestionar para los servicios. Para resolver este problema de la descripción de servicios de minería de datos en Cloud Computing se ha realizado una propuesta de esquema de servicios basada en tecnología semántica y Linked Data llamada "dmcc-schema".

    Con esta propuesta de servicios semánticos se persiguen dos objetivos básicos:

    1.- Definir y describir el modelado de experimentación con minería de datos como servicio en Cloud Computing.

    2.- Definir y describir el modelado de la gestión y gobierno de estos servicios de minería de datos por parte de los proveedores de Cloud Computing.

    Para poder llevar a cabo estos objetivos se han desarrollado los siguientes estudios:

    A) Diseño de un vocabulario y esquema semántico completo que aborda tanto la definición de la experimentación con minería de datos como la gestión del servicio en los proveedores Cloud Computing. Permite una definición directa y eficiente de servicios de minería de datos con capacidades de descubrimiento, integrabilidad y portabilidad, solucionando el problema del anclaje al proveedor. El esquema no solo se centra en la experimentación con minería de datos (algoritmos, parámetros, funciones, flujos de trabajo, etc.), también tiene en cuenta todos los aspectos relacionados con la gestión del servicio en Cloud (acuerdos de nivel de servicio, interfaces, precios y costes, regiones, autenticación, etc.).

    B) Diseño de una propuesta de arquitectura de despliegue de servicios de minería de datos llamada OC2DM, que permite, a partir de las definiciones de los servicios creados con el esquema diseñado, construir y desplegar el servicio completo de forma que sea completamente funcional. De este modo la plataforma provee de todas las herramientas necesarias para transformar la definición de servicios de minería de datos en elementos directamente consumibles por los usuarios de la plataforma.

    C) Diseño de una herramienta de intermediación (Broker) de servicios de minería de datos en Cloud Computing, que permite la selección, composición e intermediación de este tipo de servicios desde diferentes proveedores. De este modo la propuesta utiliza la definición de servicios diseñada para poder capturar todas las características de los servicios de minería de datos, habilitando un único punto de gestión para la selección y la intermediación de servicios de diferentes proveedores y definiciones de servicios, sin la complicación de tener que lidiar con los detalles de cada uno de los proveedores individuales.

    Para validar la efectividad y la eficiencia del trabajo de tesis, tres casos de uso reales han sido desarrollados:

    1) Intermediación de servicios de minería de datos sobre infraestructuras de computación de Física de Altas Energías en el CERN.

    2) Modelado para la experimentación de flujos de trabajo con series temporales como servicio.

    3) Sistemas difusos como servicio en Cloud Computing (FSaaS).


Fundación Dialnet

Mi Documat