Ir al contenido

Documat


Resumen de IFPTML Algorithms: From Cheminformatics Models to Software Development, StartupCreation, and Innovation Transference

Harbil Bediaga Bañeres

  • español

    La irrupción en escena de las tecnologías de detección de alto rendimiento (HTS) de fármacos ha provocado una explosión en el informe de datos de ensayos preclínicos para nuevos compuestos hit-to-lead con potencial como ingredientes farmacéuticos activos (API) en la industria farmacéutica. El análisis de todos estos datos con técnicas de Inteligencia Artificial (IA) puede conducir al desarrollo de nuevos modelos predictivos. Estos modelos pueden utilizarse a su vez para predecir compuestos más específicos y seguros con la consiguiente reducción de costes en tiempo y recursos en el desarrollo de APIs. Sin embargo, el análisis de AI de esto presenta muchos de los desafíos de los problemas de Big Data. Significa, en pocas palabras, problemas de análisis de datos con cuestiones relacionadas con Volumen, Velocidad, Veracidad, Variabilidad, Valor y Complejidad (5V + C). La primera y la segunda V se explican más o menos por sí mismas y los problemas de Variabilidad, Veracidad, Valor y Complejidad se refieren a datos con problemas de falta de datos, tendencias no consistentes, errores, informes contradictorios, interrelaciones como co-linealidad/co-linealidad. etiquetas dependientes que forman redes complejas, extrapolación de información (múltiples especies, múltiples salidas, múltiples escalas), perturbaciones en múltiples variables de entrada/salida, problemas de etiquetado múltiple, etc. En este contexto, nuestro grupo presentó InformationFusion, Algoritmo de Teoría de Perturbación y Aprendizaje Automático (IFPTML) para facilitar el desarrollo de modelos de salida múltiple de lectura transversal capaces de predecir múltiples resultados de compuestos químicos/fármacos en ensayos preclínicos. Nuestro grupo también ha informado sobre un software llamado SOFT.PTML que es una plataforma de propósito general para el modelado IFPTML. Sin embargo, aún quedan muchos aspectos por cubrir. Muchos problemas, como el descubrimiento de compuestos anticancerígenos y los estudios de ensayos de compuestos alostéricos, no se han analizado con algoritmos IFPTML. Además, aún no se ha informado sobre software fácil de usar específico para estos problemas. Por último, a pesar de la potencial aplicación en la industria, no se ha desarrollado ninguna startup (al inicio de esta tesis) para la transferencia de la tecnología IFPTML a la industria. En consecuencia, el objetivo de esta tesis se centra en primer lugar en el desarrollo de nuevos modelos IFPTML de ensayos de compuestos anticancerígenos y compuestos alostéricos. A continuación, informamos sobre el desarrollo del software LAGA, fácil de usar, para la predicción extrapolada de compuestos anticancerígenos. Por último, se describe la planificación, creación, estructura, servicios, etc. de IKERDATA S.L una nueva startup interuniversitaria enfocada a la transferencia de tecnología IFPTML a empresas gallegas y del País Vasco en primera instancia con perspectivas de proyección hacia España, Europa y a escala global en última instancia. En el Anexo de la tesis se incluye un resumen ampliado de >3000 palabras en idioma castellano (Anexo 3.1).

  • galego

    A irrupción nas tecnoloxías de detección de alto rendemento de drogas (HTS) provocou una explosión no informe de datos de ensaios preclínicos para novos compostos de acerto a plomo con potencial como ingredientes farmacéuticos activos (API) na industria farmacéutica. A análise de todos estes datos con técnicas de Intelixencia Artificial (IA) pode levar ao desenvolvemento de novos modelos preditivos. Estes modelos poden utilizarse á súa vez para predicir compostos máis específicos e seguros que a consecuente redución de custos en tempo e recursos no desenvolvemento de API. Non obstante, a análise da intelixencia artificial presenta moitos dos desafíos dos problemas de Big Data. Significa, en breve, problemas de análise de datos con problemas relacionados co volume, a velocidade, a veracidade, a variabilidade, o valor e a complexidade (5V + C). A primeira e a segunda V son máis ou menos autoexplicativas e as cuestións de Variabilidade, Veracidade, Valor e Complexidade refírese a datos con problemas de falta de datos, tendencias non consistentes, erros, informes contraditorios, interrelacións como co-linealidade/co-linealidade. etiquetas dependentes que forman redes complexas, información de lectura cruzada (multi-especie, multi-saída, multiescala), perturbacións en varias variables de entrada/saída, problemas de multi-etiquetado, etc. Neste contexto, o noso grupo introduciu a fusión de información, Teoría da perturbación e algoritmo de aprendizaxe automática (IFPTML) para facilitar o desenvolvemento de modelos de lectura cruzada de múltiples saídas capaces de predecir múltiples resultados de compostos/fármacos químicos en ensaios preclínicos. O noso grupo tamén informou dun software calle SOFT.PTML que é unha plataforma de propósito xeral para o modelado IFPTML. Non obstante, moitos aspectos aínda están por cubrir. Moitos problemas como o descubrimento de compostos anticanceríxenos, os estudos de ensaios de compostos alostéricos non foron analizados con algoritmos IFPTML. Ademais, aínda non se informou de software específico e amigable para estes problemas. Por último, a pesar da potencial aplicación na industria non se desenvolveu ningunha empresa de inicio (ao comezo desta tese) para a transferencia da tecnoloxía IFPTML á industria. En consecuencia, o obxectivo desta tese céntrase en primeiro lugar no desenvolvemento de novos modelos IFPTML de ensayos de compostos anticanceríxenos e compostos alostéricos. A continuación, informamos do desenvolvemento do software LAGA fácil de usar para a predición de lectura cruzada de compostos anticanceríxenos. Por último, describimos a planificación, creación, estrutura, servizos, etc. de IKERDATA S.L unha nova startup interuniversitaria centrada na transferencia de tecnoloxía IFPTML a empresas galegas e do País Vasco en primeira instancia con perspectivas de España, Europa e Europa. Proxección mundial.

  • English

    The irruption in scence of Drug High Throughput Screening (HTS) technologies has prompted an explosion in the report of pre-clinical assays data for new hit-to-lead compounds with potential as Active Pharmaceutical Ingredients (APIs) in Pharmaceutical Industry. The análisis of all this data with techniques Artificial Intelligence (AI) may lead to the development of new predictive models. These models may be used in turn to predict more specific and safer compounds which the consequent reduction of costs in time and resourcers in APIs development. However, AI analysis of this presents many of the challenges of Big Data problems. It means, shortly, data analysis problems with issues related to Volumen, Velocity, Veracity, Variability, Value, and Complexity(5V + C). The first and second Vs are more or less self-explained and the Variability, Veracity, Value, and Complexity issues refers to data with problems of missing data, not consistent tendencies, errors, contradictory reports, interrelations such as co-llinearity/codependent labels forming complex networks, read-across (multi-species, multi-ouput, multiscale) information, perturbations in multiple input/output variables, multi-labelling problems, etc. In this context, our group introduced the Information Fusion, Perturbation Theory, and Machine Learning (IFPTML) algorithm to facilitate the development of read-across multi-output models able to predict multiple outcomes of chemical compounds/drugs in pre-clinical assays. Our group has also reported a software calle SOFT.PTML which is a general puropose platform for IFPTML modeling. However, many aspects are yet to be covered. Many problems such as anti-cancer compounds discovery, allosteric compounds assays studies have not been analyzed with IFPTML algorithms. In addition, specific user-friendly software for these problemas has not been already reported. Last, despite the potential application in industry no startuptup company was developed (at the beginning of this tesis) for the transference of IFPTML technology to industry. Consequently, the objective of this tesis focus firstly on the development of new IFPTML models of anti-cancer compounds and allosteric compounds assays. Next, we report the development of the user-friendly software LAGA for the read-across prediction of anti-cancer compounds. Last, we describe the planning, creation, structure, services, etc. of IKERDATA S.L a new inter-university startup company focused on the transference of IFPTML technology to Galician and Basque Country companies in the first instance with perspectives of Spain, Europe, and Worldwide proyection.


Fundación Dialnet

Mi Documat