Theoretical studies on Bayesian network classifiers

Varando, Gherardo (2018). Theoretical studies on Bayesian network classifiers. Tesis (Doctoral), E.T.S. de Ingenieros Informáticos (UPM). https://doi.org/10.20868/UPM.thesis.51436.

Descripción

Título:	Theoretical studies on Bayesian network classifiers
Autor/es:	Varando, Gherardo
Director/es:	Bielza Lozoya, María Concepción https://orcid.org/0000-0001-7109-2668 Larrañaga Múgica, Pedro María https://orcid.org/0000-0002-1885-4501
Tipo de Documento:	Tesis (Doctoral)
Fecha de lectura:	2018
Materias:	Informática
Escuela:	E.T.S. de Ingenieros Informáticos (UPM)
Departamento:	Inteligencia Artificial
Licencias Creative Commons:	Reconocimiento - Sin obra derivada - No comercial

Texto completo

Vista Previa

PDF (Portable Document Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (728kB) | Vista Previa

Resumen

En las últimas décadas, el aprendizaje automático ha adquirido importancia como una de las herramientas fundamentales en inteligencia artificial. El incremento en la disponibilidad de datos y capacidad computacional disponible a bajo coste han contribuido a extender los métodos de aprendizaje automático en casi todas las ramas de la tecnología. Mientras que gran parte de la investigación se centra en el desarrollo de nuevos algoritmos y métodos para tratar diferentes problemas, es ampliamente reconocido que el análisis formal y los resultados teóricos son necesarios para entender los algoritmos empleado, sus limitaciones y sus capacidades. El trabajo desarrollado en esta tesis se centra en éste último aspecto de la investigación en aprendizaje automático. Estudiamos los clasificadores con redes Bayesianas y en general clasificadores generativos basados en modelos gráficos probabilísticos. Los modelos gráficos probabilísticos han sido y siguen siendo ampliamente estudiados en estadística y en esta tesis los analizamos en el contexto de uno de los problemas más representativos en aprendizaje automático, la clasificación binaria. Nuestro resultado principal es la descripción, tanto para redes Bayesianas como para modelos de Markov no dirigidos, de las implicaciones de las independencias condicionadas en las funciones de decisión asociadas. En particular, describimos las familias de funciones discriminantes asociadas con las familias de clasificadores con redes Bayesianas más utilizados. Construimos polinomios que interpolan las funciones discriminantes inducidas, describiendo así las funciones de decisión. Gracias a la representación polinomial de las funciones discriminantes somos capaces de acotar el número de decisiones representables por clasificadores con redes Bayesianas. Extendemos estos resultados a clasificadores en cadena para problemas multi etiqueta, analizando su capacidad expresiva asumiendo que los modelos están basados en redes Bayesianas. Por último, describimos un método algebraico y geométrico para estudiar funciones discriminantes de clasificadores generativos bajo propiedades de Markov generales. El método empleado extiende los resultados obtenido en el caso de las redes Bayesianas y describe un marco formal, basado en diferencias finitas, para estudiar las funciones discriminantes de clasificadores generativos. ----------ABSTRACT---------- Machine learning, as one of the fundamental tools of artificial intelligence, has acquired growing importance in the last decades. The increasing availability of large amounts of data and more computational processing power available at a low price have contributed to the spread of machine learning methods in almost all branches of technology. While a great part of the current research focuses on the creation of new algorithms and methods to tackle different problems, it is widely recognized that formal analysis and theoretical results are necessary to really understand the algorithms employed, their limitations and their capabilities. The work developed in the present thesis is focused on this last aspect of the research in machine learning. We study Bayesian network classifiers and in general generative classifiers based on probabilistic graphical models. Probabilistic graphical models are widely studied in the statistic literature and in this thesis we analyze them in the context of one of the most basic problem in machine learning, binary classification. Our main result is a description of the implications, for the induced decision functions, of the conditional independence statements holding in the probability model. We will state results both for a wide class of Bayesian network classifiers and for undirected Markov network classifiers. In particular, we describe the classes of discrimination functions associated with some of the most used Bayesian network classifiers over categorical predictors variables. We obtain polynomials interpolating the induced discrimination functions, and thus representing the corresponding decision functions. Thanks to this characterization we are able to bound the number of decisions representable by Bayesian network classifiers with given structures. We extend the binary classification results to chain multi-label classifiers, analyzing their expressive power when Bayesian network are used as base models. Finally, we describe an algebraic and geometric approach to study discrimination functions of generative classifiers under general Markov properties. The given approach extends the results for Bayesian network classifiers and introduces an elegant framework, based on finite differences, to study discrimination functions of generative classifiers.

Proyectos asociados

Tipo

Código

Acrónimo

Responsable

Título

Gobierno de España

C080020-09

Sin especificar

Cajal Blue Brain Project

Gobierno de España

TIN2013-41592-P

Sin especificar

Gobierno de España

TIN2016-79684-P

Sin especificar

Avances en clasificación multidimensional y detección de anomalías con redes bayesianas

Comunidad de Madrid

S2013/ICE-2845-CASI-CAM-CM

Sin especificar

Francisco Javier Montero

Conceptos y aplicaciones de los sistemas inteligentes

FP7

604102

HBP

ECOLE POLYTECHNIQUE FEDERALE DE LAUSANNE

The Human Brain Project

Horizonte 2020

720270

HBP SGA1

ECOLE POLYTECHNIQUE FEDERALE DE LAUSANNE

Human Brain Project Specific Grant Agreement 1

Universidad Politécnica de Madrid

Sin especificar

Programa Propio 2017 for financing the research stay in the University of Genova.

Más información

ID de Registro:	51436
Identificador DC:	https://oa.upm.es/51436/
Identificador OAI:	oai:oa.upm.es:51436
Identificador DOI:	10.20868/UPM.thesis.51436
Depositado por:	Archivo Digital UPM 2
Depositado el:	07 Sep 2018 07:04
Ultima Modificación:	30 Nov 2022 09:00

Estadísticas

Exportar cita

Editar (sólo personal del Archivo)

En esta página

Menú principal

Buscar

Theoretical studies on Bayesian network classifiers

Cita

Descripción

Texto completo

Resumen

Proyectos asociados

Más información

Acciones

Documentos

Agrupados por ...

Datos Investigación

Financiadores

Especiales

En otros formatos

El repositorio

Redes sociales

Información adicional