Publication:
Classification techniques for time series and functional data

Loading...
Thumbnail Image
Identifiers
Publication date
2010-03
Defense date
2010-07-12
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Impact
Google Scholar
Export
Research Projects
Organizational Units
Journal Issue
Abstract
The main subject of this doctoral thesis is to develop classification techniques for dependent and functional data. Methods for classifying time series and functional data are proposed. Although this work involves several type of data, the functional data play a central role. An important point of both classification methodologies is that the original problems are not directly dealt with: the time series problem is rewritten as a functional data problem while the functional data problem is solved using a multivariate technique. It is worthwhile noticing, however, the different role of the functional data in the two forthcoming proposals: in the time series problem functional estimators are constructed, while in the functional data problem curves are the primary data. For the classification of time series, their integrated periodograms are considered instead. After this, a new element is assigned to the group minimizing the distance from its integrated periodogram to the group mean of integrated periodograms. Although the periodogram is defined only for stationary time series, the application of the methodology to nonstationary series is still possible by computing these periodograms locally. Finally, functional data depth is applied to make the classification robust. On the one hand, the classification of functional data arises naturally in the previous framework. On the other hand, the problem of selecting the more appropriate form to express the data is suggested: crude functions, their integrals or their derivatives. Without loss of generality, this second problem is equivalently formulated in terms of functions and their derivatives of different order, without integrals. In this thesis, a single methodology is proposed to cope with these two tasks at the same time. Following the same criterion of classifying a curve by using the distances from the function or its derivatives to group representative (usually the mean) functions or their derivatives, the combination of those distances is proposed in our method. The proposal works with a multivariate variable de ned in terms of the distances. Besides, an automatic form of ranking the original functions and their derivatives by discriminat power is obtained.--------------------------------------------------------------------------------------------------------------------------------------------------
Esta tesis doctoral introduce técnicas de clasificación para datos dependientes y funcionales. Se proponen sendos métodos para clasificar series temporales y datos funcionales. Aunque este trabajo involucra varios tipos de datos, los datos funcionales desempeñaan un papel central. Un aspecto importante de ambas metodologías de clasificación es que los problemas originales no se afrontan directamente: el problema de series temporales se reescribe como un problema de datos funcionales, mientras que el problema de datos funcionales se resuelve utilizando una técnica multivariante. Por otro lado, también es interesante advertir el papel diferente que los datos funcionales tienen en las dos propuestas que se presentan: en el problema de series temporales se construyen estimadores funcionales, mientras que en el problema de datos funcionales las curvas son los datos primarios. Para el problema de clasificación de series temporales, se consideran sus periodogramas integrados en lugar de las propias series. Un nuevo elemento se asigna al grupo que hace mínima la distancia desde su periodograma integrado hasta la media de los periodogramas integrados del grupo. Aunque el periodograma está definido sólo para series temporales estacionarias, es todavía posible aplicar la metodología a series no estacionarias considerando estos periodogramas localmente. Por ultimo, se aplica la profundidad de datos funcionales para hacer la clasificación robusta. Por un lado, la clasificación de datos funcionales surge de manera natural en el marco de trabajo anterior. Por otro lado, se sugiere el problema de seleccionar la forma más apropiada en la que expresar los datos: las funciones originales, sus integrales o sus derivadas. Sin p erdida de generalidad, este segundo problema se formula equivalentemente en términos de las funciones y de sus derivadas de distintos ordenes, sin integrales. En esta tesis se propone un tipo de metodología para hacer frente a estos dos problemas a la vez. Siguiendo de nuevo el criterio de clasificar una curva utilizando las distancias desde la función o sus derivadas hasta funciones representativas de cada grupo (normalmente la media), nuestro método propone la combinación de estas distancias. La propuesta trabaja con una variable multivariante definida en términos de las distancias. Además, se tiene así una forma automática de ordenar por poder discriminante las funciones originales y sus derivadas.
Description
Keywords
Classification, Time series data, Integrated periodogram, Functional data, Depth, Multivariate data, Discriminant analysis, Weighted distances, Clasificación, Datos de series temporales, Periodograma integrado, Datos funcionales, Profundidad, Datos multivariantes, Análisis discriminante, Distancias ponderadas
Bibliographic citation
Collections