A New Kernel to use with Discretized Temporal Series

Luis González Abril; Francisco Velasco Morente; Juan Antonio Ortega Ramírez; Francisco Javier Cuberos García-Baquero

Ayuda

A New Kernel to use with Discretized Temporal Series

Luis González Abril ^[1] ; Francisco Velasco Morente ; Juan Antonio Ortega Ramírez ^[1] ; Francisco Javier Cuberos García Vaquero ^[2]
1. [1] Universidad de Sevilla
  
  Universidad de Sevilla
  
  Sevilla, España
2. [2] Radio Televisión de Andalucía Department of Planificación
Localización: Computación y Sistemas (CyS), ISSN 1405-5546, ISSN-e 2007-9737, Vol. 11, Nº. 1, 2007, págs. 5-13
Idioma: inglés
Títulos paralelos:
- Un Nuevo Kernel para usar con Series Temporales Discretizadas
Enlaces
- Texto completo
Resumen
- español
  En este artículo, un nuevo kernel (núcleo), procedente de la Teoría del aprendizaje Estadístico, es propuesto para trabajar con cadenas de símbolos obtenidos a través de un proceso de discretización de una variable continua. Aunque para la exacta definición de discretización no es estrictamente necesaria, siempre debe existir una medida de distancia o una medida de similitud entre símbolos en un determinado alfabeto (conjunto de símbolos). Este kernel es aplicado sobre un conjunto de repartos de audiencias en la televisión obtenido de las siete principales cadenas de televisión en Andalucía (España). Una comparativa con objeto de llevar a cabo una clasificación es realizada y la selección de parámetros es estudiada. Finalmente, mencionar que este kernel tiene ciertas implicaciones en el tipo de similaridad considerada las cuales serán estudiadas en futuras investigaciones. La poca influencia del parámetro λ en las tareas de identificación también debe ser analizada.
- English
  In this paper a new Kernel, from statistical learning theory is proposed to work with symbols chains (words) obtained from a discretization procedure of a continuous features. Although the exact definition of the discretization is not strictly necessary, there must always exist either, a measure of distance or a similarity between symbols in a certain alphabet (a set of symbols). This kernel is applied on a set of television shares obtained from the seven main television stations in Andalusia (Spain). A comparative study for classification purposes is done, and the associated parameter selection is studied. Finally, it must be mentioned that this kernel has certain implications in the type of considered similarity that will be studied in further researches. The small influence of the λ parameter in identification tasks must also be discussed.
Referencias bibliográficas
- Cristianini, N.,Shawe-Taylor, J.. (2000). An introduction to Support Vector Machines and other kernel-based learning methods. Cambridge University...
- Cuberos, F.,Ortega, J.A.,Velasco, F.,González, L.. (2003). QSI-Alternative Labelling and Noise Sensitivity. 17 International Workshop on...
- Cuberos, F.,Ortega, J.A.,Velasco, F.,González, L.. (2004). A methodology for qualitative learning in time series. 18 International Workshop...
- González, L.,Gavilán, J.. (2001). Una metodología para la construcción de histogramas: Aplicación a los ingresos de los hogares andaluces....
- González, L.,Velasco, F.,Ángulo, C,Ortega, J.A.,Ruiz, F.. (2004). Sobre núcleos, distancias y similitudes entre intervalos. Inteligencia Artificial....
- Kurgan, L.,Cios, K.. (2004). Caim discretization algorithm. IEEE transactions on Knowledge and Data Engineering. 16. 145-153
- Macskassy, A.,Hirsh, H.,Banerjee, A,Dayanik, A.. (2003). Converting numerical classification into text classification. Artificial Intelligence....
- Sakoe, H.,Chiba, S.. (1978). Dynamic programming algorithm optimisation for spoken word recognition. IEEE trans. On Acoustics, Speed and signal...
- (2003). TNS Audiencia de Medios A service of Sofres AM company.