Publication:
Statistical classification of images

Loading...
Thumbnail Image
Identifiers
Publication date
2011-05
Defense date
2011-09-19
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Impact
Google Scholar
Export
Research Projects
Organizational Units
Journal Issue
Abstract
Image classification is a burgeoning field of study. Despite the advances achieved in this camp, there is no general agreement about what is the most effective methods for the classification of digital images. This dissertation contributes to this line of research by developing different statistical methods aim to classifying digital images. In Chapter 1 we introduce basic concepts of image classification and review some results and methodologies proposed previously in the literature. In Chapter 2 we propose a method to classify images by their content. We are able to distinguish between landscape from non-landscape pictures by using three features obtained directly from images. We obtain better classification rates than those obtained by other authors dealing with similar kind of scene classification. In Chapter 3 we address the handwritten digit recognition. We suggest a set of intuitive features to perform the classification. Since the features are calculated with the binary image, we propose a novel technique to obtain the optimum threshold to binarize images, based on statistical concepts associated to the written trace of the digit. The classification is conducted by applying multivariate and probabilistic approaches, concluding that both methods provide similar results in terms of test-error rate (3.5%). In Chapter 4 we propose the application of Functional Data Analysis to analyze and classify images. While a limited number of authors have suggested the application of FDA for image classification [Florindo et al. (2010)], we suggest that this branch of statistics has represents a promising approach and offers several avenues for future research. We close the dissertation in Chapter 5 with a set of concluding remarks. Overall, the methods suggested in this dissertation are simple to apply, intuitive in their interpretation and their performance is comparable with other complex methods applied to the same problem. Moreover, the features suggested require less processing time than other methods (as support vector machine classifiers) and therefore require less computational capacity
La clasificaciĂ³n de imĂ¡genes es un campo de estudio de rĂ¡pido crecimiento. A pesar de los avances logrados en esta Ă¡rea, no existe un acuerdo generalizado acerca de cuĂ¡l es el mĂ©todo mĂ¡s eficaz para la clasificaciĂ³n de imĂ¡genes digitales. Esta tesis contribuye a esta lĂ­nea de investigaciĂ³n mediante el desarrollo de diferentes mĂ©todos estadĂ­sticos que tienen como objetivo la clasificaciĂ³n de imĂ¡genes digitales. En el capĂ­tulo 1 se introduce los conceptos bĂ¡sicos de clasificaciĂ³n y se revisan algunos resultados de las metodologĂ­as propuestas previamente en la literatura. En el capĂ­tulo 2 se propone un mĂ©todo para clasificar las imĂ¡genes por su contenido. Somos capaz de distinguir entre una imagen de un paisaje de una que no lo es a partir del uso de tres variables obtenidas directamente de las imĂ¡genes. Obtenemos mejores tasas de clasificaciĂ³n que las alcanzadas por otros autores que han trabajado clasificaciĂ³n de escenas similares. En el capĂ­tulo 3 abordamos el reconocimiento de dĂ­gitos escritos a mano. Sugerimos una serie de variables intuitivas para llevar a cabo la clasificaciĂ³n. Dado que las variables se calculan con imĂ¡genes binarias, se propone una novedosa tĂ©cnica para obtener el umbral Ă³ptimo para imĂ¡genes binarizadas, basado en los conceptos estadĂ­sticos asociados al trazo de escritura del dĂ­gito. La clasificaciĂ³n se lleva a cabo mediante la aplicaciĂ³n de mĂ©todos multivariantes y probabilĂ­sticos, concluyendo que ambos mĂ©todos proporcionan resultados similares en tĂ©rminos de tasa de error (3,5 %). En el capĂ­tulo 4 se propone la aplicaciĂ³n del AnĂ¡lisis Funcional de Datos para estudiar y clasificar imĂ¡genes digitales. Mientras que un nĂºmero limitado de autores han sugerido la aplicaciĂ³n de ADF para la clasificaciĂ³n de la imagen [Florindo et al. (2010)], creemos que este rama de la estadĂ­stica representa un enfoque prometedor y ofrece diversas alternativas para la investigaciĂ³n futura. Cerramos la tesis en el capĂ­tulo 5 con un conjunto de observaciones finales. En general, los mĂ©todos propuestos en esta tesis son fĂ¡ciles de aplicar, intuitivos en su interpretaciĂ³n y su rendimiento es comparable con otros mĂ©todos complejos aplicados al mismo problema. Por otra parte, las caracterĂ­sticas sugeridas requieren menos tiempo de procesamiento que otros mĂ©todos (como los clasificadores de tĂ©cnicas de vector soporte)
Description
Keywords
ImĂ¡genes, ClasificaciĂ³n, MĂ©todos estadĂ­sticos, AnĂ¡lisis funcional
Bibliographic citation
Collections