Ir al contenido

Documat


Audio content processing for automatic music genre classification: descriptors, databases, and classifiers

  • Autores: Enric Guaus Árbol académico
  • Directores de la Tesis: Xavier Serra Casals (dir. tes.) Árbol académico
  • Lectura: En la Universitat Pompeu Fabra ( España ) en 2009
  • Idioma: español
  • Tribunal Calificador de la Tesis: Leo Wanner (presid.) Árbol académico, Emilia Gómez Gutiérrez (secret.) Árbol académico, José M. Iñesta Quereda (voc.) Árbol académico, Rubén López Cano (voc.) Árbol académico, Marcelo Bertalmío Barate (voc.) Árbol académico
  • Enlaces
  • Resumen
    • Esta tesis estudia la clasificación automática de géneros musicales, basada en el análisis del contenido de la señal de audio, planteando sus problemas y proponiendo soluciones. Se propone un estudio de la clasificación de los géneros musicales desde el punto de vista computacional, pero inspirado en teorías de los campos de la musicología y la percepción. El objetivo es comparar y evaluar los resultados obtenidos de estos experimentos para explicar los límites de las tasas de acierto de los algoritmos actuales, y proponer nuevas estrategias para superarlos. En este contexto, se propone el estudio de distintas familias de descriptores de audio referentes al timbre, al ritmo, a la tonalidad o a otros aspectos de la música. Algunos de los descriptores son propuestos por el mismo autor, mientras que otros son perfectamente conocidos. Por otra parte, también se comparan las técnicas de aprendizaje artificial que se usan tradicionalmente, y analizamos su comportamiento en frente de nuestro problema de clasificación. También planteamos una discusión sobre su capacidad para representar los diferentes modelos de clasificación propuestos en el campo de la percepción. Estos resultados de la clasificación se comparan con los resultados de unos tests y encuestas realizados sobre un conjunto de individuos. Como resultado de esta comparativa se propone una arquitectura específica de clasificadores que también está razonada y detallada en el cuerpo de la tesis. Finalmente, se hace un énfasis especial en comparar los resultados de los clasificadores automáticos en distintos escenarios que asumen la mezcla de bases de datos, algunas muy grandes y otras muy pequeñas, etc. Como conclusión, mostraremos como la arquitectura de clasificación propuesta permite romper el límite actual en el ámbito de la clasificación automática de géneros musicales. De forma condensada, podemos decir que esta tesis contribuye en el campo de la clasificación de los géneros musicales el los siguientes aspectos: a) Proporciona una revisión multidisciplinar de los géneros musicales y su clasificación; b) Presenta una evaluación cualitativa y cuantitativa de las familias de descriptores de audio para la clasificación de géneros musicales; c) Evalúa los pros y contras de las distintas técnicas de aprendizaje artificial delante del género; d) Propone una arquitectura nueva del clasificador de acuerdo con una visión interdisciplinar de los géneros musicales; e) Analiza el comportamiento de la arquitectura propuesta delante de entornos muy diversos en los que se podría implementar el clasificador.


Fundación Dialnet

Mi Documat

Opciones de tesis

Opciones de compartir

Opciones de entorno