From music similarity to music recommendation: computational approaches based on audio features and metadata

Dmitry Bogdanov

Ayuda

From music similarity to music recommendation: computational approaches based on audio features and metadata

Autores: Dmitry Bogdanov
Directores de la Tesis: Xavier Serra Casals (dir. tes.)
Lectura: En la Universitat Pompeu Fabra ( España ) en 2013
Idioma: español
Tribunal Calificador de la Tesis: Josep Lluís Arcos Rosell (presid.) , Emilia Gómez Gutiérrez (secret.) , Markus Schedl (voc.)
Enlaces
- Tesis en acceso abierto en: TDX e-Repositori UPF
Resumen
- La cantidad de música disponible en formato digital crece de forma impetuosa. Hay grandes cantidades de música disponibles para los oyentes, y para tratarlas se requiere organización y filtración automática. En este contexto, el modelado de usuario, que consiste en la personalización y adaptación de los sistemas a las necesidades específicas del usuario, es un problema fundamental y complejo [1]. Varias aplicaciones musicales se basan en este modelado para proporcionar a los usuarios una experiencia personalizada. En el presente trabajo nos centramos en el modelado de usuario para la tarea de recomendación musical, proponemos una técnica de inferencia de preferencias así como diferentes métodos de recomendación. Además, desarrollamos algoritmos para la comprensión automática y visualización de preferencias musicales. Nuestros métodos utilizan algoritmos de procesamiento de señales, recuperación de información, aprendizaje automático, y se basan en la investigación interdisciplinaria en comportamiento del usuario y música.
  
  En primer lugar, se consideran diversas técnicas de inferencia de preferencias y se propone un modelo de usuario. El modelo es construido a partir de un conjunto explícito de piezas musicales proporcionados por el usuario como evidencia de sus preferencias. Esta estrategia permite una representación fiable de las preferencias musicales.
  
  En segundo lugar, se estudian métodos de estimación de similitud musical, trabajando exclusivamente en el contenido de audio. Por un lado, se propone una nueva métrica semántica que se beneficia de la descripción musical de alto nivel (etiquetas de género, emoción, instrumentación) extraída automáticamente. Además, se complementa con información de bajo nivel (tímbrica, temporal y tonal) para proponer una métrica híbrida. Las métricas propuestas muestran una mejora significativa en evaluaciones objetivas y subjetivas, comparadas con los métodos más comunes de similitud musical [2].
  
  En tercer lugar, se proponen varios métodos de recomendación musical que funcionan a partir de ejemplos explícitos de preferencia. Estos métodos están basados ¿¿en el análisis del contenido de audio y metadatos [3]. Los recomenadores propuestos utilizan las métricas de similitud propuestas o modelos probabilísticos. Por un lado, se utilizan medidas de similitud semántica e híbrida, y alternativamente se construye un modelo probabilístico semántico de preferencia musical. Se propone un filtrado adicional basado en metadatos para mejorar los resultados de los recomendadores basados ¿¿en contenido de audio [4]. Por otra parte, se propone un método sencillo, basado exclusivamente en metadatos editoriales [4]. Las evaluaciones con usuarios demuestran que nuestros métodos son muy adecuados para el descubrimiento de la música, y son competitivos con relación a los estándares actuales.
  
  En cuarto lugar, para proporcionar información sobre la naturaleza de las preferencias musicales, se crean modelos de regresión que relacionan las preferencias musicales de nuestros participantes con los descriptores utilizados. Por cada usuario, se presentan los predictores de preferencia relevantes a nivel acústico y semántico. Los resultados obtenidos están muy relacionados con los de la investigación existente en cognición musical. Finalmente, se presenta un método de visualización de preferencias que permite mejorar la experiencia de usuario en sistemas de recomendación [3].
  
  Referencias: [1] Celma, 0. (2010). Music Recommendation and Discovery: The Long Tail, Long Fail, and Long Play in the Digital Music Space. Springer.
  
  [2] Bogdanov, D., Serrà J., Wack N., Herrera P., & Serra X. (2011). Unifying Low-level and High-level Music Similarity Measures. IEEE Transactions on Multimedia. 13(4), 687-701.
  
  [3] Bogdanov, D., Haro M., Fuhrmann F., Xambó A., Gómez E., & Herrera P. (2013). Semantic audio content-based music recommendation and visualization based on user preference examples. Information Processing & Management. 49(1), 13-33.
  
  [4] Bogdanov, D. & Herrera P. (2011). How much metadata do we need in music recommendation? A subjective evaluation using preference sets. International Society for Music Information Retrieval Conference (ISMIR), pp. 97-102.
  
  [5] Bogdanov, D. & Herrera P. (2012). Taking advantage of editorial metadata to recommend music. 9th International Symposium on Computer Music Modeling and Retrieval (CMMR 2012), pp. 618-632.