Bee Suan Ong
Con la reciente explosión cuantitativa de bibliotecas y colecciones de música en formato digital, la descripción del contenido desempeña un papel fundamental para una gestión y búsqueda eficientes de archivos de audio. La presente tesis doctoral pretende hacer un análisis automático de la estructura de piezas musicales a partir del análisis de una grabación, es decir, extraer una descripción estructural a partir de señales musicales polifónicas. En la medida en que la repetición y transformación de la estructura de la música genera una identificación única de una obra musical, extraer automáticamente esta información puede vincular entre sí descripciones de bajo y alto nivel de una señal musical y puede proporcionar al usuario una manera más efectiva de interactuar con un contenido de audio. Para algunas aplicaciones basadas en contenido, encontrar los límites de determinados segmentos de una grabación resulta indispensable. Así pues, también se investiga la segmentación temporal de audio a nivel semántico, al igual que la identificación de extractos representativos de una señal musical que pueda servir como resumen de la misma. Para ello se emplea una técnica de análisis a un nivel de abstracción más elevado que permite obtener una mejor división en segmentos. Tanto desde el punto de vista teórico como práctico, esta investigación no sólo ayuda a incrementar nuestro conocimiento respecto a la estructura musical, sino que también proporciona una ayuda al examen y a la valoración musical.
With the recent explosion in the quantity of digital audio libraries and databases, content descriptions play an important role in efficiently managing and retrieving audio files.
This doctoral research aims to discover and extract structural description from polyphonic music signals. As repetition and transformations of music structure creates a unique identity of music itself, extracting such information can link low-level and higherlevel descriptions of music signal and provide better quality access plus powerful way of interacting with audio content. Finding appropriate boundary truncations is indispensable in certain content-based applications. Thus, temporal audio segmentation at the semantic level and the identification of representative excerpts from music audio signal are also investigated. We make use of higher-level analysis technique for better segment truncation. From both theoretical and practical points of view, this research not only helps in increasing our knowledge of music structure but also facilitates in time-saving browsing and assessing of music.
© 2008-2024 Fundación Dialnet · Todos los derechos reservados