Automatic Recognition of Musical Instruments

21
Juan Castro Mayorgas TFC - Enginyeria Tècnica de Telecomunicacions especialitat Telemàtica Universitat Oberta de Catalunya Segon semestre 2010-2011

description

This is the summary of my bachelor thesis. It is about Musical Instrument recognition and shows: * Features that can be extracted from sound. * Machine learning basis. * Decision algorithms. * Statistical results.

Transcript of Automatic Recognition of Musical Instruments

Page 1: Automatic Recognition of Musical Instruments

Juan Castro MayorgasTFC - Enginyeria Tècnica de Telecomunicacions especialitat TelemàticaUniversitat Oberta de CatalunyaSegon semestre 2010-2011

Page 2: Automatic Recognition of Musical Instruments

Context Objectius del TFC Propietats del so Característiques acústiques Classificadors Corpus Implementació Resultats experimentals Resum

Page 3: Automatic Recognition of Musical Instruments
Page 4: Automatic Recognition of Musical Instruments

Extracció de característiques

acústiques

Aprenentatge

Classificació

Senyal d’àudio

Identificació

Page 5: Automatic Recognition of Musical Instruments

Selecció de característiques

Selecció de classificadors

ConfiguracióCorpus

Configuració d’escenaris

Sistema de reconeixement automàtic

Anàlisi de resultats

Page 6: Automatic Recognition of Musical Instruments

Intensitat i volum Intensitat: quantitat absoluta Volum: valor subjectiu

Altura: freqüència Escala Mel

Duració

Timbre: permet diferenciar el mateix so produït per dos instruments diferents

Page 7: Automatic Recognition of Musical Instruments

En el domini freqüencial Centroide Extensió Coeficients MFCC Roll-Off

En el domini temporal Taxa de pas per zero Energia

Informació que s’extreu de cada un dels petits fragments en que es talla el senyal d’àudio

Page 8: Automatic Recognition of Musical Instruments

Model de mescles Gaussianes (GMM) Probabilístic i sense supervisió

K-veí més proper (k-NN) Basat en distància Molt senzill d’implementar. Alt cost de computació

Support Vector Machines (SVM) Basat en distància Dissenyat per a discernir entre dues classes. Versions multi-classe.

Page 9: Automatic Recognition of Musical Instruments

TunediT 115.000 mostres (no es disposa de l’àudio original) 70 – 30 % (entrenament – test) 18 instruments (2 famílies – 8 subfamílies)

Generació pròpia 18 instruments (2 famílies – 8 subfamílies) Entrenament: Gravació de cada una de les notes de

l’extensió de l’instrument Test: Gravacions amb fraseig per cada instrument.

Page 10: Automatic Recognition of Musical Instruments

cAudioList = TFCLoadAudioList (filename)

Cfeatures = TFCExtractFeatures (cAudioList, windowSize)

TFCExportFeatures (audioListFile, featuresFile, windowSize)

Funcions relacionades amb l’extracció de les característiques acústiques

Page 11: Automatic Recognition of Musical Instruments

cResults = TFCGMMCheck (cFTraining, vWhat, scale, classType)

CResults = TFCGMMClassify (cFTraining, cFTest, vWhat, scale, classType)

Funcions relacionades amb la classificació

vWhat = [x x x x x x x x x x x x x x x x x x]

MFCC1 … MFCC13Centroide

ExtensióRollOff ZeroCrossEnergia

Page 12: Automatic Recognition of Musical Instruments

cResults = TFCKNNClassify (cFTraining, cFTest, vWhat, scale, classType, k, maxDist)

cResults = TFCKNNClassify2 (cFTraining, cFTest, vWhat, scale, classType, k, maxDist)

cResults = TFCKNNClassify3 (cFTraining, cFTest, vWhat, scale, classType, k, maxDist)

cResults = TFCSVMClassify (cFTraining, cFTest, vWhat, classType)

Funcions relacionades amb la classificació

Page 13: Automatic Recognition of Musical Instruments

cAnalytics = TFCCreateAnalytics (cFTest, cResults, classType)

cReport = TFCReportAnalytics (cAnalytics)

cReport = TFCReportDecision (cAnalytics)

Funcions relacionades amb l’anàlisi de resultats

Page 14: Automatic Recognition of Musical Instruments
Page 15: Automatic Recognition of Musical Instruments
Page 16: Automatic Recognition of Musical Instruments
Page 17: Automatic Recognition of Musical Instruments
Page 18: Automatic Recognition of Musical Instruments
Page 19: Automatic Recognition of Musical Instruments

Arxiu Instrument frames Classe Percent. Classe Percent. Encertvioloncel.wav violoncel 344 violoncel 64.83% contrabaix 23.26% SIcontrabaix.wav contrabaix 214 contrabaix 98.60% guitarra 1.40% SIviola.wav viola 353 viola 82.44% violi 10.76% SIvioli.wav violi 138 viola 81.16% violi 17.39% NOtubasolo.wav tuba 390 tuba 66.92% fagot 32.05% SIcelosolo.wav violoncel 683 violoncel 63.54% trompa 18.89% SIclarsolo.wav clarinet 320 violoncel 32.81% clarinet 17.81% NOviolsolo.wav violi 633 violoncel 33.81% trompa 15.48% NOvilasolo.wav viola 738 violoncel 37.53% violi 24.66% NOclarinet.wav clarinet 341 clarinet 79.18% trombo 7.92% SIsaxofon.wav saxofon 229 saxofon 81.22% piano 18.78% SIflauta.wav flauta 203 flauta 81.28% trompa 8.87% SIcorn_angles.wav corn_angles 215 corn_angles 36.28% trompeta 27.91% SI

Test gravat amb les mateixes

condicions que aprenentatge

Test procedent la enciclopèdia

musical Microsoft Musical

InstrumentsTest format per notes dobles o

triples del mateix instrumments

Dades originals 1er candidat 2on candidat

Page 20: Automatic Recognition of Musical Instruments

Implementació funcions per a: Extreure característiques acústiques Classificar e identificar mostres Analitzar resultats

Experiments que mostren entre altres: El nombre de mostres afecta de diferent manera als

resultats segons el mètode de classificació La rellevància de les característiques acústiques depèn del

mètode de classificació Hi ha instruments més fàcils d’identifcar amb un mètode

que amb un altre El fraseig harmònic redueix el percentatge d’encerts

Page 21: Automatic Recognition of Musical Instruments

Gràcies