the-assignment/tex/4.4.hybrid.tex


								Speech/Music Discrimination using Hybrid-Based Feature Extraction for Audio Data Indexing

								Kun-Ching, Wang, Member, IEEE, Yung-Ming, Yang and Ying-Ru, Yang


								Χρησιμοποούν τα features:

								- ΜFCC

								- ZCR (zero crossing rate)

								- SC (Spectral Centroid)

								- SR (Spectral Rolloff)

								- SF (Specral Flux)


								Τα features ΜFCC, ZCR και SF ταξινομούν με accuracy ~90% το καθένα. Το feature SR με 83%, ενώ το SC με 70%.

								Ο συνδυασμός όλων των features πετυχαίνει 93.5% σωστή ταξινόμηση, ενώ με χρήση ενός SVM μοντέλου το ποστοστό φτάνει στο 95.68%.


								Παρατηρείται ότι η σωστή ταξινόμηση της μουσική είναι αρκετά δυσκολότερη (με αυτά τα features) σε σχέση με αυτή της ομιλίας. Συγκεκριμένα στην ομιλία επιτυγχάνεται (με το SVM) accuracy 98.25% ενώ στη μουσική 93.1%.