Speech/Music Discrimination using Hybrid-Based Feature Extraction for Audio Data Indexing Kun-Ching, Wang, Member, IEEE, Yung-Ming, Yang and Ying-Ru, Yang Χρησιμοποούν τα features: - ΜFCC - ZCR (zero crossing rate) - SC (Spectral Centroid) - SR (Spectral Rolloff) - SF (Specral Flux) Τα features ΜFCC, ZCR και SF ταξινομούν με accuracy ~90\% το καθένα. Το feature SR με 83\%, ενώ το SC με 70\%. Ο συνδυασμός όλων των features πετυχαίνει 93.5\% σωστή ταξινόμηση, ενώ με χρήση ενός SVM μοντέλου το ποστοστό φτάνει στο 95.68\%. Παρατηρείται ότι η σωστή ταξινόμηση της μουσική είναι αρκετά δυσκολότερη (με αυτά τα features) σε σχέση με αυτή της ομιλίας. Συγκεκριμένα στην ομιλία επιτυγχάνεται (με το SVM) accuracy 98.25\% ενώ στη μουσική 93.1\%.