You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
14 lines
1.0 KiB
14 lines
1.0 KiB
Speech/Music Discrimination using Hybrid-Based Feature Extraction for Audio Data Indexing
|
|
Kun-Ching, Wang, Member, IEEE, Yung-Ming, Yang and Ying-Ru, Yang
|
|
|
|
Χρησιμοποούν τα features:
|
|
- ΜFCC
|
|
- ZCR (zero crossing rate)
|
|
- SC (Spectral Centroid)
|
|
- SR (Spectral Rolloff)
|
|
- SF (Specral Flux)
|
|
|
|
Τα features ΜFCC, ZCR και SF ταξινομούν με accuracy ~90\% το καθένα. Το feature SR με 83\%, ενώ το SC με 70\%.
|
|
Ο συνδυασμός όλων των features πετυχαίνει 93.5\% σωστή ταξινόμηση, ενώ με χρήση ενός SVM μοντέλου το ποστοστό φτάνει στο 95.68\%.
|
|
|
|
Παρατηρείται ότι η σωστή ταξινόμηση της μουσική είναι αρκετά δυσκολότερη (με αυτά τα features) σε σχέση με αυτή της ομιλίας. Συγκεκριμένα στην ομιλία επιτυγχάνεται (με το SVM) accuracy 98.25\% ενώ στη μουσική 93.1\%.
|