Apostolos Fanakis
6 years ago
1 changed files with 14 additions and 0 deletions
@ -0,0 +1,14 @@ |
|||
Speech/Music Discrimination using Hybrid-Based Feature Extraction for Audio Data Indexing |
|||
Kun-Ching, Wang, Member, IEEE, Yung-Ming, Yang and Ying-Ru, Yang |
|||
|
|||
Χρησιμοποούν τα features: |
|||
- ΜFCC |
|||
- ZCR (zero crossing rate) |
|||
- SC (Spectral Centroid) |
|||
- SR (Spectral Rolloff) |
|||
- SF (Specral Flux) |
|||
|
|||
Τα features ΜFCC, ZCR και SF ταξινομούν με accuracy ~90% το καθένα. Το feature SR με 83%, ενώ το SC με 70%. |
|||
Ο συνδυασμός όλων των features πετυχαίνει 93.5% σωστή ταξινόμηση, ενώ με χρήση ενός SVM μοντέλου το ποστοστό φτάνει στο 95.68%. |
|||
|
|||
Παρατηρείται ότι η σωστή ταξινόμηση της μουσική είναι αρκετά δυσκολότερη (με αυτά τα features) σε σχέση με αυτή της ομιλίας. Συγκεκριμένα στην ομιλία επιτυγχάνεται (με το SVM) accuracy 98.25% ενώ στη μουσική 93.1%. |
Loading…
Reference in new issue