From 1db8de2b55301eb37eca4c8c96b4495d3732dd9d Mon Sep 17 00:00:00 2001 From: Christina Theodoridou Date: Sat, 3 Nov 2018 13:59:14 +0200 Subject: [PATCH] ROBUST SPEECH / MUSIC CLASSIFICATION IN AUDIO DOCUMENTS --- tex/4.2.robust.tex | 13 +++++++++++++ 1 file changed, 13 insertions(+) create mode 100644 tex/4.2.robust.tex diff --git a/tex/4.2.robust.tex b/tex/4.2.robust.tex new file mode 100644 index 0000000..f25b14b --- /dev/null +++ b/tex/4.2.robust.tex @@ -0,0 +1,13 @@ +ROBUST SPEECH / MUSIC CLASSIFICATION IN AUDIO DOCUMENTS +Julien PINQUIER, Jean-Luc ROUAS and R´ egine ANDRE-OBRECHT + + +Χρησιμοποεί σαν κριτήρια (features): +- Την διαμόρφωση ενέργειας στα 4Hz του σήματος +- Την διαμόρφωση εντροπίας του σήματος +- Τον αριθμό των στατικών τμημάτων +- Την διάρκεια των τμημάτων + +Παρατηρήθηκε πειραματικά ότι τα πρώτα 3 κριτήρια δίνουν περίπου το ίδιο ποσοστό επιτυχών ταξινομήσεων(περίπου 84%) ενώ η μπαγιεσιανή προσέγγιση για το κριτήριο δίαρκειας τμημάτων έδωσε λίγο χαμηλότερο ποσοστό( 76.1%). + +Για να αυξηθούν αυτά τα ποσοστό προτάθηκε ένας ιεραρχικός αλγόριθμος ταξινόμησης στον οποίο τα κριτήρια διαμόρφωσης ενέργειας των 4Ηz του σήματος και διαμόρφωσης εντροπίας του σήματος συγχωνεύονται. Σε περίπτωση που οι 2 ταξινομητές συμφωνούν αποφασίζουν για το αν το τμήμα αποτελεί ομιλία ή όχι, ενώ σε περιπτώση που δεν συμφωνούν, η απόφαση οριστικοποιείται από το κριτήριο του αριθμού τμημάτων. Αποδεικνύεται ότι τα αποτελέσματα αυτού του αλγορίθμου δίνουν 90.1% σωστές ταξινομήσεις. \ No newline at end of file