From 4ff020398734f2819b5ff14c24b0edb5741e5cd7 Mon Sep 17 00:00:00 2001 From: Frank Blanning Date: Sat, 3 Nov 2018 19:57:35 +0200 Subject: [PATCH] Last paper for Frank. Speech specific features --- tex/4.2.Cuckoo.tex | 17 +++++++++++++++++ tex/4.6.speech.tex | 20 ++++++++++++++++++++ tex/cites.bib | 9 ++++++++- 3 files changed, 45 insertions(+), 1 deletion(-) create mode 100644 tex/4.2.Cuckoo.tex create mode 100644 tex/4.6.speech.tex diff --git a/tex/4.2.Cuckoo.tex b/tex/4.2.Cuckoo.tex new file mode 100644 index 0000000..dc2d24e --- /dev/null +++ b/tex/4.2.Cuckoo.tex @@ -0,0 +1,17 @@ + +Πέρα από την επιλογή των features, η μέθοδος εκπαίδευσης έχει μεγάλη +επίπτωση στην τελική αποτελεσματικότητα του αλγορίθμου. Μερικές φορές +χρήση σύνθετων μεθόδων εκπαίδευσης μπορούν να επιφέρουν καλύτερα +αποτελέσματα σε μεγαλύτερο ποσοστό διότι επιτρέπουν την έξοδο από +τοπικά ελάχιστα. Η σύνθετες μέθοδοι μπορεί να μην είναι συμβατικοί, ή +και να δανείζονται από παρατηρήσεις στην φύση, όπως ο συνδυασμός ενός +Support Vector Machine (SVM) με τον Cuckoo Algorithm +~\site{cuckoo}. Όπου όπως το πουλί ο Κούκος γεννάει τα αυγά του σε +ξένες φωλιές, στις επανάληψης εκπαίδευσης του SVM κάποιες λύσεις +πετιούνται και αντικαθίστανται από νέες οι οποίες "μπορεί" να +επιφέρουν καλύτερα αποτελέσματα. + +%%% Local Variables: +%%% mode: latex +%%% TeX-master: "main" +%%% End: diff --git a/tex/4.6.speech.tex b/tex/4.6.speech.tex new file mode 100644 index 0000000..3f4b875 --- /dev/null +++ b/tex/4.6.speech.tex @@ -0,0 +1,20 @@ + +Τα features μπορεί να μην καλύπτουν χαρακτηριστικά και της φωνής και +της μουσικής, αλλά να βασίζονται σε χαρακτηριστικά ενός από τα +δύο. Ενδιαφέρον παρουσιάζουν τα χαρακτηριστικά της ομιλίας, η οποία +λόγο των μέσων όπου την παράγουν (τα χείλη, η γλώσσα και οι φωνητικές +χορδές) έχουν περιορισμένα χαρακτηριστικά. Η μελέτη αυτών των +χαρακτηριστικών και τη χρήση τους ως features σε έναν classifier έχει +αποδειχθεί πως μπορεί να αυξήσει στην επιτυχία του διαχωρισμού +~/cite{Α}. Ενδεικτικά , πέρα από το καθιερωμένο feature των 4Hz +modulation energy λόγω του ρυθμού των συλλαβών, κάποια άλλα speech +specific features βασίζονται στην αναγνώριση του ήχου όπου παράγεται +στις φωνητικές χορδές κατά την εναλλαγή της προφοράς ενός συμφώνου σε +ένα φωνήεν ή στην μελέτη της αυτοσυσχέτησης του σήματος μετά από +φιλτράρισμα (Zero Frequency Filtered Signal) όπου παρουσιάζει +συγκεκριμένα χαρακτηριστικά μόνο στην ομιλία. + +%%% Local Variables: +%%% mode: latex +%%% TeX-master: "main" +%%% End: diff --git a/tex/cites.bib b/tex/cites.bib index a5ed4d1..7bcd6fd 100644 --- a/tex/cites.bib +++ b/tex/cites.bib @@ -12,4 +12,11 @@ author = "Stanisław Kacprzak, Błażej Chwiećko and Bartosz Ziółko", title = "Speech/music discrimination for analysis of radio stations", journal = "2017 International Conference on Systems, Signals and Image Processing (IWSSIP)", year = "2017" -} \ No newline at end of file +} + +@article { speech, +autor = "Baniriskhem K. Khonglah and S.R. Mahadeva Prasanna", +title = "Speech / music classification using speech-specific features", +journal = "Digital Signal Processing 48", +year = "2016" +) \ No newline at end of file