Last paper for Frank. Speech specific features

8 years ago · 4ff0203987
3 changed files with 45 additions and 1 deletions
--- a/tex/4.2.Cuckoo.tex
+++ b/tex/4.2.Cuckoo.tex
@ -0,0 +1,17 @@
+
+Πέρα από την επιλογή των features, η μέθοδος εκπαίδευσης έχει μεγάλη
+επίπτωση στην τελική αποτελεσματικότητα του αλγορίθμου. Μερικές φορές
+χρήση σύνθετων μεθόδων εκπαίδευσης μπορούν να επιφέρουν καλύτερα
+αποτελέσματα σε μεγαλύτερο ποσοστό διότι επιτρέπουν την έξοδο από
+τοπικά ελάχιστα. Η σύνθετες μέθοδοι μπορεί να μην είναι συμβατικοί, ή
+και να δανείζονται από παρατηρήσεις στην φύση, όπως ο συνδυασμός ενός
+Support Vector Machine (SVM) με τον Cuckoo Algorithm
+~\site{cuckoo}. Όπου όπως το πουλί ο Κούκος γεννάει τα αυγά του σε
+ξένες φωλιές, στις επανάληψης εκπαίδευσης του SVM κάποιες λύσεις
+πετιούνται και αντικαθίστανται από νέες οι οποίες "μπορεί" να
+επιφέρουν καλύτερα αποτελέσματα.
+
+%%% Local Variables:
+%%% mode: latex
+%%% TeX-master: "main"
+%%% End:
--- a/tex/4.6.speech.tex
+++ b/tex/4.6.speech.tex
@ -0,0 +1,20 @@
+
+Τα features μπορεί να μην καλύπτουν χαρακτηριστικά και της φωνής και
+της μουσικής, αλλά να βασίζονται σε χαρακτηριστικά ενός από τα
+δύο. Ενδιαφέρον παρουσιάζουν τα χαρακτηριστικά της ομιλίας, η οποία
+λόγο των μέσων όπου την παράγουν (τα χείλη, η γλώσσα και οι φωνητικές
+χορδές) έχουν περιορισμένα χαρακτηριστικά. Η μελέτη αυτών των
+χαρακτηριστικών και τη χρήση τους ως features σε έναν classifier έχει
+αποδειχθεί πως μπορεί να αυξήσει στην επιτυχία του διαχωρισμού
+~/cite{Α}. Ενδεικτικά , πέρα από το καθιερωμένο feature των 4Hz
+modulation energy λόγω του ρυθμού των συλλαβών, κάποια άλλα speech
+specific features βασίζονται στην αναγνώριση του ήχου όπου παράγεται
+στις φωνητικές χορδές κατά την εναλλαγή της προφοράς ενός συμφώνου σε
+ένα φωνήεν ή στην μελέτη της αυτοσυσχέτησης του σήματος μετά από
+φιλτράρισμα (Zero Frequency Filtered Signal) όπου παρουσιάζει
+συγκεκριμένα χαρακτηριστικά μόνο στην ομιλία.
+
+%%% Local Variables:
+%%% mode: latex
+%%% TeX-master: "main"
+%%% End:
--- a/tex/cites.bib
+++ b/tex/cites.bib
@ -13,3 +13,10 @@ title = "Speech/music discrimination for analysis of radio stations",
 journal = "2017 International Conference on Systems, Signals and Image Processing (IWSSIP)",
 year = "2017"
 }
+
+@article { speech,
+autor = "Baniriskhem K. Khonglah and S.R. Mahadeva Prasanna",
+title = "Speech / music classification using speech-specific features",
+journal = "Digital Signal Processing 48",
+year = "2016"
+)