Last paper for Frank. Speech specific features

8 years ago · 4ff0203987
3 changed files with 45 additions and 1 deletions
--- a/tex/4.2.Cuckoo.tex
+++ b/tex/4.2.Cuckoo.tex
@ -0,0 +1,17 @@
 Πέρα από την επιλογή των features, η μέθοδος εκπαίδευσης έχει μεγάλη
 επίπτωση στην τελική αποτελεσματικότητα του αλγορίθμου. Μερικές φορές
 χρήση σύνθετων μεθόδων εκπαίδευσης μπορούν να επιφέρουν καλύτερα
 αποτελέσματα σε μεγαλύτερο ποσοστό διότι επιτρέπουν την έξοδο από
 τοπικά ελάχιστα. Η σύνθετες μέθοδοι μπορεί να μην είναι συμβατικοί, ή
 και να δανείζονται από παρατηρήσεις στην φύση, όπως ο συνδυασμός ενός
 Support Vector Machine (SVM) με τον Cuckoo Algorithm
 ~\site{cuckoo}. Όπου όπως το πουλί ο Κούκος γεννάει τα αυγά του σε
 ξένες φωλιές, στις επανάληψης εκπαίδευσης του SVM κάποιες λύσεις
 πετιούνται και αντικαθίστανται από νέες οι οποίες "μπορεί" να
 επιφέρουν καλύτερα αποτελέσματα.
 %%% Local Variables:
 %%% mode: latex
 %%% TeX-master: "main"
 %%% End:
--- a/tex/4.6.speech.tex
+++ b/tex/4.6.speech.tex
@ -0,0 +1,20 @@
 Τα features μπορεί να μην καλύπτουν χαρακτηριστικά και της φωνής και
 της μουσικής, αλλά να βασίζονται σε χαρακτηριστικά ενός από τα
 δύο. Ενδιαφέρον παρουσιάζουν τα χαρακτηριστικά της ομιλίας, η οποία
 λόγο των μέσων όπου την παράγουν (τα χείλη, η γλώσσα και οι φωνητικές
 χορδές) έχουν περιορισμένα χαρακτηριστικά. Η μελέτη αυτών των
 χαρακτηριστικών και τη χρήση τους ως features σε έναν classifier έχει
 αποδειχθεί πως μπορεί να αυξήσει στην επιτυχία του διαχωρισμού
 ~/cite{Α}. Ενδεικτικά , πέρα από το καθιερωμένο feature των 4Hz
 modulation energy λόγω του ρυθμού των συλλαβών, κάποια άλλα speech
 specific features βασίζονται στην αναγνώριση του ήχου όπου παράγεται
 στις φωνητικές χορδές κατά την εναλλαγή της προφοράς ενός συμφώνου σε
 ένα φωνήεν ή στην μελέτη της αυτοσυσχέτησης του σήματος μετά από
 φιλτράρισμα (Zero Frequency Filtered Signal) όπου παρουσιάζει
 συγκεκριμένα χαρακτηριστικά μόνο στην ομιλία.
 %%% Local Variables:
 %%% mode: latex
 %%% TeX-master: "main"
 %%% End:
--- a/tex/cites.bib
+++ b/tex/cites.bib
@ -13,3 +13,10 @@ title = "Speech/music discrimination for analysis of radio stations",
 journal = "2017 International Conference on Systems, Signals and Image Processing (IWSSIP)",
 year = "2017"
 }
@article { speech,
 autor = "Baniriskhem K. Khonglah and S.R. Mahadeva Prasanna",
 title = "Speech / music classification using speech-specific features",
 journal = "Digital Signal Processing 48",
 year = "2016"
 )