Browse Source

Last paper for Frank. Speech specific features

master
Frank Blanning 6 years ago
parent
commit
4ff0203987
  1. 17
      tex/4.2.Cuckoo.tex
  2. 20
      tex/4.6.speech.tex
  3. 7
      tex/cites.bib

17
tex/4.2.Cuckoo.tex

@ -0,0 +1,17 @@
Πέρα από την επιλογή των features, η μέθοδος εκπαίδευσης έχει μεγάλη
επίπτωση στην τελική αποτελεσματικότητα του αλγορίθμου. Μερικές φορές
χρήση σύνθετων μεθόδων εκπαίδευσης μπορούν να επιφέρουν καλύτερα
αποτελέσματα σε μεγαλύτερο ποσοστό διότι επιτρέπουν την έξοδο από
τοπικά ελάχιστα. Η σύνθετες μέθοδοι μπορεί να μην είναι συμβατικοί, ή
και να δανείζονται από παρατηρήσεις στην φύση, όπως ο συνδυασμός ενός
Support Vector Machine (SVM) με τον Cuckoo Algorithm
~\site{cuckoo}. Όπου όπως το πουλί ο Κούκος γεννάει τα αυγά του σε
ξένες φωλιές, στις επανάληψης εκπαίδευσης του SVM κάποιες λύσεις
πετιούνται και αντικαθίστανται από νέες οι οποίες "μπορεί" να
επιφέρουν καλύτερα αποτελέσματα.
%%% Local Variables:
%%% mode: latex
%%% TeX-master: "main"
%%% End:

20
tex/4.6.speech.tex

@ -0,0 +1,20 @@
Τα features μπορεί να μην καλύπτουν χαρακτηριστικά και της φωνής και
της μουσικής, αλλά να βασίζονται σε χαρακτηριστικά ενός από τα
δύο. Ενδιαφέρον παρουσιάζουν τα χαρακτηριστικά της ομιλίας, η οποία
λόγο των μέσων όπου την παράγουν (τα χείλη, η γλώσσα και οι φωνητικές
χορδές) έχουν περιορισμένα χαρακτηριστικά. Η μελέτη αυτών των
χαρακτηριστικών και τη χρήση τους ως features σε έναν classifier έχει
αποδειχθεί πως μπορεί να αυξήσει στην επιτυχία του διαχωρισμού
~/cite{Α}. Ενδεικτικά , πέρα από το καθιερωμένο feature των 4Hz
modulation energy λόγω του ρυθμού των συλλαβών, κάποια άλλα speech
specific features βασίζονται στην αναγνώριση του ήχου όπου παράγεται
στις φωνητικές χορδές κατά την εναλλαγή της προφοράς ενός συμφώνου σε
ένα φωνήεν ή στην μελέτη της αυτοσυσχέτησης του σήματος μετά από
φιλτράρισμα (Zero Frequency Filtered Signal) όπου παρουσιάζει
συγκεκριμένα χαρακτηριστικά μόνο στην ομιλία.
%%% Local Variables:
%%% mode: latex
%%% TeX-master: "main"
%%% End:

7
tex/cites.bib

@ -13,3 +13,10 @@ title = "Speech/music discrimination for analysis of radio stations",
journal = "2017 International Conference on Systems, Signals and Image Processing (IWSSIP)", journal = "2017 International Conference on Systems, Signals and Image Processing (IWSSIP)",
year = "2017" year = "2017"
} }
@article { speech,
autor = "Baniriskhem K. Khonglah and S.R. Mahadeva Prasanna",
title = "Speech / music classification using speech-specific features",
journal = "Digital Signal Processing 48",
year = "2016"
)
Loading…
Cancel
Save