Speech/Music classification of audio files using machine learning techniques.
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
 
 
 
 

19 lines
1.9 KiB

\section{Εισαγωγή}
Το ζητούμενο της εργασίας είναι η ανάπτυξη ενός μοντέλου μηχανικής
μάθησης το οποίο, παρέχοντας ένα αρχείο ήχου, θα μπορεί να ξεχωρίσει
ανάμεσα στα κομμάτια του χρόνου που περιέχουν ομιλία (speech) και
μουσική (music), όπως παρουσιάζεται στον διαγωνισμό MIREX 2018:Music and/or Speech Detection
\footnote{\href{https://www.music-ir.org/mirex/wiki/2018:Music_and/or_Speech_Detection}{MIREX - 2018:Music and/or Speech Detection}, last accessed: \today}.
Η εργασία επικεντρώνεται στην εύρεση των δειγμάτων που περιέχουν είτε ομιλία είτε μουσική
και στην ταξινόμησή τους.
Πρόκειται για ένα δυαδικό πρόβλημα ταξινόμησης που είναι σημαντικό καθώς έχει
εφαρμογές σε πλατφόρμες κοινωνικών δικτύων για την αναγνώριση
περιεχομένου με πνευματικά δικαιώματά, σε συστήματα αυτόματης
αναγνώρισης διαφημίσεων, μοντέρνα "έξυπνα" βοηθητικά ακοής κ.α. Η
πρόσφατη βιβλιογραφία περιέχει θεματολογία όπου στοχεύει είτε στην
ανάπτυξή αλγορίθμων για γρήγορη και φθηνή υπολογιστικά ταξινόμηση,
είτε στην αναγνώριση πολύ μεγάλης ακρίβειας. Αυτό διότι αυτή τη
στιγμή η αναγνώριση με ποσοστό επιτυχίας γύρω στο 98\% είναι κάτι
συνηθισμένο.