Speech/Music classification of audio files using machine learning techniques.
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
 
 
 
 

16 lines
1.4 KiB

\section{Εισαγωγή}
Το ζητούμενο της εργασίας είναι η ανάπτυξη ενός μοντέλου μηχανικής
μάθησης το οποίο, παρέχοντας ένα αρχείο ήχου, θα μπορεί να ξεχωρίσει
ανάμεσα στα κομμάτια του χρόνου που περιέχουν ομιλία (speech) και
μουσική (music).
Πρόκειται για ένα πρόβλημα ταξινόμησης που είναι σημαντικό καθώς έχει
εφαρμογές σε πλατφόρμες κοινωνικών δικτύων για την αναγνώριση
περιεχομένου με πνευματικά δικαιώματά, σε συστήματα αυτόματης
αναγνώρισης διαφημίσεων, μοντέρνα "έξυπνα" βοηθητικά ακοής κ.α. Η
πρόσφατη βιβλιογραφία περιέχει θεματολογία όπου στοχεύει είτε στην
ανάπτυξή αλγορίθμων για γρήγορη και φθηνή υπολογιστικά ταξινόμηση,
είτε στην αναγνώριση πολύ μεγάλης ακρίβειας. Αυτό διότι αυτή τη
στιγμή η αναγνώριση με ποσοστό επιτυχίας γύρω στο 98\% είναι κάτι
συνηθισμένο.