Σχεδιασμός και υλοποίηση μικροϋπολογιστικού συστήματος αυτόματου διαχωρισμού ταυτόχρονων ομιλητών

Thumbnail Image
Date
2023-08-23
Authors
Λακχμίρι, Μαρία
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Η συγκεκριμένη διπλωματική εργασία εξετάζει τις τεχνικές τυφλού διαχωρισμού σημάτων(Blind Source Separation) με στόχο τη σχεδίαση και υλοποίηση ενός μικροϋπολογιστικού συστήματος για τον διαχωρισμό παράλληλων ομιλητών σε ένα δωμάτιο. Ο διαχωρισμός φωνών αποτελεί διαδικασία ζωτικής σημασίας για διάφορους τομείς όπως η αναγνώριση ομιλίας, η ενίσχυση παραγωγής ήχου και η πραγματοποίηση προηγμένων εργασιών ανάλυσης ήχου. Το πρόβλημα που στοχεύει να επιλύσει η συγκεκριμένη διπλωματική εργασία είναι το λεγόμενο φαινόμενο «Cocktail Party» (Cocktail Party Effect) σε ένα χώρο, σε πραγματικό χρόνο. Το φαινόμενο cocktail party είναι η δυνατότητα του εγκεφάλου να εστιάζει την ακουστική του προσοχή σε ένα συγκεκριμένο ερέθισμα ενδιαφέροντος. Στα πλαίσια της επεξεργασίας σημάτων αναφερόμαστε σε αυτό σαν ένα πρόβλημα επεξεργασίας ήχου και διαχωρισμού σημάτων. Εστιάζει στον διαχωρισμό συγκεκριμένων ηχητικών πηγών από ένα αναμειγμένο δείγμα, ειδικά όταν οι πηγές επικαλύπτονται στον χρόνο ή και τη συχνότητα. Αρχικά παρατίθεται μία βιβλιογραφική ανασκόπηση, η οποία παραθέτει διάφορες τεχνικές Τυφλού Διαχωρισμού Σημάτων (BSS), Προεπεξεργασίας και Μετεπεξεργασίας σημάτων. Πραγματοποιείται συγκριτική ανάλυση πειραμάτων MATLAB για μία αξιολόγηση προτεινόμενων τεχνικών μηχανικής μάθησης. Η υλοποίηση του συστήματος ολοκληρώνεται με βάση την τεχνική μηχανικής μάθησης Independent Component Analysis (ICA) και συγκεκριμένα την υλοποίηση του αλγορίθμου Fast ICA, σε ένα μικροϋπολογιστικό σύστημα, συγκεκριμένα το Board STM32F334R8 με τον επεξεργαστή ARM CORTEX M4. Ο προγραμματισμός του συστήματος γίνεται σε bare metal C, με βάση τις βιβλιοθήκες CMSIS της ARM για εκμετάλλευση των ταχυτήτων τους. Η υλοποίηση περιλαμβάνει την προετοιμασία του συστήματος για την λήψη ηχητικών σημάτων και την υλοποίηση του αλγορίθμου Fast ICA, μίας γρήγορης υλοποίησης του ICA, για τον διαχωρισμό των σημάτων. Τα αποτελέσματα αναδεικνύουν ότι ο αλγόριθμος αυτός δεν είναι ο κατάλληλος για εφαρμογές περιορισμένης μνήμης. Σε επόμενα στάδια αξίζει η εξέταση τεχνικών Βαθιών Νευρωνικών Δικτύων για την υλοποίηση του διαχωρισμού και ο έλεγχος διαφορετικών μοντέλων για το βέλτιστο αποτέλεσμα.
Description
Keywords
Μικροϋπολογιστικά συστήματα, Τυφλός διαχωρισμός πηγών, Ανεξάρτητη ανάλυση συνιστωσών
Citation