Ανίχνευση ανωμαλιών σε δεδομένα χρονοσειρών με χρήση τεχνητών νευρωνικών δικτύων

Loading...
Thumbnail Image

Date

Authors

Ζούλφος, Αθανάσιος

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Σε αυτή την εργασία διερευνάται η χρήση διαφόρων μεθόδων Μηχανικής Μάθησης (Machine Learning) και συγκεκριμένα Βαθιάς Μάθησης(Deep Learning), για την ανίχνευση ανωμαλιών σε δεδομένα που καταγράφονται υπό τη μορφή χρονοσειρών. Στη σύγχρονη εποχή παρατηρείται καταιγισμός πληροφοριών από διάφορες πηγές, που προσφέρουν δεδομένα με τη μορφή χρονοσειρών. Η επεξεργασία και κατανόηση των δεδομένων αυτών αποδεικνύεται κρίσιμης σημασίας ως προς τη διαχείριση συστημάτων και τη λήψη αποφάσεων. Πέρα από την κλασική περίπτωση της πρόβλεψης μελλοντικών τιμών, ένα ακόμα καίριο ζήτημα που προκύπτει, είναι η δυνατότητα να εντοπιστούν σημεία ή ακολουθίες σημείων που παρουσιάζουν μη φυσιολογική συμπεριφορά σε σχέση με την υπόλοιπη χρονοσειρά. Οι απρόσμενες τιμές που παρατηρούνται στα σημεία αυτά, μπορεί να υποδεικνύουν την ύπαρξη κάποιας μη επιθυμητής κατάστασης και να απαιτούν την ανάληψη ενεργειών απο τους υπεύθυνους. Πλέον, όμως, ο όγκος της πληροφορίας είναι πολύ μεγάλος και δύσκολα διαχειρίσιμος μόνο από τον ανθρώπινο παράγοντα. ́Ετσι, κερδίζουν συνεχώς έδαφος τεχνικές όπου η παρέμβασή του περιορίζεται σε ένα τελικό στάδιο και αφού η επισήμανση των πιθανά προβληματικών δεδομένων έχει πραγματοποιηθεί από κάποιο κατάλληλο υπολογιστικό σύστημα. Και προφανώς ως κλάδος αιχμής με πληθώρα επιτυχών εφαρμογών σε διάφορους τομείς, η Βαθιά Μάθηση(Deep Learning) έρχεται να διαδραματίσει και αυτή το δικό της σημαντικό ρόλο στην ανάπτυξη τέτοιων συστημάτων. Εστιάζοντας, λοιπόν, σε δεδομένα χρονοσειρών που οι τιμές τους, σε ορισμένα σημεία, εμφανίζουν κάποια μη αποδεκτή διακύμανση, γίνεται εφαρμογή τεσσάρων(4) μοντέλων Τεχνητών Νευρωνικών Δικτύων(Artificial Neural Networks) για τον εντοπισμό των συγκεκριμένων ανωμαλιών. Τα μοντέλα αυτά ανταποκρίνονται στις κυρίαρχες τάσεις που επικρατούν στη διεθνή βιβλιογραφία. Σε όλα κυριαρχούν οι Μονάδες Μακράς Βραχυπρόθεσμης Μνήμης (Long Short-term Memory Units), που είναι οι πλέον κατάλληλες για την επεξεργασία δεδομένων που υπόκεινται σε κάποια χρονική ακολουθία. Γίνεται υλοποίηση ενός απλού Αναδρομικού Νευρωνικού Δικτύου με Μονάδες Μακράς Βραχυπρόθεσμης Μνήμης(Long Short-term Memory Recurrent Neural Network), ενός Αυτοκωδικοποιητή με Μονάδες Μακράς Βραχυπρόθεσμης Μνήμης(Long Short-term Memory Autoencoder), ενός Παραλλαγμένου Αυτοκωδικοποιητή(Variational Autoencoder) και ενός Γεννητικού Ανταγωνιστικού Δικτύου(Generative Adversarial Network), για την εκμάθηση του αναμενόμενου προτύπου εξέλιξης της χρονοσειράς. Στη συνέχεια, με την επιλογή ενός κατάλληλου Κατωφλιού(Threshold), επισημαίνονται τα σημεία που υπάρχει μεγάλη πιθανότητα να προκύπτει κάποια μη κανονική συμπεριφορά. Γίνεται εφαρμογή τους σε μια γκάμα δεδομένων, που καλύπτουν αρκετές περιπτώσεις, τόσο ως προς την πηγή τους, όσο και ως προς την ποιοτική διαχείρισή τους. Επιπλέον, πραγματοποιείται χρήση διαφόρων τεχνικών προεπεξεργασίας και αναπαράστασης των προαναφερθέντων δεδομένων, καθώς και οπτικοποίηση της πορείας εκπαίδευσης των μοντέλων και σύγκριση των αποτελεσμάτων τους.

Description

Keywords

Μηχανική μάθηση, Τεχνητά νευρωνικά δίκτυα, Αναδρομικά νευρωνικά δίκτυα, Μακρά βραχυπρόθεσμη μνήμη, Αυτοκωδικοποιητές, Παραλλαγμένοι αυτοκωδικοποιητές, Γεννητικά ανταγωνιστικά δίκτυα

Citation