Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/12982
Title: Εξόρυξη διεργασιών με τεχνικές μηχανικής μάθησης
Other Titles: Process mining using machine learning techniques
Authors: Νικολαΐδης, Νικόλαος
Keywords: Εξόρυξη δεδομένων
Υπο-γεγονός
Μοντέλο μίξης
Χρονοσειρές
Γράφος λέξεων
Keywords (translated): Data mining
Twitter
Sub-event
Graph-of-words
Mixure model
Optimization
Time series
Abstract: Η εργασία αυτή επικεντρώνεται γύρω από την εξόρυξη γεγονότων από χρονικά δεδομένα με χρήση τεχνικών μηχανικής μάθησης και βελτιστοποίησης. Κάτω από το πλαίσιο του όρου ‘εξόρυξη διεργασιών’, η εργασία θα εστιαστεί στο πρόβλημα εντοπισμού και εξόρυξης γεγονότων από χρονικά δεδομένα κειμένου, τα οποία χαρακτηρίζονται ως θορυβώδη, μικρής έκτασης και από διαφορετικούς συγγραφείς. Το είδος των δεδομένων που επιλέχτηκε είναι δημοσιεύσεις από την πλατφόρμα Twitter και το πρόβλημα που αναλύεται είναι η αναγνώριση υπο-γεγονότων και η αυτόματη δημιουργία περίληψης. Παρουσιάζονται τρείς προσεγγίσεις επίλυσης του προβλήματος αυτού, μια με την μέθοδο εντοπισμού αιχμών, μια με την χρήση μοντέλου μίξης και μια με την χρήση κυρτής βελτιστοποίησης. Τέλος, γίνεται μια συγκριτική πειραματική ανάλυση των αποτελεσμάτων σε πραγματικό dataset.
Abstract (translated): This thesis is concerned with the issue of mining of events from temporal data using machine learning and optimization techniques. Within the area characterized by term ‘Process Mining’, this thesis will be focused on the problem of detection and mining of events from textual temporal data that are characterized by the existence of strong noise, by small length and that are produced by many different authors. The data that were chosen were posts from the Twitter microblogging platform and the relevant problem is the detection and automatic summarization of sub-events. Three different approaches to solving this problem are presented, one using spike detection, one using probabilistic mixture models and one using convex optimization. Finally, these approaches are experimentally compared in a real-life dataset.
Appears in Collections:Τμήμα Ηλεκτρολ. Μηχαν. και Τεχνολ. Υπολογ. (ΔΕ)

Files in This Item:
File Description SizeFormat 
Thesis.pdf2.09 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.