Ανάλυση δεδομένων στα κοινωνικά δίκτυα : μελέτη περίπτωσης στις συζητήσεις φόρουμ ενός MOOC

Thumbnail Image
Date
Authors
Μυρίλλα, Ειρήνη
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Η παρούσα εργασία έχει ως στόχο τη μελέτη των φόρουμ συζητήσεων των Μαζικών Ανοικτών Διαδικτυακών Μαθημάτων (MOOCs), με σκοπό να ενισχύσει την προσπάθεια δημιουργίας ενός εργαλείου αποδοτικότερης περιήγησης σε αυτά. Πιο συγκεκριμένα, με την χρήση τεχνικών μοντελοποίησης θεμάτων επιχειρείται η εξαγωγή των θεμάτων των συζητήσεων και η αυτόματη εκχώρηση ενός τίτλου σε αυτά, ο οποίος αντιστοιχεί σε κάποιο κεφάλαιο της ύλης του μαθήματος. Μελετώνται τρεις αλγόριθμοι μοντελοποίησης θεμάτων, οι LDA, GuidedLDA και anchored CorEx και διαπιστώνεται ότι ο τελευταίος δίνει τα καλύτερα αποτελέσματα για την επίτευξη του στόχου. Επιπλεόν, ερευνάται η κατασκευή ενός αποτελεσματικού κριτηρίου απόφασης, το οποίο θα αποδίδει μοναδικό τίτλο – θέμα στις δημοσιεύσεις, για τις οποίες ο παραπάνω αλγόριθμος δεν μπορεί να πάρει απόφαση. Για τον σκοπό αυτό, χρησιμοποιείται, αρχικά, η έννοια της σημασιολογικής ομοιότητας των δημοσιεύσεων με τα εξαγόμενα θέματα και στη συνέχεια, μελετάται η προσέγγιση του προβλήματος με αλγορίθμους μηχανικής μάθησης με επίβλεψη, συνδυαστικά με τα αποτελέσματα της μοντελοποίησης θεμάτων. Η μελέτη αυτή, έδειξε ότι η χρήση του αλγορίθμου Linear Support Vector Classifier (LSVC), σε συνδυασμό με τα προηγούμενα αποτελέσματα, βελτιώνει την ακρίβειά του. Τέλος, επιχειρείται η μελέτη του φόρουμ ενός, διαφορετικού αντικειμένου μελέτης, MOOC, και διαπιστώνεται ότι ο αλγόριθμος anchored CorEx δίνει σημαντικά καλύτερα αποτελέσματα σε αυτό, ενώ δεν μπορεί να εφαρμοστεί μηχανική μάθηση με επίβλεψη, παρά μόνο κάποιο κριτήριο, το οποίο θα προκύπτει από γνώση του αντικειμένου μελέτης, για την απόδοση τίτλων στις δημοσιεύσεις με ισοπίθανα θέματα.
Description
Keywords
Ανάλυση δεδομένων, Μηχανική μάθηση, Μοντελοποίηση θεμάτων, Επεξεργασία φυσικής γλώσσας
Citation