Μελέτη και ανάπτυξη συστήματος κατηγοριοποίησης διαλόγων χρηστών σε ανοικτά διαδικτυακά μαθήματα με τεχνικές μηχανικής μάθησης

datacite.contributor.SupervisorΝικόλαος Αβούρης
datacite.rightshttp://purl.org/coar/access_right/c_abf2el
dc.contributor.authorΠαπασταύρος, Κυριάκος Νικόλαος
dc.contributor.otherPapastavros, Kyriakos Nikolaos
dc.date.accessioned2022-07-11T07:28:02Z
dc.date.available2022-07-11T07:28:02Z
dc.date.copyright2022-07-08
dc.degreegraduateThesisel
dc.description.abstractΣτη παρούσα εργασία επιχειρήθηκαν τεχνικές μοντελοποίησης σε φόρουμ συζήτησης των Μαζικών Ανοικτών Διαδικτυακών Μαθημάτων (MOOCs). Συγκεκριμένα, εφαρμόστηκε η τεχνική της μοντελοποίησης θεμάτων με την χρήση δυο αλγορίθμων μηχανικής μάθησης. Μελετώνται ο αλγόριθμος Latent Dirichlet Allocation και ο αλγόριθμος Correlation Explanation. Επιπλέον, έγινε σύγκριση των δυο αλγορίθμων με τρεις διαφορετικούς τρόπους βασιζόμενοι στην συνοχή των θεμάτων. Αφενός, πραγματοποιήθηκε ποσοτική αξιολόγηση των δυο αλγορίθμων με βάση τις μετρικές αξιολόγησης Pointwise Mutual Information, Normalized Pointwise Mutual Information, Google Title Matches - Google Log Hits Matches και αφετέρου διεξήχθη ποιοτική αξιολόγηση των αλγορίθμων με βάση την ανθρώπινη κρίση μέσα από συνεντεύξεις. Επιπροσθέτως, στη παρούσα μελέτη προτείνεται ένας αλγόριθμος που εκχωρεί αυτόματα τίτλους στα θέματα που αποδίδουν οι μέθοδοι μηχανικής μάθησης. Στα πλαίσια υλοποίησης αυτών των αλγορίθμων και μετά από διαγωνοποίηση των εκφερόμενων αποτελεσμάτων που προέκυψαν από τις μεθόδους σύγκρισης , αποδεικνύεται ότι ο αλγόριθμος CorEx είναι πιο αποδοτικός από τον αλγόριθμο LDA. Η προτεινόμενη μέθοδος εκχώρησης τίτλου, μέσα από επαναλαμβανόμενα πειράματα και ανθρώπινη αξιολόγηση, έδειξε ότι προσφέρει σημαντική πληροφορία στον ερευνητή. Συμπερασματικά, η παρούσα έρευνα βοηθάει στην κατασκευή ενός εργαλείου που θα ενισχύσει την αποδοτικότερη περιήγηση στα φόρουμ συζήτησης (MOOCs).el
dc.description.translatedabstractIn this paper, modelling techniques were tested in Massive Open Online Courses (MOOCs) forums. Specifically, topic modelling techniques were applied using two machine-learning algorithms. The algorithms that were studied are: Latent Dirichlet Allocation and Correlation Explanation. In addition, the two algorithms were compared in three different ways based on topic consistency. On one hand, a quantitative evaluation of the two algorithms was conducted based on the following evaluation metrics: Pointwise Mutual Information, Normalized Pointwise Mutual Information, Google Title Matches – Google Log Hits Matches. On the other hand, a qualitative evaluation of said algorithms was conducted based on human judgement through interviews. In addition, this thesis proposes an algorithm that automatically labels topics to the subjects that were assigned by machine learning methods. Within the implementation of these algorithms and, after the triangulation of the results that derived from the comparing methods, it is proved that the CorEX algorithm is more efficient than the LDA algorithm. The proposed method of title attribution, through repeated experiments and human evaluation, has proven to provide significant information to the researcher. In conclusion, this research assists in building a tool that will enhance a more efficient browsing of discussions forums (MOOCs)el
dc.identifier.urihttp://hdl.handle.net/10889/16449
dc.language.isogrel
dc.subjectΜηχανική μάθησηel
dc.subjectΤεχνικές μοντελοποίησηςel
dc.subject.alternativeTopic modellingel
dc.subject.alternativeLDAel
dc.subject.alternativeCorExel
dc.subject.alternativeMachine learningel
dc.titleΜελέτη και ανάπτυξη συστήματος κατηγοριοποίησης διαλόγων χρηστών σε ανοικτά διαδικτυακά μαθήματα με τεχνικές μηχανικής μάθησηςel
dc.title.alternativeStudy and development of a categorization system for user dialogues in open online courses with machine learning techniquesel
oaire.licenseConditionnullel

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
diplwmatiki_Papastavros_1031523.pdf
Size:
3.74 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
4.53 KB
Format:
Item-specific license agreed upon to submission
Description: