Γραφικά μοντέλα πολυπαραμετρικής απόσβεσης για παραγωγή Top-N συστάσεων

Thumbnail Image
Date
Authors
Καλαντζής, Γεώργιος
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Τα Συστήματα Συστάσεων είναι ένα εργαλείο ανάλυσης δεδομένων με σκοπό την αντιστοίχιση αντικειμένων ταιριαστών σε χρήστες με συγκεκριμένες προτιμήσεις. Πρόκειται για έναν ταχέως εξελισσόμενο ερευνητικό κλάδο με αμέτρητες εμπορικές εφαρμογές. Αντικείμενο της παρούσας εργασίας είναι η μελέτη τεχνικών κατάταξης κόμβων σε γραφήματα με στόχο τη κατασκευή του μαθηματικού πυρήνα ενός νέου αλγορίθμου παραγωγής συστάσεων. Αρχικά μελετάμε τα χαρακτηριστικά και τις ιδιότητες γνωστών αλγορίθμων κατάταξης κόμβων που βασίζονται σε τυχαίους περιπάτους. Δίνουμε κάποιες εναλλακτικές μορφές αυτών και επικεντρωνόμαστε στο μοντέλο της Πολυπαραμετρικής Απόσβεσης. Έπειτα, γίνεται μια εισαγωγή στα Συστήματα Συστάσεων. Κάνουμε μια ανασκόπηση της βασικής θεωρίας και παρουσιάζουμε τους πιο γνωστούς γραφικούς αλγορίθμους παραγωγής συστάσεων. Στη συνέχεια προχωράμε στο σημαντικότερο κομμάτι αυτής της εργασίας. Εισάγουμε τον MDREC, ένα νέο αλγόριθμο που, βασιζόμενος στην πολυπαραμετρική απόσβεση και σε φασματικές ιδιότητες του μητρώου πιθανοτήτων μετάβασης, παράγει εξατομικευμένες συστάσεις. Σχολιάζουμε εκτενώς τα χαρακτηριστικά του και τον τρόπο με τον οποίο επιλέγονται οι διάφορες παράμετροι. Δείχνουμε πώς με το μοντέλο αυτό μπορούμε να περιγράψουμε άλλους αλγορίθμους της ίδιας κλάσης και μάλιστα, να πετύχουμε καλύτερη απόδοση. Ολοκληρώνουμε τη μελέτη μας με εκτενείς πειραματικές αξιολογήσεις. Χρησιμοποιούμε σύνολα δεδομένων που αποτελούν σημεία αναφοράς για αξιολόγηση στη Μηχανική Μάθηση ακολουθώντας μία νέα διαδικασία cross-validation, προσαρμοσμένη στις απαιτήσεις των Συστημάτων Συστάσεων. Συγκρίνουμε τον MDREC με επτά άλλες τεχνικές στο πρόβλημα της τυπικής top-N σύστασης, στην ανάδειξη σπάνιων αντικειμένων καθώς και σε σενάρια κρύας εκκίνησης. Με τα πειράματα αυτά επαληθεύουμε την ισχύ του προτεινόμενου αλγορίθμου καθώς και την ανωτερότητά του έναντι των ανταγωνιστικών μεθόδων σε κάθε σενάριο.
Description
Keywords
Κατάταξη κόμβων, Διάχυση τάξης, Τυχαίοι περίπατοι, Μαρκοβιανές αλυσίδες, Συστήματα συστάσεων, Συνεργατική διήθηση, Ανάλυση δεδομένων, Ανάκτηση πληροφορίας, Μηχανική μάθηση
Citation