Τεχνικές εξόρυξης πληροφορίας σε μέσα κοινωνικής δικτύωσης

Thumbnail Image
Date
Authors
Γεωργίου, Αλέξανδρος
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Τα μέσα κοινωνικής δικτύωσης είναι πλατφόρμες επικοινωνίας όπου οι χρήστες ανταλλάσουν πληροφορίες και συνδέονται μεταξύ τους με σχέσεις που δημιουργούν κοινωνικά δίκτυα. Γνωστά τέτοια μέσα είναι το Facebook, το Twitter, το LinkedIn κλπ. Οι τεχνικές εξόρυξης δεδομένων χρησιμοποιούνται για να επιτευχθεί κατηγοριοποίηση δεδομένων που μπορεί να είναι ή όχι προηγουμένως ταξινομημένα και ομαδοποίηση τους βάσει μιας πλειάδας μεταβλητών. Στη συνέχεια μπορούν να απαντηθούν ερωτήματα βάσει αυτών των μεταβλητών και να βρεθούν τα δεδομένα που βρίσκονται στη μικρότερη απόσταση από το ερώτημα, δηλαδή το απαντούν πιο ικανοποιητικά από όλα. Οι τεχνικές αυτές, εφαρμοσμένες στα μέσα κοινωνικής δικτύωσης μπορούν να απαντήσουν σε ερωτήματα όπως ποιοι χρήστες είναι πιο κοινωνικοί, ποια θέματα έχουν ανερχόμενη δημοτικότητα, ποιο πληροφοριακό περιεχόμενο είναι ποιοτικό ή ποιος χρήστης θεωρείται πιο έμπιστος να παρέχει πληροφορίες για ένα συγκεκριμένο θέμα. Σκοπός της εργασίας είναι η παρουσίαση βασικών στοιχείων των μέσων κοινωνικής δικτύωσης και των τεχνικών εξόρυξης δεδομένων. Παρουσιάζονται οι αλγόριθμοι και οι τεχνικές που έχουν εφαρμοστεί στα μέσα κοινωνικής δικτύωσης για να απαντήσουν σε ερωτήματα αντίστοιχα με τα παραπάνω και τα αποτελέσματά τους. Τέλος, παρουσιάζεται αναλυτικά ένας νέος αλγόριθμος, με επιπλέον μετρικές και χρήση νέων τεχνικών για τη βελτίωση της εξόρυξης δεδομένων, για την εύρεση των πιο έμπιστων χρηστών γύρω από ένα θέμα και εκτίθενται τα πειραματικά αποτελέσματα από τη χρήση του αλγορίθμου αυτού. Ο αλγόριθμος αφορά την κατηγορία μέσων κοινωνικής δικτύωσης που λέγονται microblogs (πχ Twitter) όπου λόγω του περιορισμένου μεγέθους της πληροφορίας του κάθε μηνύματος πρέπει να αναζητηθούν παράμετροι του συνολικού κοινωνικού δικτύου που σχηματίζεται. Ο αλγόριθμος που προτείνεται προσθέτει μετρικές που αφορούν τη συχνότητα και τη χρονική ζώνη της ημέρας που ο χρήστης έχει δραστηριότητα και χρησιμοποιεί την τεχνική Cluster Based Fusion για να εξετάζονται τα βέλτιστα στοιχεία από κάθε cluster, βελτιώνοντας έτσι την ποιότητα της απάντησης.
Description
Keywords
Εξόρυξη δεδομένων, Κοινωνικά δίκτυα
Citation