Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/13764
Title: Μέθοδοι ανάλυσης συναισθήματος για την αξιολόγηση κριτικών προϊόντων
Other Titles: Sentiment analysis methods for evaluating product reviews
Authors: Κωστής, Ευθύμιος
Keywords: Ανάλυση συναισθήματος
Μηχανική μάθηση
Εξόρυξη γνώσης
Νευρωνικά δίκτυα
Δέντρα απόφασης
Τυχαία δάση
Επεξεργασία φυσικής γλώσσας
Keywords (translated): Sentiment analysis
Machine learning
Data mining
Neural networks
Decision trees
Random forest
Naive Bayes
TF-IDF
Ngrams
Natural language processing
Python
Abstract: Το αντικείμενο το οποίο πραγματεύεται η παρούσα διπλωματική εργασία είναι η σχεδίαση και η ανάπτυξη ενός εργαλείου ανάλυσης συναισθήματος σε κριτικές προϊόντων, που θα λειτουργεί ως σύμβουλος αγοράς μέσα από μια γραφική διεπαφή χρήστη στο διαδίκτυο. Κατά την προεπεξεργασία των δεδομένων χρησιμοποιούνται τεχνικές επεξεργασίας φυσικής γλώσσας και για τον μετασχηματισμό τους γίνεται χρήση των TF-IDF χαρακτηριστικών με unigrams, αλλά και ngrams. Για την ανάλυση του συναισθήματος αξιοποιούνται αρκετοί αλγόριθμοι Μηχανικής Μάθησης, που εμπίπτουν σε όλες τις κατηγορίες μάθησης. Από αυτούς τους αλγορίθμους ξεχώρισαν τα Νευρωνικά Δίκτυα, τα Τυχαία Δάση, ο Multinomial Naive Bayes, καθώς και ο LDA για την εξαγωγή των θεμάτων της κάθε κριτικής. Το προβλεπόμενο συναίσθημα κατηγοριοποιείται σε τρεις κλάσεις, θετικό, αρνητικό και ουδέτερο. Για τις ανάγκες της εργασίας, η αποθήκευση των δεδομένων πραγματοποιήθηκε στη μη σχεσιακή βάση δεδομένων MongoDB. Η διπλωματική έχει χωριστεί σε τρία βασικά μέρη. Αρχικά, παρουσιάζεται το αναγκαίο θεωρητικό υπόβαθρο της Μηχανικής Μάθησης και της Ανάλυσης Συναισθήματος και έπειτα αναλύεται η διαδικασία ανάπτυξης του συστήματος. Τέλος, όλα τα παραγόμενα αποτελέσματα, συνοδευόμενα από ορισμένα κύρια χαρακτηριστικά κάθε κριτικής, παρουσιάζονται στον τελικό χρήστη μέσα από ένα γραφικό περιβάλλον στο διαδίκτυο. Στο πλαίσιο αυτού του περιβάλλοντος προσφέρεται η δυνατότητα στο χρήστη να αναζητήσει, βάσει ορισμένων κριτηρίων, την κριτική για το προϊόν που επιθυμεί και να αναλύσει τις προβλέψεις συναισθημάτων που παρήχθησαν.
Abstract (translated): The subject of this thesis is the design and development of a Sentiment Analysis tool in product reviews, which will act as a market consultant through a graphical user interface on the web. During the data pre-processing, are used natural language processing techniques and for data transformation the TF-IDF features with unigrams, but also ngrams. Several Machine Learning algorithms are used for Sentiment Analysis, which fall into all categories of learning. The algorithms that stood out are Neural Networks, Random Forests, Multinomial Naive Bayes, as well as LDA for extracting the topics of each review. The predicted sentiment is categorized into three classes, positive, negative and neutral. The data was stored in the non-relational database (NoSQL) MongoDB. This thesis is divided into three main parts. Firstly, the necessary theoretical background of Machine Learning and Sentiment Analysis is presented and after that the system development process is analyzed. Finally, all the results produced, accompanied by some key features of each review, are presented to the end user through a graphical web interface. This interface offers the user the opportunity to search the desired product review, based on certain criteria and to analyze the sentiment predictions that were produced.
Appears in Collections:Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΔΕ)

Files in This Item:
File Description SizeFormat 
Thesis_Efthimios_Kostis.pdf5.51 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.