Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/10115
Title: Τεχνικές επεξεργασίας φυσικής γλώσσας, εξαγωγής γνώσης και αυτόματης δημιουργίας προσαρμοσμένης στον χρήστη ανάδρασης για ευφυή συστήματα διδασκαλίας
Other Titles: Techniques for natural language processing, knowledge extraction and automatic creation of user adapted feedback for intelligent tutoring systems
Authors: Περίκος, Ισίδωρος
Keywords: Τεχνητή νοημοσύνη
Επεξεργασία φυσικής γλώσσας
Μηχανική μάθηση
Αναγνώριση συναισθημάτων
Ευφυή συστήματα
Σημασιολογικός ιστός
Αλληλεπίδραση ανθρώπου υπολογιστή
Κοινωνικά δίκτυα
Keywords (translated): Artificial Intelligence
Natural language processing
Machine learning
Affective computing
Intelligent systems
Semantic web
Human–computer interaction
Social networks
Abstract: Η παρούσα διδακτορική διατριβή αποσκοπεί στο σχεδιασμό, στην ανάπτυξη και στην αξιοποίηση μηχανισμών και καινοτόμων μεθοδολογιών από τις περιοχές της επεξεργασίας φυσικής γλώσσας, της μηχανικής μάθησης για την αλληλεπίδραση μεταξύ ανθρώπου και υπολογιστικών συστημάτων. Κύρια αντικείμενα του προβλήματος που πραγματεύεται η παρούσα διατριβή αφορούν την μοντελοποίηση του κύκλου παροχής ανάδρασης σε ευφυή εκπαιδευτικά συστήματα, την αναγνώριση της συναισθηματικής κατάστασης του χρήστη και την δυνατότητα κατανόησης κειμένου για επικοινωνία ανθρώπου-υπολογιστή σε φυσική γλώσσα. Αρχικά, παρουσιάζεται μια νέα μεθοδολογία δημιουργίας ανάδρασης σε ευφυή εκπαιδευτικά συστήματα, με στόχο την παροχή κατάλληλης καθοδήγησης κατά την διάρκεια της αλληλεπίδρασης. Η μεθοδολογία που αναπτύχθηκε περιλαμβάνει την εισαγωγή μιας γενικής μοντελοποίησης της απάντησης των εκπαιδευόμενων, την εισαγωγή ενός γενικού ιεραρχικού μοντέλου οργάνωσης της ανάδρασης σε επίπεδα καθώς και το καθορισμό της κατηγοριοποίησης των λαθών με βάση το πεδίο της εφαρμογής. Επίσης, αναπτύχθηκε ένας μηχανισμός για την παραγωγή ανάδρασης, που έχει ως στόχο να παράγει και να παρέχει αυτόματα τους κατάλληλους τύπους ανάδρασης με βάση το ιεραρχικό μοντέλο. Τα αποτελέσματα της πειραματικής μελέτης έδειξαν ότι το πλαίσιο που εισάγεται είναι ιδιαίτερα αποτελεσματικό. Για την κατανόηση κειμένου και την επικοινωνία σε φυσική γλώσσα, μια σημαντική συνεισφορά της διατριβής αποτελεί η εισαγωγή μιας νέας, καινοτόμου μεθοδολογίας για την αυτόματη μετατροπή φυσικής γλώσσας σε κατηγορηματική λογική πρώτης τάξης (first-order predicate logic), συντομογραφικά ΚΛΠΤ (FOPC). Η μεθοδολογία βασίζεται στη βασισμένη σε περιπτώσεις συλλογιστική (case-based reasoning) και στην αρχή ότι προτάσεις φυσικής γλώσσας που έχουν ίδια ή παρόμοια συντακτική δομή και δέντρα εξαρτήσεων (dependency trees) θα έχουν ίδια ή παρόμοια δομή έκφρασης σε κατηγορηματική λογική πρώτης τάξης. Για τον προσδιορισμό της ομοιότητας μεταξύ των προτάσεων φυσικής γλώσσας χρησιμοποιείται η απόσταση μετασχηματισμού δέντρου (tree edit distance), μετρική η οποία εφαρμόζεται στις δεντρικές δομές των δέντρων εξαρτήσεων. Επίσης, χρησιμοποιούνται κανόνες που έχουν ως στόχο να καθοριστεί η ακριβής έκφραση ΚΛΠΤ της νέας πρότασης. Τα πειραματικά αποτελέσματα έδειξαν ότι η προσέγγιση που εισάγεται είναι αποτελεσματική στις περιπτώσεις που η ομοιότητα είναι μεγάλη. Επίσης, εισάγεται μια προσέγγιση που σχεδιάστηκε για την ανάλυση των προτάσεων και τον προσδιορισμό του επιπέδου δυσκολίας της μετατροπής τους, η οποία βασίζεται σε χαρακτηριστικά της δομής των προτάσεων, στην ανάλυση των αντίστοιχων εκφράσεων ΚΛΠΤ, καθώς και σε χαρακτηριστικά που εξάγονται από την αντιστοίχισή τους. Τα αποτελέσματα της πειραματικής μελέτης έδειξαν ότι η προσέγγιση είναι ακριβής στον προσδιορισμό του κατάλληλου επιπέδου δυσκολίας, γεγονός που επαληθεύεται και από τις επιδόσεις του μηχανισμού αυτόματης μετατροπής. Ακόμη, εισάγεται μια μεθοδολογία για την παραγωγή λογικά ισοδύναμων προτάσεων (παραφράσεων), που βασίζεται σε ένα σύνολο από τεχνικές παράφρασης (paraphrasing techniques), οι οποίες μπορούν να τροποποιήσουν τη δομή προτάσεων και να μετατρέψουν δομικά μέρη του δέντρου εξάρτησης των προτάσεων σε ισοδύναμη μορφή. Τα πειραματικά αποτελέσματα της αξιολόγησης έδειξαν μια καλή απόδοση των τεχνικών και του εργαλείου που αναπτύχθηκε. Ένα άλλο βασικό αντικείμενο που πραγματεύεται η διατριβή είναι η αναγνώριση της συναισθηματικής κατάστασης του χρήστη. Για τον σκοπό αυτό, σχεδιάστηκαν και αναπτύχθηκαν μέθοδοι για την ανάλυση κειμένου και τον προσδιορισμό του συναισθηματικού περιεχομένου του καθώς και μέθοδοι ανάλυσης εκφράσεων προσώπου και αναγνώρισης της συναισθηματικής τους κατάστασης. Αρχικά, σχεδιάσαμε και αναπτύξαμε νέες προσεγγίσεις για την αυτόματη ανάλυση προτάσεων φυσικής γλώσσας και την εξαγωγή των συναισθηματικών πληροφοριών που φέρουν. Οι μέθοδοι που αναπτύχθηκαν βασίζονται σε σχήματα ομαδοποιημένων ταξινομητών (ensemble classifiers), που συνδυάζουν μεθόδους επεξεργασίας φυσικής γλώσσας και ανάλυσης των δομών των προτάσεων με μεθόδους μηχανικής μάθησης. Πιο συγκεκριμένα, εισάγεται μια βασισμένη σε γνώση (knowledge based) προσέγγιση, που βασίζεται στην εις βάθος ανάλυση των δομών των προτάσεων, και γίνεται προσδιορισμός του συναισθηματικού περιεχόμενο τους με βάση τη συντακτική δομή τους και λεξικολογικούς πόρους. Επίσης, γίνεται χρήση μεθόδων μηχανικής μάθησης μέσω χρήσης βασικών στατιστικών ταξινομητών, όπως ο απλοϊκός bayes (naïve Bayes) και οι μηχανές διανυσμάτων υποστήριξης (support vector machines), καθώς και συνδυασμός τους σε σχήμα ομαδοποιημένων ταξινομητών μαζί με τη βασισμένη στη γνώση προσέγγιση. Τα πειραματικά αποτελέσματα της αξιολόγησης έδειξαν ότι τα ομαδοποιημένα σχήματα παρουσίασαν μια αύξηση της απόδοσης κατά 4.8% έως 8.4% σε σχέση με τον καλύτερο ταξινομητή. Ως προς την αυτόματη ανάλυση εκφράσεων προσώπου και την αναγνώριση του συναισθηματικού τους περιεχομένου, αρχικά, εισάγεται ένα πλαίσιο μοντελοποίησης των εκφράσεων του προσώπου, το οποίο ακολουθεί μια αναλυτική, τοπικής εμβέλειας προσέγγιση και αναπαριστά μια έκφραση με 25 χαρακτηριστικά που εξάγει από σημεία όπως, τα μάτια, το στόμα και τα φρύδια. Στην συνέχεια, μελετάται η απόδοση νεύρο-ασαφούς προσέγγισης και μεθόδων μηχανικής μάθησης, όπως οι random forest και support vector machines, στον προσδιορισμό της ύπαρξης ή όχι συναισθημάτων σε μια έκφραση καθώς και στην αναγνώριση της ακριβούς συναισθηματικής της κατάστασης. Έπειτα, με βάση την απόδοση τους, παρουσιάζεται ομαδοποιημένο σχήμα ταξινόμησης, το οποίο συνδυάζει ταξινομητές που βασίζονται στις τρεις παραπάνω μεθόδους σε ένα σχήμα πλειοψηφίας. Στόχος του ομαδοποιημένου σχήματος αποτελεί η αύξηση της απόδοσης και η αποτελεσματική γενίκευση σε νέα δεδομένα εκφράσεων προσώπου. Τα αποτελέσματα της πειραματικής μελέτης έδειξαν ότι το ομαδοποιημένο σχήμα παρουσίασε μια αύξηση της απόδοσης της τάξης του 3.5% σε σχέση με τον καλύτερο ταξινομητή. Συμπερασματικά, οι τεχνικές που προτείνονται στην παρούσα διδακτορική διατριβή επεκτείνουν εργασίες της διεθνούς βιβλιογραφίας, προσθέτοντας και εισάγοντας νέες μεθόδους αντιμετώπισης στα θεματικά που πραγματεύεται.
Abstract (translated): The main aim of this thesis concerns the design, development and use of innovative mechanisms and methodologies from the areas of natural language processing and machine learning in the field of human computer interaction. The main subjects of the problem addressed by this thesis concern, the modeling of the feedback delivery cycle in intelligent educational systems (ITSs), the recognition of the emotional state of users and the ability of text understanding for human-computer communication in natural language. Initially, we introduce a new feedback generation methodology for intelligent educational systems, in order to provide appropriate guidance during the interaction with them. The developed methodology includes, the introduction of a general model of learners’ responses, the introduction of a general hierarchical model for the organization of feedback in levels and the creation of a classification scheme of the domain errors. Furthermore, a mechanism for the production of feedback is presented, designed to generate and automatically provide the appropriate types of feedback based on the hierarchical model. The experimental results showed that the introduced framework is quite effective. Regarding text understanding and communication in natural language, an important contribution of this thesis is the introduction of an innovative methodology to automatically convert natural language into first order predicate logic (FOPL). The methodology is based on a case-based reasoning cycle and on the principle that natural language sentences that have the same or similar syntactic structures and dependency trees will have the same or similar expressions in FOPL. The tree edit distance metric is applied to the tree structures of the sentences’ dependency trees, in order to determine the similarity. Also, rules are used to determine the FOPL expression of a new sentence. The experimental results showed that the introduced approach is effective, when the similarity between new sentences and the formalized ones stored in the knowledge based is high. Furthermore, an approach was designed to analyze sentences and determine the difficulty level of their formalization process. The approach is based on characteristics of sentence structure, characteristics of their corresponding FOL expressions as well as features extracted by comparing with their NL and FOL representation. The results of the experimental study show that the approach is accurate in determining the appropriate level of difficulty. Moreover, a method for producing logically equivalent sentences (paraphrases) is introduced. It is based on a set of developed paraphrase techniques, which can modify the sentences structure in order to convert parts of a sentence's dependency tree into equivalent forms. The experimental results of the evaluation show good behavior of the techniques and tools designed. Another main aspect of the thesis concerns the recognition of users’ emotional states. Methods for text analysis and recognition of the emotional content and also methods for analyzing facial expressions and recognizing their emotional state are presented. Initially, we present new approaches for the automatic analysis of natural language sentences and the extraction of emotional information. The developed methods are based on an ensemble classifier schema, which combine deep natural language processing methods with machine learning methods. More specifically, a knowledge based approach is introduced, based on the in-depth analysis of the syntactical structures of sentences and the estimation of the emotional content via the syntactic structure and lexical resources. Machine learning methods are also used via using basic statistical classifiers, such as naive Bayes and support vector machines (SVMs), combined into an ensemble classifier schema including the knowledge-based approach too. The experimental results of the evaluation indicate that the ensemble classifier schema shows a performance increase by 4.8% to 8.4% relative to the best individual classifier. With regards to the methods that automatically analyze facial expressions and recognize their emotional content, first, a modeling framework of facial expressions is presented, which follows an analytical, local-based approach. It represents an expression with a set of twenty-five features extracted from points such as the eyes, the mouth and the eyebrows. Then, the performance of a neuro-fuzzy approach as well as machine learning methods, such as random forest and support vector machines, are studied in determining the existence of emotions in an expression and recognizing the exact emotional state. After that, an ensemble classifier schema is presented, that combines the above classifiers in a majority schema. The goal of the ensemble schema is to increase the efficiency and the scalability in new facial expression data. The experimental study and the results show that the ensemble schema showed a performance increase of about 3.5% compared to the best individual classifier. In conclusion, the techniques proposed in this thesis extend the existing approaches in international literature, adding and introducing new methods for coping with the problems they are dealing with.
Appears in Collections:Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΔΔ)

Files in This Item:
File Description SizeFormat 
Perikos(com).pdf3.03 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons