Τμήμα Μαθηματικών (ΜΔΕ)
Permanent URI for this collection
Browse
Recent Submissions
- ItemOpen AccessΗ θεωρία της απόκρισης ερωτημάτων στη μηχανική μάθηση(2023-03-23)Στην παρούσα διπλωματική εργασία κατασκευάζουμε μια μέθοδο προεπεξεργασίας αριθμητικών δεδομένων, χρησιμοποιόντας την Ανάλυση Παραγόντων και την Θεωρία Απόκρισης Ερωτημάτων, ώστε να βελτιωθεί η απόδοση σε μοντέλα μηχανικής μάθησης. Αρχικά χρησιμοποιούμε την ανάλυση παραγόντων για να βρούμε τους κοινούς παράγοντες των αριθμητικών δεδομένων. ΄Επειτα εφαρμόζουμε τον αλγόριθμο K-Means ώστε να μετατρέψουμε τις αριθμητικές τιμές σε βαθμολογίες. Τέλος για κάθε παράγοντα εφαρμόζουμε την Θεωρία Απόκρισης Ερωτημάτων και εξάγουμε το σκορ σημαντικότητας του παράγοντα. Πιο συγκεκριμένα, στα πρώτα 2 κεφάλαια αναλύουμε τις στατιστικές μεθόδους καθώς και τα μοντέλα μηχανικής μάθησης που εφαρμόσαμε. Στη συνέχεια βλέπουμε το σετ δεδομένουν κόκκινου κρασιού που χρησιμοποιήθηκε και τον τρόπο εφαρμογής της μεθόδου που περιγράψαμε. Τέλος συκγρίνουμε τα αποτελέσματα 4 αλγόριθμων μηχανικής μάθησης για τα δεδομένα που επεξεργαστήκαμε με τα αρχικά, όπου παρατηρούμε την απόδοση της μεθόδου και εξάγουμε τα τελικά συμπεράσματα.
- ItemOpen AccessΠρόβλεψη ακροτάτου & εντοπισμός κρίσης χρονοσειράς(2023-02)Αντικείμενο έρευνας της παρούσας διπλωματικής είναι η χρήση αριθμητικων μεθόδων βελτιστοποίησης για την εξαγωγή σχέσης αιτιότητας μεταξύ παρελθοντικών και μελλοντικών καταστάσεων χρονοσειρών. Αξιοποιώντας τα διαθέσιμα δεδομένα για τον Ελληνικό Δείκτη Τιμών Καταναλωτή, εξετάζεται η εφαρμογή των δύο τεχνικών BackSDAS-2 και LIN Algorithm που προτάθηκαν από την Ε. Λισγάρα το 2011. Οι δύο μέθοδοι έρχονται να προσεγγίσουν συναρτησιακά τις χρονοσειρές με την πρώτη να επιζητά τοπική βελτιστοποίησή τους και την δεύτερη να ειδοποιεί έγκαιρα για πιθανές κρίσεις στον υπό εξέταση δείκτη. Συμπληρώνουν την υπάρχουσα βιβλιογραφία εστιάζοντας στην πρόβλεψη της χρονική στιγμής σχηματισμού ακροτάτων και δημιουργώντας, αντιστοίχως, ex-ante προβλέψεις μη φυσιολογικών περιόδων στα δεδομένα.
- ItemOpen AccessΜέθοδοι και λογισμικά επίλυσης του προβλήματος της ικανοποιησιμότητας (SAT solvers)(2023-03-20)Στη παρούσα διπλωματική εργασία θα δούμε την έννοια και τη σημασία του προβλήματος της Ικανοποιησιμότητας (επίσης γνωστό ως SAT). Το πρόβλημα της ικανοποιησιμότητας έχει αναπτυχθεί σε τέτοιο βαθμό που σήμερα σχεδόν ο καθένας μπορεί να το αξιοποιήσει για να λύσει διάφορα προβλήματα χρησιμοποιώντας έναν SAT Solver. Σε αυτό το σημείο, ο αναγνώστης θα μπορούσε κάλλιστα να αναρωτηθεί γιατί επιλέξαμε το πρόβλημα SAT και όχι κάποιο άλλο πρόβλημα που είναι εξίσου γνωστό στην Υπολογιστική Επιστήμη; Η απάντηση στο ερώτημα αυτό θα δοθεί στο δεύτερο κεφάλαιο της παρούσας διατριβής, όπου θα αναλύσουμε πώς το πρόβλημα SAT μπορεί να χρησιμοποιηθεί για την επίλυση καθημερινών προβλημάτων που συναντάμε σε πολλούς κλάδους. Αρχικά, θα αναλύσουμε τις ρίζες του προβλήματος ικανοποιησιμότητας και πώς εξελίχθηκε στο πρόβλημα ικανοποιησιμότητας που γνωρίζουμε σήμερα, καθώς και κάποιες πρώιμες εργασίες σχετικά με την εξέλιξη της επίλυσης του SAT. Έχει σημειωθεί μεγάλη πρόοδος μέχρι σήμερα, μεγάλο μέρος της οποίας οφείλεται στον ετήσιο διαγωνισμό SAT, ο οποίος επιβραβεύει τις καινοτομίες των συμμετεχόντων. Στο επόμενο κεφάλαιο θα παρουσιάσουμε την έννοια της Προτασιακής Λογικής, της Άλγεβρας Boole, των Κανονικών Μορφών (Norman Form) και τον τρόπο εργασίας με αυτές. Ένα άλλο μέρος αυτού του κεφαλαίου θα είναι η Unit Propagation και πώς εφαρμόζεται για την κατασκευή ενός βασικού αλγορίθμου επίλυσης SAT, καθώς και οι Μηχανές Turing και η Πολυπλοκότητα Χώρου και Χρόνου για να αποδείξουμε γιατί η εφαρμογή του SAT είναι τόσο χρήσιμη για την επίλυση προβλημάτων της πραγματικής ζωής. Στο τρίτο κεφάλαιο θα δούμε κάποιες ολοκληρωμένες αλγοριθμικές τεχνικές και πώς υλοποιείται η οπισθοδρόμηση (Backtracking) για την κατασκευή μιας κατηγορίας επιλυτών SAT. Στη συνέχεια, στο τέταρτο κεφάλαιο θα αναλύσουμε τις πιο δημοφιλείς αλγοριθμικές τεχνικές, τη διαδικασία Davis-Putnam, τη διαδικασία Davis-Putnam-Logemann-Loveland και τη Conflict-Driven-Clause-Learning, καθώς και ορισμένες ευρετικές τεχνικές διακλάδωσης. Στη συνέχεια θα συζητήσουμε για τον διαγωνισμό SAT και πώς, με βάση τα αποτελέσματά του, επιλέγουμε τον επιλύτη Kissat για να τον τροποποιήσουμε σε Pure Davis-Putnam Procedure και τους υπόλοιπους επιλύτες για να τους συγκρίνουμε μεταξύ τους. Τέλος, θα δούμε πώς συμπεριφέρονται οι διάφοροι επιλυτές όταν τους δίνεται ένας γενικός και στη συνέχεια ένας συγκεκριμένος τύπος (στιγμιότυπο) προς επίλυση, από τον οποίο θα μπορέσουμε να βγάλουμε κάποια συμπεράσματα.
- ItemOpen AccessΝευρωνικά δίκτυα γράφων και εφαρμογές(2023-03-01)Στα πλαίσια της ραγδαιας ανάπτυξης που έχει γνωρίσει το γνωστικό πεδίο της μηχανικής μάθησης τη τελευταία δεκαετία, αναδύθηκε ένα μοντέλο που έμελλε να την εφοδιάσει με πληθώρα νέων δυνατοτήτων: Τα νευρωνικά δίκτυα γράφων (ΝΔΓ). Μερικές από αυτές βρίσκουν εφαρμογή στα κοινωνικά δίκτυα,στη μοριακή βιολογία, τη χημεία, τη φυσική και άλλα επιστημονικά πεδία. Πιο συγκεκριμένα, στο πρώτο κεφάλαιο θα γίνει μία σύντομη εισαγωγή στις έννοιες της τεχνη- τής νοημοσύνης και της μηχανικής μάθησης. Στα πλαίσια αυτής της εισαγωγής, θα γίνει σύντομη ιστορική αναδρομή για την κατανόηση της πορείας της ανάπτυξης της τεχνητής νοημοσύνης, στα πλαίσια του επιστημονικού γίγνεσθαι του εικοστού αιώνα. Στο δεύτερο κεφάλαιο θα αναλυθεί η θεωρία γραφημάτων με όλους τους κανόνες που τη διέπουν. Αρχικά, με μια σύντομη παράθεση ιστορικών στοιχείων, και έπειτα υποδιαίρεση των γράφων σε κατηγορίες. Στο τρίτο κεφάλαιο πραγματοποιείται εμβάθυνση στα τεχνητά νευρωνικά δίκτυα (ΤΝΔ). Τα αίτια προέλευσης της ονοματοδοσίας του μοντέλου έχουν τις ρίζες τους από τη νευροεπιστήμη, και συγκεκριμένα από τη λειτουργια των βιολογικών νευρώνων την οποία προσομοιώνουν. Θα γίνει ανάλυση διαφορετικών μορφών αρχιτεκτονικών που μπορούν να έχουν καθώς και μεθόδους με τους οποίους μπορούν να εκπαιδευτούν αλλά και να αξιολογηθούν. Στο τέταρτο κεφάλαιο γίνεται περαιτέρω εμβάθυνση σε μία ειδική κατηγορία των ΤΝΔ και της γενικότερης βαθιά μάθησης, αυτη των συνελικτικών νευρωνικών δικτύων (CNN ). Εδώ, αφου δοθεί ο προαπαιτούμενος ορισμός της πράξης της συνέλιξης, θα γίνει εκτενής ανάλυση της αρχιτεκτονικής αυτών και των διαδικασιών που επιτελούνται σε κάθε επίπεδο λειτουργίας. Στο πέμπτο κεφάλαιο, γίνεται η δόμηση των νευρωνικών δικτύων γράφων. Αφού πρώτα αναλυ- θούν οι βασικές προσεγγίσεις αυτών, διερχόμαστε στην ειδική σημαντική υποκατηγορία τους, τα συνελικτικά νευρωνικά δίκτυα γράφων (GCN ). Παρουσιάζεται ο τρόπος με τον οποίο συνδυάζουν τα ΝΔΓ με τη πράξη της συνέλιξης, και αναφέρονται οι λόγοι για τους οποίους συνεισέφεραν ου- σιαστικά ως παραλλαγή των ΝΔΓ. Τέλος, γίνεται λόγος και για μειονεκτήματά τους, με βάση τα οποία εισήχθη το μοντέλο των δικτύων γράφων προσοχής (GAT) να επιλύσει. Στο έκτο κεφάλαιο, σημείο αναφοράς αποτελούν τα γενικά λειτουργικά πλαίσια (frameworks) στα οποία ενσωματώνονται τα διάφορα μοντέλα GNN . Στο έβδομο κεφάλαιο, γίνεται η πειραματική (πρακτική) διαδικασία όσων δομήθηκαν σε όλα τα προηγούμενα. Με χρήση της γλώσσας Python, και πιο συγκεκριμένα του framework μηχανικής μάθησης της JAX, προς επίτευξη συγκεκριμένων εργασιών επί κάποιων γνωστικών πεδίων. Αυτά αφορoύν κοινωνικά δίκτυα, συστήματα επιστημονικών αναφορών (citations) και βιολογία. Διαδο- χικά, θα γίνεται και σύγκριση των μεθόδων με δικαιολόγηση των αποτελεσμάτων μέσω μεθόδων εκτίμησης ακρίβειας κάθε μεθόδου. Τέλος, γίνεται σύνοψη όλων των προηγουμένων, παραγωγή γενικών συμπερασμάτων και μελ- λοντικών προκλήσεων για περαιτέρω έρευνα.
- ItemOpen AccessΕπεξεργασία φυσικής γλώσσας(2023-03-09)Τα μέσα κοινωνικής δικτύωσης δεν χρησιμοποιούνται πλέον μόνο ως εργαλείο επικοινωνίας από απόσταση, αλλά και ως πλατφόρμα που μπορείς να μοιράζεσαι και να ανταλλάζεις πληροφορίες. Ένα από τα μέσα κοινωνικής δικτύωσης είναι και το twitter, το οποίο είναι μια διαδικτυακή πλατφόρμα ενημέρωσης. Τα τρέχοντα θέματα στο twitter περιέχουν σχόλια από τα οποία μπορούμε να αντλήσουμε τεράστια πληροφορία. Η παρούσα διπλωματική εργασία, λοιπόν, ασχολείται με τον κλάδο της τεχνητής νοημοσύνης που χρησιμοποιείται για την κατανόηση και τον χειρισμό κειμένου ή ομιλίας φυσικής γλώσσας, αυτόν της Επεξεργασία Φυσικής Γλώσσας (Natural Language Processing - NLP). Η κατανόηση των πολύπλοκων δομών στη γλώσσα και η απόκτηση γνώσεων από αυτήν είναι ζωτικής σημασίας στην ανάπτυξη της τεχνητής νοημοσύνης. Οι εφαρμογές της Επεξεργασίας Φυσικής Γλώσσας περιλαμβάνουν τη μετάφραση, την ανάλυση συναισθημάτων, τις εφαρμογές αναζήτησης ιστού, την αυτοματοποίηση εξυπηρέτησης πελατών, την ταξινόμηση κειμένων, τον εντοπισμό θεμάτων σε ένα κείμενο, τη μοντελοποίηση γλώσσας και ούτω καθεξής. Η σημασιολογική ανάλυση της διπλωματικής επικεντρώνεται στην ανάλυση κείμενου, η οποία απεικονίζεται με παραδείγματα και επεξεργάζεται με το λογισμικό Orange. Το λογισμικό Orange στην παρούσα ανάλυση, χρησιμοποιείται για τον χειρισμό κειμένων και συμβολοσειρών, τον μετασχηματισμό τους με διάφορες μεθόδους και την ανάλυσή τους με επιβλεπόμενες και μη επιβλεπόμενες στατιστικές μεθόδους και μεθόδους μηχανικής μάθησης. Το πρώτο βήμα της διπλωματικής εργασίας είναι η εξόρυξη δεδομένων μέσω του λογισμικού Orange Data Mining και η προ-επεξεργασία του κειμένου. Το στάδιο αυτό περιλαμβάνει τον μετασχηματισμό, την τυποποίηση, την κανονικοποίηση και το φιλτράρισμα που αποσκοπεί στο να καταστεί το κείμενο δυνατό να αναλυθεί. Στη συνέχεια, μέσω της ανάλυσης συναισθήματος και με την χρήση δύo μεθόδων μοντελοποίησης θεμάτων (Ανάλυση Λανθάνουσας Σημασιολογίας και Λανθάνουσα Κατανομή Dirichlet) στο twitter, μπορούμε να κατανοήσουμε πώς οι άνθρωποι περιγράφουν και εκφράζουν τις αντιλήψεις τους για ένα θέμα. Οι αντιλήψεις τους για τα θέματα που θα συζητηθούν θα χαρακτηριστούν ως θετικές, αρνητικές και ουδέτερες. Η ανάλυση αυτή είναι σημαντική για να διαπιστωθεί ο βαθμός στον οποίο τα μέσα κοινωνικής δικτύωσης, όπως το twitter, χρησιμοποιούνται σήμερα από το κοινό ως μέσο διάδοσης δημόσιων πληροφοριών. Τέλος, πραγματοποιείται μια ανάλυση σε δεδομένα tweets, ώστε να ανιχνευτεί η χρήση προσβλητικών σχολίων και κάθε άλλης μορφής έκφρασης που διαδίδει, υποκινεί, προωθεί ή δικαιολογεί το ρατσιστικό μίσος, την ξενοφοβία, τον αντισημιτισμό ή άλλες μορφές μίσους σε ένα κείμενο.