Search Results

Now showing 1 - 7 of 7
  • Thumbnail Image
    Item
    Εφαρμογή τεχνικών εξόρυξης γνώσης από ιατρικά δεδομένα
    (Πανεπιστήμιο Πατρών, 2022) ΒΟΡΥΛΛΑ, ΜΑΡΙΑ Α.Μ.16347; ΚΑΡΙΩΤΑΚΗΣ, ΔΗΜΗΤΡΙΟΣ Α.Μ.16383; Γιωτόπουλος, Κωνσταντίνος
    Τμήμα Διοικητικής Επιστήμης και Τεχνολογίας (ΔΕ)
    Η εξόρυξη δεδομένων έχει πάρα πολλές πτυχές, οι οποίες δεν γίνεται να αποτυπωθούν σε μία και μόνο εργασία. Ο βασικός μας σκοπός σ’ αυτή την εργασία είναι να μπορέσει ένας αρχάριος να ενημερωθεί, όσο το δυνατόν πιο εύκολα και κατανοητά, για βασικές λειτουργίες της εξόρυξης δεδομένων μέσα από παραδείγματα πάνω σε ένα συγκεκριμένο σύνολο δεδομένων. Το σύνολο των δεδομένων που θα χρησιμοποιηθεί στην παρούσα εργασία είναι ιατρικά δεδομένα και σχετίζονται με την νόσο του θυρεοειδή. Στα επόμενα κεφάλαια θα ενημερωθείτε για πιο γενικούς όρους που σχετίζονται με την εξόρυξη, για προγράμματα εξόρυξης δεδομένων, για την εγκατάσταση αυτών, αναλόγως με το λογισμικό που έχει ο ηλεκτρονικό σας υπολογιστής, αλλά και για τις πληροφορίες που εξάγαμε, βήμα προς βήμα, για τη νόσο του θυρεοειδή, αναλύοντας ‘τες μία προς μία.
  • Thumbnail Image
    Item
    Χρήση τεχνικών μηχανικής μάθησης στην αποκάλυψη γνώσης σε ιατρικά δεδομένα
    (Πανεπιστήμιο Πατρών, 2020) Σαβόσκιν, Κορίνα Α.Μ.16271; Τούρκου, Πάολα Α.Μ.16290; Περίκος, Ισίδωρος
    Τμήμα Διοικητικής Επιστήμης και Τεχνολογίας (ΔΕ)
    Αποδίδοντας την περίληψη της πτυχιακής με λίγα λόγια, αναλύεται σε πρώτο στάδιο τα βασικά δεδομένα και στοιχεία που περιλαμβάνουν τα πληροφοριακά συστήματα. Είναι δεδομένα κατηγοριοποιημένα με τέτοιο τρόπο ώστε να είναι ευανάγνωστα απο τον αναγνώστη. Πραγματοποιείται αναφορά κύριος στα πληροφορικά σύστηματα βασικού επιπέδου αλλά και επιστημονικού αφού μετέπειτα γίνεται ανάλυση σε πραγματικά δεδομένα. Προς το τέλος της πτυχιακής γίνεται αναφορά στην πράξη, με την βοήθεια προγράμματος επεξεργασίας δεδομένων όπου αποδίδεται το σχετικό αποτέλεσμα που αποκτήθηκε από ερωτηματολόγια. Η επεξεργασία δεδομένων στο βασικό μας πρόγραμμα WEKA γίνεται με την χρήση δέντρων αποφάσεων και αλγορίθμων που μας βοηθούν στην καταγραφή των συμπερασμάτων. Τα δεδομένα που αναλύονται αφορούν ιατρικά δεδομένα και μιλώντας συγκεκριμένα, αποτελούν δεδομένα του καρκίνου του μαστού που εμφανίζεται σε γυναίκες.
  • Thumbnail Image
    Item
    Λογισμικά μηχανικής μάθησης και εξόρυξη δεδομένων - Μελέτη περίπτωσης ΚΝΙΜΕ
    (Πανεπιστήμιο Πατρών, 2022) ΙΩΑΝΝΟΥ, ΑΡΙΣΤΕΙΔΗΣ Α.Μ.15102; ΦΑΖΑΚΗΣ, ΝΙΚΟΛΑΟΣ Α.Μ.15327; Γαρμπής, Αριστογιάννης
    Τμήμα Διοικητικής Επιστήμης και Τεχνολογίας (ΔΕ)
    Στην σημερινή εποχή που ζούμε η τεχνολογία έχει εισβάλει για τα καλά μέσα στην ζωή μας, και ψάχνουμε συνέχεια νέους τρόπους για να την διευκολύνουμε. Ένας τρόπος είναι η δημιουργία μίας διαδικτυακής βάσης που θα μπορεί να επεξεργάζεται τον όγκο δεδομένων που υπάρχουν στο διαδίκτυο , να τα αποθηκεύει και να μας δίνει στατιστικές για μία συγκεκριμένη περίοδο ή ακόμα, να αναλύει κάθε είδους πληροφορία και να τις διαχωρίζει, κρατώντας μόνο τις πιο σημαντικές. Σε αυτή την εργασία θα δημιουργήσουμε μια πλατφόρμα που θα μας βοηθήσει να κάνουμε ακριβός αυτό η οποία ονομάζεται “μηχανική μάθηση και επεξεργασία δεδομένων ”. Στην προσπάθεια μας αυτή να αναλύσουμε και να εξετάσουμε τι είναι η εξόρυξη δεδομένων και η μηχανική μάθηση, ανατρέξαμε στο διαδίκτυο ( Google, Youtube, κ.τ.λ) ανακαλύπτοντας τον τρόπο λειτουργία τους, να καταλάβουμε το λόγο της δημιουργίας τους και τα σημεία που ίσως υστερούν. Ειδικότερα, κατεβάσαμε το πρόγραμμα ΚΝΙΜΕ αναλύοντας της ποιο σημαντικές ροές δεδομένων και όλες τις μεταβλητές που μπορούν να χρησιμοποιήσουν οι χρήστες. Στην συνέχεια διερευνήσαμε 2 άλλα παρόμοια προγράμματα WEKA & RapidMiner όπου αναφέρουμε αναλυτικά τα χαρακτηριστικά τους.
  • Thumbnail Image
    Item
    Τεχνικές μηχανικής μάθησης για την ανάλυση συναισθημάτων σε κείμενο
    (Πανεπιστήμιο Πατρών, 2022) ΜΠΑΣΤΑΣ, ΚΩΝΣΤΑΝΤΙΝΟΣ Α.Μ.14466; Ρήγκου, Μαρία
    Τμήμα Διοικητικής Επιστήμης και Τεχνολογίας (ΔΕ)
    Στο πλαίσιο του ολοένα και περισσότερο δικτυωμένου κόσμου, η Μηχανική Μάθηση έχει αποδείξει ότι μπορεί λύσει περίπλοκα προβλήματα με αποδοτικό τρόπο σε ευρύ πεδίο εφαρμογών. Σε αυτήν την εργασία θα επικεντρωθούμε στην ανάπτυξη αποδοτικότερων μοντέλων Μηχανικής Μάθησης στην Ανάλυση Συναισθήματος σε κείμενο, ένας τομέας της τεχνικής Νοημοσύνης που προσπαθεί να εξάγει υποκειμενικές πληροφορίες, όπως απόψεις ή στάσεις βάσει γλωσσολογικών χαρακτηριστικών σε ένα κείμενο. Στο πρώτο κεφάλαιο γίνεται αναφορά στην Μηχανική Μάθηση, στην ανάλυση συναισθήματος σε κείμενο καθώς και στις κύριες κατηγορίες της. Tα επόμενα κεφάλαια έχουν μορφή οδηγού και παρουσιάζονται μοντέλα Μηχανικής Μάθησης που είναι ευρέως τα πιο γνωστά για την αποδοτικότητα τους στον τομέα της Ανάλυσης συναισθήματος και τα οποία υλοποιούνται με την γλώσσα προγραμματισμού Python και την βιβλιοθήκη Pytorch. Τέλος, χρησιμοποιούμε την cloud υπηρεσία Google Colaboratory για την εκπαίδευση των μοντέλων ενώ αναπτύχθηκε ιστοσελίδα που αποτυπώνετε η εργασία.
  • Thumbnail Image
    Item
    Εφαρμογή και σύγκριση αλγορίθμων επιβλεπόμενης μηχανικής μάθησης σε διαφορετικές μελέτες περίπτωσης.
    (Πανεπιστήμιο Πατρών, 2021) ΚΟΥΤΡΑΣ, ΚΩΝΣΤΑΝΤΙΝΟΣ Α.Μ.16658; Γαρμπής, Αριστογιάννης
    Τμήμα Διοικητικής Επιστήμης και Τεχνολογίας (ΔΕ)
    Τα τελευταία χρόνια και σε παγκόσμιο επίπεδο, σε μια κοινωνία ολοένα εξελισσόμενη στην έννοια της πληροφορίας, παρατηρείται μια σημαντική αύξηση στην εφαρμογή «ευφυιών» προγραμμάτων σε υπολογιστικά συστήματα. Όλα αυτά τα προγράμματα περιέχουν ένα υποθετικό βαθμό «αντίληψης», καθιστώντας τα ικανά να προσομοιάσουν τον ανθρώπινο τρόπο σκέψης στην τεχνολογική «εφαρμογή» του, ταξινομώντας, προβλέποντας και διακρίνοντας γεγονότα του πραγματικού κόσμου, με έναν πολύ γρήγορο και διεξοδικό τρόπο. Όλες αυτές οι τεχνολογίες εμπίπτουν στο πεδίο της «Μηχανικής Μάθησης». Ο συγκεκριμένος τεχνολογικός τομέας, εμπλέκει διάφορες προσεγγίσεις και μεθοδολογίες που περιέχονται τόσο στον τομέα της πληροφορικής, όσο και στους τομείς της εξόρυξης πληροφορίας και της στατιστικής. Η βασική ιδέα της μηχανικής μάθησης, αφορά στην κατασκευή προγραμμάτων υπολογιστών που θα είναι σε θέση να επιτελούν διάφορες αυτοματοποιημένες εργασίες, βάσει εμπειρικών καταστάσεων και δεδομένων, που έχουν ήδη «αντικρίσει». Αυτή η προσέγγιση για την δημιουργία τέτοιων προγραμμάτων, αναφέρεται και ως «επιβλεπόμενη μάθηση». Ωστόσο, για να επιτευχθεί αυτό, γίνεται χρήση διαφόρων αλγοριθμικών τεχνικών που έχουν ως βάση την ανακάλυψη γνώσης από σύνολα δεδομένων. Στην παρούσα Πτυχιακή Εργασία, πραγματοποιείται μια διεξοδική ανάλυση των στοιχείων εκείνων που συντελούν, αυτό το ευρύ πεδίο της μηχανικής μάθησης. Επιπροσθέτως, στο πλαίσιο της παρούσας εργασίας, γίνεται παρουσίαση τριών μελετών περιπτώσεων που πραγματοποιήθηκαν με τεχνικές και μεθόδους του πεδίου αυτού της μηχανικής μάθησης που θα μελετηθεί. Σκοπός της εργασίας αυτής, αποτελεί η λεπτομερής ανασκόπηση όλων των μεταβλητών αυτών που απαρτίζουν το θεωρητικό μέρος της ανάπτυξης προγραμμάτων μηχανικής μάθησης με επιβλεπόμενο κυρίως τρόπο και, η εύρεση των καλύτερων αλγοριθμικών τεχνικών στις τρείς αυτές μελέτες περίπτωσης, κάνοντας χρήση διαφόρων μεθοδολογιών και προσεγγίσεων.
  • Thumbnail Image
    Item
    Αναγνώριση φωνητικών εντολών με τεχνικές βαθιάς μηχανικής μάθησης
    (2022-09-22) Δημητρούκα, Γιαννούλα; Dimitrouka, Giannoula
    Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΔΕ)
    Η πραγματικά μεγάλη αύξηση του όγκου πληροφοριών στον παγκόσμιο ιστό την τελευταία δεκαετία αποτελεί γεγονός, το οποίο σαφώς και είναι άμεσα συνδεδεμένο με την αλματώδη εξέλιξη της τεχνολογίας. Υπέρογκος αριθμός δεδομένων αποθηκεύονται σε βάσεις δεδομένων. Για το λόγο αυτό, αυξήθηκε η ανάγκη ανακάλυψης και εξαγωγής γνώσης από τα δεδομένα αυτά που θα πραγματοποιείται αυτόματα με μεθόδους Μηχανικής Μάθησης και Βαθιάς Μάθησης. Στην παρούσα εργασία θα επικεντρωθούμε σε ένα επιμέρους πεδίο έρευνας της Βαθιάς Μάθησης, αυτό της αναγνώριση ομιλίας. Σκοπός της διπλωματικής είναι να λυθεί το πρόβλημα κατηγοριοποίησης πολλαπλών κλάσεων χρησιμοποιώντας δεδομένα ήχου. Αρχικά, γίνεται αναφορά μεθόδων κατηγοριοποίησης, όπως για παράδειγμα, η Μηχανή Υπο-στήριξης Διανυσμάτων, ο Τυχαίο Δάσος, ο Δένδρο Απόφασης, ο Κ-Πλησιέστερος Γείτονες και ο Αφελής Μπεϋζιανός Ταξινομητής. Επιπλέον, αναλύονται εκτενώς, τα Τεχνητά νευρωνικά δίκτυα και οι αρχιτεκτονικές τους. Στο πλαίσιο της πειραματικής διαδικασίας, τα δεδομένα που χρησιμοποιούνται, περιορίζονται σε ένα σύνολο δεδομένων τριάντα πέντε κλάσεων, οι οποίες περιλαμβάνουν χιλιάδες ηχητικά αρχεία. Για να πετύχουμε τον σκοπό της διπλωματικής, στο σύνολο αυτό, γίνεται προεπεξεργασία των δεδομένων και ανάπτυξη μοντέλων που είναι σε θέση να κατηγοριοποιούν σύνολα δεδομένων φωνητικών εντολών, χρησιμοποιώ-ντας βιβλιοθήκες της Python, όπως (Matplotlib, TensorFlow, Pandas, NumPy, Scikit-learn). Τέλος, έχει πραγματοποιηθεί μια εκτενής ανάλυση που καταδεικνύει την απόδοσή και την ακρίβειά τους.
  • Thumbnail Image
    Item
    Τεχνικές επεξεργασίας ροών δεδομένων μεγάλου όγκου με χρήση Apache Spark
    (2022-09) Μαγειράκος, Βασίλειος; Mageirakos, Vasileios
    Τμήμα Ηλεκτρολ. Μηχαν. και Τεχνολ. Υπολογ. (ΔΕ)
    Τα τελευταία χρόνια ο όγκος, η ποικιλία και η ταχύτητα συνεχόμενων ροών δεδομένων, αυξάνονται με πρωτοφανή ρυθμό. Αυτό έχει ωθήσει ερευνητές και έμπειρους μηχανικούς, στην δημιουργία πολλών νέων συστημάτων και τεχνικών επεξεργασίας ροών δεδομένων. Ως αποτέλεσμα, η πιθανή προστιθέμενη αξία για τις επιχειρήσεις που μπορούν να τα αξιοποιήσουν είναι τεράστια. Συνεπώς, υπάρχει αντίστοιχα μεγάλη ανάγκη εκπαίδευσης όλο και περισσότερων νεών μηχανικών, οι οποίοι κατανοούν και μπορούν να χρησιμοποιήσουν αυτά τα εργαλεία. Η συσταδοποίηση ροών είναι ένα από τα πιο σημαντικά προβλήματα που αντιμετωπίζουν οι επιχειρήσεις, καθώς χρησιμοποιείται για την εύρεση μοτίβων σε συνεχώς εξελισσόμενα δεδομένα πραγματικού χρόνου. Όμως, η υλοποίηση πολύπλοκων αλγορίθμων μηχανικής μάθησης και εξόρυξης δεδομένων είναι πολύ πιο δύσκολη όταν γίνεται σε ροές. Βασικοί λόγοι είναι η ανάγκη απόκρισης σε πραγματικό χρόνο, ο περιορισμένος αποθηκευτικός χώρος και ότι κάθε στοιχείο από τα δεδομένα επεξεργάζεται μόνο μια φορά. Συνεπώς, ένας νέος μηχανικός θα πρέπει (α) να κατανοεί την σχετική δύσκολη θεωρία, και (β) να μάθει την μυριάδα πολύπλοκων συστημάτων που χρησιμοποιούνται για την επίλυση του προβλήματος. Πιστεύουμε πως ο καλύτερος και ταχύτερος τρόπος για νέους μηχανικούς να εντρυφούν με τον συγκεκριμένο τομέα, είναι η άμεση ενασχόληση τους με ένα πλήρες σύστημα που επιτρέπει τον πειραματισμό. Για αυτόν τον λόγο, υλοποιούμε ένα ολοκληρωμένο προγραμματιστικό πλαίσιο για κατανεμημένη συσταδοποίηση ροών δεδομένων. Το βασικό σχεδιαστικό κριτήριο είναι η μείωση της πολυπλοκότητας και ανομοιογένειας της αρχιτεκτονικής, χωρίς να παραβλέψουμε βασικές εγγυήσεις που αυτό πρέπει να προσφέρει (συνοχή δεδομένων, ανοχή σε σφάλματα κ.α.). Για αυτό, επιλέγουμε η υλοποίηση να γίνει στην Python με χρήση των Apache Spark και Kafka. Το προγραμματιστικό πλαίσιο παρέχει στον νέο μηχανικό όλα τα εργαλεία που χρειάζεται, όπως η αυτόματη δημιουργία κατανεμημένου περιβάλλοντος, συνθετικών δεδομένων ροής οποιασδήποτε μορφής, δυναμική παρακολούθηση της συσταδοποίησης, οπτικοποίηση των αποτελεσμάτων και σύγκριση με διαφορετικούς αλγορίθμους συσταδοποίησης ροών. Χρησιμοποιώντας το προτεινόμενο προγραμματιστικό πλαίσιο, προσφέρουμε επίσης refactored υλοποίηση του DistStream/DenStream [4, 15] σε Python. Στον έλεγχο μας, παρά το εκτενές σύνολο βιβλιοθηκών που προσφέρει η Python, δεν βρήκαμε να υπάρχει κανένα αντίστοιχο εργαλείο που να επιτρέπει την ποιοτική κατανεμημένη συσταδοποίηση ροών δεδομένων μεγάλου όγκου. Επομένως, επιλέξαμε να υλοποιήσουμε τον DistStream/DenStream, επειδή σύμφωνα με τη βιβλιογραφία παράγει υψηλής ποιότητας συσταδοποίηση και μεγαλύτερη επεκτασιμότητα, σε σύγκριση με άλλους αλγορίθμους. Παρουσιάζουμε σύγκριση της υλοποίησης μας, ως προς την ποιότητα συσταδοποίησης και την ικανότητα διαχείρισης μεταβαλλόμενων κατανομών, με τους πιο δημοφιλείς αλγορίθμους που είναι αυτήν την στιγμή διαθέσιμοι στην Python. Συγκεκριμένα, τους CluStream [1] και Stream-Kmeans [11, 51] του πακέτου μηχανικής μάθησης σε ροές River [40]. Επίσης, καθώς οι αλγόριθμοι που προσφέρονται στην Python δεν λειτουργούν σε κατανεμημένα περιβάλλοντα, επιλέγουμε να συγκρίνουμε, ως προς την επεκτασιμότητα, την refactored σε Python υλοποίηση μας, με την υπάρχουσα σε Scala υλοποίηση του DistStream/DenStream.